これからRetrieval-Augmented Generation(RAG)システムについて紹介します。
RAGとは、外部のデータを基に質問に答えるための技術であり、設計には様々な決断が必要です。
たとえばLamaIndexやLangChainのようなツールを使えば、RAGベースの大規模言語モデル(LLM)を容易に構築可能です。
しかし、効率良く、スケーラブルなシステムを確立するためには工程的な努力が不可欠です。
本記事では、パフォーマンスやコストに影響する重要なデザイン選択に焦点を当てて語ります。
さらにRAGの主要な5つの構成要素についても解説し、各々の意味するところや得られるリソースについても触れます。
チャットボット技術の未来を一緒に学びましょう。
出典 : https://towardsdatascience.com/designing-rags-dbb9a7c1d729