現在、大規模言語モデル(LLM)を用いて、自然言語で質問し、データからの回答を得る「データ対話」という技術が進展しています。例えば、気候変動に備えるための支援など、Open AIアシスタントを利用した事例があります。しかし、このアプローチには、データベースやAPIを介してデータを取得する方法など、いくつかの限界が存在します。SQLのような言語で集約クエリを行うことは可能ですが、データがまだデータベースにない場合には、追加の処理が必要です。
また、LLMを介して直接データを渡す方法はスケールしにくく、現実世界での大量データ使用ではコストがかかりすぎることもあります。さらに、コード生成による分析は、デバッグを伴う反復プロセスにより、時間とコストがかかることが判明しています。
これらの課題に対処する方法として、「データレシピ」という新しい手法が提案されています。これは、再利用可能なデータやコードのスニペットを提供し、LLMを会話形式でプログラムして、透明性を確保しながら、データアクセスと洞察の生成を強化します。データレシピハブを通じて、コミュニティの貢献を促す可能性も秘めています。
出典 : https://medium.com/towards-data-science/reframing-llm-chat-with-data-introducing-llm-assisted-data-recipes-f4096ac8c44b