最近よく耳にするかもしれませんが、LLMは「Large Language Model」の略で、大規模言語モデルを指します。これは膨大なインターネット上のテキストデータを学習し、文の次の単語を予測する数学モデルです。たとえば、「怠惰な後の速い茶色の狐が跳ぶ」という文を入力すると、LLMは「犬」という単語を正確には予測できないものの、複数の可能性を提示してくれます。
LLMが特に注目される理由の一つは、膨大な量のデータと複雑な構造を持ち、それにGPUやトランスフォーマーといった、大量の計算処理を可能にする技術を使用しているからです。GPUはグラフィック分野で広く用いられるプロセッサですが、これを使うことで多数の計算を並行して実行でき、言語モデルの訓練に革命をもたらしました。
LLMを活用したAI製品は、英語からスペイン語への翻訳、文書の要約、質問に対するチャットボットの応答など、さまざまなタスクを簡単に実行できるようになりました。たとえば、マルチメディアサービスなどで、瞬時に情報を提供してくれるAIに触れたことがあるかもしれません。
この技術はまだその初期段階にあり、多岐にわたる応用分野が開発されています。たとえば、ゲノムを解析してDNAの働きを理解するのにも利用され始めています。将来、LLMがもたらす変化には目が離せません。
出典 : Large Language Models: A Short Introduction https://towardsdatascience.com/large-language-models-a-short-introduction-bb8366118ad0