OpenAIが2022年にChatGPTをリリースして以来、GoogleやMicrosoftなどが追随し、新しいAIチャットボットが次々に開発されています。
これらはすべて、大量のテキストデータから学習する「LLM(Large Language Model)」、つまり大規模言語モデルによって動かされています。
たとえば、OpenAIは2019年にGPT-2を1.5億のパラメーターでトレーニングしましたが、2020年にはGPT-3をはるかに大きな1750億のパラメーターで発表しました。
LLMは文章や詩、コードの生成、翻訳、要約など、多様なテキスト処理タスクをこなすことができます。
さらに、トランスフォーマーアーキテクチャという技術をベースにして、これまで以上に高速で効率的なトレーニングが可能になりました。
AIはますます進化しつつあり、将来はAIがより高度な作業を代行する時代が来るかもしれません。
しかし、人間を超えるAI、「AGI」を実現するにはまだブレイクスルーが必要です。
新世代のLLMがいかに進化し、我々の未来を変えるのか、非常に楽しみです。
出典 : https://beebom.com/what-is-large-language-model-llm/