新時代のAI競争!最新LLMリーダーボードの衝撃

2024.06.29

WorkWonders

Hugging Faceが新たな大規模言語モデル(LLM)のリーダーボードを発表しました。
このリーダーボードでは、さまざまなタスクでLLMのパフォーマンスをより厳しい基準で評価しています。AlibabaのQwenモデルがトップ10内で3つのスポットを獲得し、優位性を示しています。
リーダーボードのトップに立つのは、AlibabaのLLM、Qwenで、複数のバリアントが1位、3位、そして10位を占めています。
他にもMetaのLLMや小規模なオープンソースプロジェクトが、大勢を押しのけて名を連ねています。
注目すべきは、独自のモデルを試験しやすくするため、公開されていないモデルは除外されており、ChatGPTのようなモデルはリストに含まれていない点です。
誰もが自由に新しいモデルを提出し、リーダーボードでのテストと採用を目指すことができるオープンな取り組みが行われています。
その結果、実際の世界でのパフォーマンスが劣化する傾向にあるにも関わらず、絶えず改善され、最適化されています。
GoogleのAI回答が示すように、真の「知能」はまだまだ遠い未来のことかもしれません。
この記事は今後のAI開発の方向性や競争に大きな光を当てており、高校生にもわかりやすい内容となっています。

出典 : https://www.tomshardware.com/tech-industry/artificial-intelligence/chinese-llms-storm-hugging-faces-chatbot-benchmark-leaderboard-alibaba-runs-the-board-as-major-us-competitors-have-worsened

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダース社は、生成AIの活用・導入について客観的な立場からご相談に応じています。

生成AIに関するご相談はこちらからご連絡ください。 当社のご支援実績はこちらからご確認ください。