中国のスタートアップDeepSeekが、シリコンバレーに衝撃を与えた速さと効率で大規模言語モデル(LLMs)の訓練を進めています。Alibabaは新しいフロンティアモデル「Qwen 2.5 Max」を発表し、アメリカのトップモデルを凌駕すると主張しています。
Qwen 2.5 Maxは、ウェブ検索やテキスト、ビデオ、画像を出力する能力を持ち、OpenAIのGPT-4oなどを上回るパフォーマンスを見せたと言われています。
しかし、モデルの質とコストの詳細は公開されておらず、パラメータの大きさやトレーニングに用いたデータ量なども不明なままです。
この発表にも関わらず、アリババのAI開発への西側の取り組みが、米国のAIに対するリードを縮めることはできていないという認識を燃料にしています。
多額の資金を要求するシリコンバレーの姿勢に疑問を投げかける声も上がっています。
なお、Qwen 2.5 Maxに関する情報はアリババのサーバーを通じてのみアクセス可能で、DeepSeekのように汎用ダウンロードは行われていません。
プライバシーや検閲に関する懸念も指摘されており、中国製モデルが特定の政治的話題については情報を省略したり、回答を拒否することがあります。
出典 : DeepSeek not the only Chinese AI dev keeping US up at night https://www.theregister.com/2025/01/30/alibaba_qwen_ai/