中国の新興企業DeepSeekが開発した、大型言語モデル「DeepSeek V3」が、AI業界に大きな話題を呼んでいます。
このモデルは、経験豊富なメタプラットフォームズなどのライバルよりも優れた性能をベンチマークテストで示しました。
DeepSeek V3は、6710億パラメータを有し、約2カ月でUS$5.58百万のコストをかけて訓練されましたが、これは大手技術企業によって開発されたモデルに比べてかなり少ない計算リソースを使用しているとのことです。
ローコストながらも複雑なデータパターンに適応し、正確な予測ができるとされ、AI界での技術発展を牽引しています。
同モデルについて、OpenAIの創設チームメンバーであるアンドレイ・カルパシー氏がSNSで、「DeepSeekは驚くほど簡単に前代未聞のレベルのLLMを低予算で訓練した」と賞賛のコメントを寄せています。
出典 : Chinese start-up DeepSeek’s new AI model outperforms Meta, OpenAI products https://www.scmp.com/tech/tech-trends/article/3292507/chinese-start-deepseek-launches-ai-model-outperforms-meta-openai-products