中国のAIスタートアップDeepSeekが開発した「DeepSeek-V3」は、商用の超大規模言語モデルに匹敵する性能を持ちながら、驚異の低コストで開発されました。
このモデルは671Bパラメータを備え、効率的な学習と高速生成を可能にする技術革新を数多く実装しています。
数学やプログラミング、中国語処理などの分野で秀でた結果を残し、特に数学では他モデルを大きく上回る90.2%というスコアを達成しました。
DeepSeek-V3は、品質に優れたデータセットによる事前学習と複数段階にわたるコンテキスト長拡張により、人間の選好に合った調整を施しています。
効率化とコスト削減を実現したDeepSeek-V3の登場は、今後のAI開発の方向性を示唆しており、そのポテンシャルに注目が集まっています。
出典 : 中国DeepSeek、GPT-4に迫る大規模言語モデル「DeepSeek-V3」をオープンソースで公開 https://xenospectrum.com/chinas-deepseek-releases-deepseek-v3-a-large-scale-language-model-approaching-gpt-4-as-open-source/