次世代AIモデルDeepSeek-R1、トップクラスの推論能力を実現

2025.02.05

WorkWonders

DeepSeek社が開発した最先端のAIモデル「DeepSeek-R1」がオープンソースで公開されました。このモデルは、強化学習(RL)を用いて推論能力を高めたもので、OpenAIのo1モデルと同等の性能を複数のベンチマークで実証しました。
DeepSeek-R1は専門家の混在モデル「DeepSeek-V3」をベースにしており、RLの一種である集団相対ポリシー最適化(GRPO)を用いてさらに微調整されています。リサーチチームは、このモデルを使ってQwenやLlamaなどのモデルに知識を移植し、これらのモデルも数学やコーディングのベンチマークで大規模なモデルをしのぐ性能を発揮します。
また、DeepSeek-R1は、AIME 2024やMATH-500といった難易度の高いベンチマークでも他のモデルを凌ぐ結果を示しています。このAIモデルを用いれば、コーディングや数学問題において、これまで以上に効率よく、複雑な思考が可能になるかもしれません。
DeepSeek-R1の詳細はHuggingFaceで入手可能です。

出典 : DeepSeek Open-Sources DeepSeek-R1 LLM with Performance Comparable to OpenAI’s o1 Model https://www.infoq.com/news/2025/02/deepseek-r1-release/

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください

↓10秒で登録できます。↓