中国のAIスタートアップDeepSeekと清華大学の研究チームが、新しいAI技術を共同開発しました。
この技術は、生成的報酬モデリング(GRM)と自己原理批判チューニング(SPCT)を採用し、AIの推論能力を大幅に向上するとされています。
特に、具体的かつ明瞭な「報酬」の設定を通して様々な問題に柔軟に対応し、推論時間の短縮を実現するための技術です。
これまでにDeepSeekは推論モデル「DeepSeek-R1」によって注目を集め、次のモデル「DeepSeek-R2」の発表予定が2025年5月とされています。
さらに、このモデルを使ったテストで、いくつかのベンチマークにおいて優れた成績を収めたことも明らかにされています。
新しいモデルはオープンソース化される予定で、API利用料が最大75%割引されるなど、さらなる発展が期待されます。
出典 : DeepSeekと清華大学の研究者がLLMの推論能力を強化する新しい手法を発表 https://gigazine.net/news/20250407-deepseek-grm-spct/