中国のAI企業・DeepSeekが開発した「DeepSeek-V3」は、驚異的な6710億個のパラメーターをもつ大規模言語モデルです。このモデルは2024年末にリリースされ、従来のモデル「Llama 3.1 405B」の持つ記録を塗り替え、AI業界に新たな歴史を刻みました。
DeepSeek-V3は計算効率と処理性能の両立を実現するMixture of Expertsアーキテクチャを採用し、必要なパラメーターのみを活性化して作業を行います。この新技術により、生成速度が前モデルの3倍にも及ぶ毎秒60トークンを誇ります。
さらに、DeepSeek-V3はプログラミングや数学、中国語処理などの分野で卓越した性能を示し、他モデルと同等以上のベンチマークスコアを達成。オープンソース化されているため、そのソースコードはGitHubから自由に入手可能です。この革新的AIは、研究者や開発者に新たな可能性をもたらすことでしょう。
出典 : 中国のAI企業・DeepSeekがGPT-4oに匹敵するAIモデル「DeepSeek-V3」をリリース、パラメーター数は脅威の6710億個|au Webポータル https://article.auone.jp/detail/1/3/7/48_7_r_20241227_1735275632855706