NVIDIAは新しい大規模言語モデル「Nemotron-4 340B」を公開しました。
このモデルは、AIが読解力を身につけるトレーニングに使われる合成データを生成に特化しています。
合成データとは、実際のデータを模倣して作られるもので、プライバシーの問題やデータ不足解消のために注目されています。
「Nemotron-4 340B」は、データ生成、指示に応じた生成、生成データの評価といったプロセスで構成され、品質の高いデータ作りを可能にしています。
これによって効率的なAIのトレーニングが実現され、精度の向上が期待されます。
特に、高性能を誇る「Rewardモデル」は、合成データの品質管理において優れた能力を示しています。
また、「NVIDIAオープンモデルライセンス」により、商用利用も可能となりました。
この技術進化は高校生でも理解しやすい形で、AI開発の新たな地平を開いています。
出典 : https://ascii.jp/elem/000/004/205/4205286/