オープンAIが開発したAIモデル「GPT-4o」が中国語処理で大きな問題を抱えています。
この問題の原因は、訓練データに含まれたスパムサイト由来の内容です。
結果として、AIは不適切な内容や誤動作を引き起こす可能性が高まっています。
さらに、オープンAIは中国語の質の高い訓練データが不足している状況にあります。
中国のインターネット構造が、特定の企業間でのデータの支配と独占を生み出し、良質なデータ集めが難しくなっているのです。
これには改善が求められていますが、オープンAIはまだ解決に至っていません。
出典 : https://ascii.jp/elem/000/004/201/4201560/