OpenAIが提供するGPT-4oモデルに革新的な機能が追加されました。
これまでテキストのみでのファインチューニングが可能でしたが、新たに画像を用いた学習ができるようになり、視覚タスクの精度が飛躍的に向上。
たった100枚の画像でモデルをカスタマイズでき、結果、車線認識や交通標識検出などで20%~26%の性能向上を実現。
さらに、保険書類の情報抽出スコアも7%上昇しています。
11月1日以降は、トレーニングにかかる費用が発生するものの、開発者たちは高い関心を寄せています。
この技術の進歩で、AIの日常利用がさらに進むことは間違いないでしょう。
出典 : OpenAIのGPT-4oに「画像でファインチューニングする機能」が追加される、わずか100枚の画像でタスクの性能が向上 https://gigazine.net/news/20241002-gpt-4o-vision-fine-tuning/