OpenAIの新しいモデル「GPT-4o」が、分かりやすいライブデモを通じて、その卓越した動画理解能力を披露しました。
これは、グーグルのマルチモーダルモデル「Gemini」が編集で誤解を招くデモを公開し炎上したことに対する、見事な対応となります。
さらに、GPT-4oは「Maximizing LLM Performance」という45分の専門的な動画を、数分で要約する能力も示しています。
映像の理解に通常と同じ時間を必要とする人間とは異なり、GPT-4oはその知能で私たちを凌駕し始めているのです。
この技術進化は、私たちの仕事や学習に大きな影響を与えるかもしれません。
出典 : https://www.sbbit.jp/article/cont1/140614