次世代ChatGPT、映像と音声を同時解釈へ!

2024.06.15

WorkWonders

OpenAIが革新的な機能を追加し、ChatGPT(GPT-4o)が映像と音声の同時理解を可能にすると発表しました。これにより、スマートフォンのカメラを利用しながら、AIに質問したり意見を求めたりすることができるようになります。

従来の音声対話機能に加えて、カメラを通じた映像理解が可能になるので、たとえば面接の練習をAIがサポートすることも実現します。OpenAIはデモ動画を公開することで、この技術の進歩を見せつけています。

しかし、言語対応やその他の詳細についてはまだ明らかにされていません。今後数週間でのリリースに期待が高まる中、この機能がもたらす新たな体験は、私たちの日常生活にどのような変化をもたらすのでしょうか。

出典 : https://ascii.jp/elem/000/004/204/4204298/

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください