次世代AI「GPT-4o」が刷新。テキストも画像も、今度は”全て”を理解

2024.05.15

WorkWonders

 新たな技術革新として、OpenAIが「GPT-4o」を発表しました。これは、音声や画像も含めて様々な形式のデータを理解し、それに反応することができる最新AIです。
これまでのモデルがテキストのみに反応していたのに対して、「GPT-4o」は、例えば声で指示を出してそれに音声やテキストで応答できるよう進化。
さらには、料理の歴史を問いかけたり、外国語のメニューをカメラで撮影して翻訳するなど、より実用的に対応します。
テキストと画像に対応して初リリースされ、今後は音声への対応も拡張される予定です。
多くの言語をサポートし、新しいアプリも利用可能になるなど、使い勝手も大きく向上しています。
「ChatGPT Plus」や「Team」「Enterprise」ユーザー向けに提供が開始されており、一般ユーザーも条件付きで体験できるようになっています。

出典 : https://forest.watch.impress.co.jp/docs/news/1591161.html

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください