音声もマルチタスクもこなすAI「GPT-4o」、その噂の真相は?

2024.05.15

WorkWonders

米国のAI開発組織OpenAIが、最新AIモデル「GPT-4o」を発表しました。このAIは、テキストや音声、画像といった様々なデータを処理することができ、複雑なタスクに対応する多機能な存在です。
特に注目されているのは、女性の声を用いたデモで、映画「Her」のサマンサを思わせる音声が示されました。この声が誰のものであり、どのようにして生成されたのかは謎に包まれています。
OpenAIは、わずか15秒の音声データから個人の声を再現する技術も発表しており、未来のAIはさらに私たちの生活に密着するかもしれません。
日本でも議論が巻き起こっているAIカバーに関する問題が、この技術と共に新たな局面を迎えることになりそうです。

出典 : https://www.itmedia.co.jp/news/articles/2405/14/news084.html

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください