Anthropic社が新たに「Claude 3.5」をリリースし、ソフトウェアのコーディング性能向上や旧バージョンを凌ぐAI「Claude 3.5 Sonnet」と「Claude 3.5 Haiku」をアップデートしました。
「Computer Use」という、カーソルの移動やクリック操作も可能な機能も加わり、AIの操作範囲が広がりました。
Google DeepMindは文章がAIによって生成されたものかを識別できる「SynthID Text」技術を発表し、さらに新しいAI音楽ツール「MusicFX DJ」や「Music AI Sandbox」のアップデートも実施しています。
一方で、「Genmo」はオープンソースの動画生成AI「Mochi 1」を公開し、2840万ドルの資金調達に成功しました。この技術では流体や毛髪のシミュレーションなど、自然な動きを表現できるビデオを創出します。
Microsoftは、GPT-4Vを使った新しいAI「OmniParser」を発表しました。これは、スクリーンショットからクリック可能な要素を特定し、その機能を理解する技術です。
これらの進化するAI技術は、私たちの日常やビジネスのあり方を大きく変革するかもしれません。高校生でもわかるように説明すると、これらのAIはコンピューターソフトウェアの開発や動画制作、さらには音楽生成まで、様々な創作活動の手助けをしてくれるようになったのです。
出典 : 商用可能な高精度オープン動画生成AI「Mochi 1」と「Allegro」、数時間喋らせるローカル実行可能なリップシンク生成AI「Hallo2」など生成AI技術5つを解説(生成AIウィークリー) https://www.techno-edge.net/article/2024/10/31/3800.html