次世代AIの新展開!革新的な3D&動画生成技術とは?

2024.08.13

WorkWonders

最先端の画像生成AI「FLUX.1」や動画生成AI「Gen 3」を開発したBlack Forest Labsが、テキストから動画を生成する「Text to Video」を予告しました。
また、PFNの子会社PFEからは、日本語性能がGPT-4を上回る国産大規模言語モデル「PLaMo」が登場。
一方、清華大学の研究チームはテキストから動画を生成する高性能AIモデル「CogVideoX」をアップデートし、高解像度の動画生成が可能になりました。

さらに、iPadでリアルタイムに動作する動画理解MLLM「MiniCPM-V 2.6」は、従来の大規模モデルを凌駕する性能を示しており、Appleの「マトリョーシカ拡散モデル」も高品質な画像を生成できると話題です。
また、UVマップを活用する3Dモデル生成AIや、スケッチから3Dゲームシーンを生成する「Sketch2Scene」が新たな表現の幅を広げています。
これら進歩的で、青少年にも理解しやすい技術は、いずれの分野においても大きな可能性を秘めています。

出典 : Apple開発の画像生成AI「マトリョーシカ拡散モデル」、iPadでリアルタイムに動画を理解するGPT-4V超えAI「MiniCPM-V 2.6」など生成AI技術5つを解説(生成AIウィークリー) https://www.techno-edge.net/article/2024/08/12/3590.html

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダース社は、生成AIの活用・導入について客観的な立場からご相談に応じています。

生成AIに関するご相談はこちらからご連絡ください。 当社のご支援実績はこちらからご確認ください。