話題のトーキングヘッド動画、つまりカメラに向かって話す人物を映した動画は、ソーシャルメディアやテレビでよく目にするものです。
製品レビューやトレーニング動画、解説、ニュースキャスティングなどに使われ、非常に人気があります。
最近では、多言語に対応したリアルなトーキングヘッド動画を生成するAIサービスが現れ、そのクオリティは目を見張るものがあります。
しかし、私はいつものように好奇心を抑えきれず、これらをどのように作っているのか、また自分でも類似のものを作れないかと考えました。
実は、資金力のある企業の取り組みには及ばないまでも、かなり近い結果を出すことができたのです。
この記事では、サンタクロースがクリスマスのあいさつをする動画や、中国語で新年のあいさつをする動画など、幾つかのサンプルを紹介しつつ、その方法についても説明します。
簡潔なアルゴリズムを駆使して、多言語に対応するトーキングヘッド動画を創出しましょう。
出典 : https://medium.com/@sausheong/creating-talking-head-videos-with-generative-ai-2df3947fd506