最近、GoogleのGemini 2.0 Flash Experimentalなど、新たな生成AI技術が話題になっている。
これらのマルチモーダルLLMは、画像とテキストの両方に対応し、従来の2次元画像生成だけでなく、動画生成や画像編集も可能にしている。
ユーザーは簡単な操作でロゴを用いたイメージ写真を創り出したり、写真に人物を加えたりすることができる。
しかし、規制が厳しく、出力可能な画像には不一貫性がある問題も。
それでも、Hailuo AIのImage-01モデルのように、高品質で日々新しい画像が生成できるサービスも出現しており、楽しめる要素は増えている。
この技術の進化により、今後カメラマンの仕事が大きく変わるかもしれない。
出典 : 生成AIグラビアをグラビアカメラマンが作るとどうなる?第44回:真のマルチモーダルGeminiにHailuoの新モデル、クラウドの生成AI画像が進化!?(西川和久) https://www.techno-edge.net/article/2025/03/18/4186.html