最近、アートとグラフィックデザイン業界に革命をもたらす可能性があるテクノロジーが現れました。
DALL-Eやディスコ・ディフュージョン、ドリーム・スタジオ、ミッド・ジャーニーといったAIアートジェネレーターが次々と公開され、驚くべき創造的な結果をテキスト入力から生み出しています。
特に注目すべきはオープンソースのモデル「ステーブル・ディフュージョン」で、過去数週間の使用経験から業界への影響が予測されます。
ステーブル・ディフュージョンは顕著な画像生成アルゴリズム「潜在ディフュージョン」を採用し、ノイズを加えることで訓練を進め、逆にノイズを減らしてクリアな画像を生成します。
PythonとPyTorchで書かれたこのプロジェクトは「txt2img」と「img2img」の2つのモードを持ち、それぞれテキストや画像から新しい画像を生成します。
高解像度の画像生成も可能で、GPUのメモリに応じて異なる設定が可能です。
将来性に溢れ、アップスケール機能も備え、より精細なアートを作成できます。
この分野は急速に進化しており、今回紹介しきれなかった点も含めて、更なる深掘りと研究記録をGitHubで更新していきます。
AIアートの可能性を広げるステーブル・ディフュージョンに、是非注目してください。
出典 : Intro to Stable Diffusion — A Game Changing Technology for Art https://medium.com/short-bits/intro-to-stable-diffusion-a-game-changing-technology-for-art-6abadcc2c09a