![]()
はじめに:画像生成に困る理由とGeminiで解決できること
画像生成でつまずきやすいのは、頭の中のイメージを言葉にしきれず、出てきた画像が「なんか違う」になりやすいからです。さらに、縦横比、文字の入り方、雰囲気の統一など、細部の条件が増えるほど調整が難しく感じます。
Geminiは、画像を作るだけでなく、作った画像に対して「ここだけ直して」と文章で頼み、会話しながら詰められるのが強みです。この記事では、モデルの選び方、Geminiアプリでの手順、プロンプトの組み立て方、用途別の進め方、安全面の注意までを、現場で使う前提で整理します。
Geminiの画像生成で押さえるべきモデル全体像

Geminiの画像生成は、どのモデルをどの経路で使うかで、画質・制御の細かさ・費用が変わります。結果が思い通りにならない原因が「センス」ではなく「モデル選び」だった、というケースも珍しくありません。最初に全体像を押さえると、PoC(試し導入)から本番運用までの見積もりも立てやすくなります。
画像生成モデルの種類と特徴
Geminiの画像生成は、プランや利用環境により、Imagen 3やImagen 4などのモデルを使い分けます。無料プランでもImagen 3で画像生成ができ、文章作成や要約と同じ画面の流れで試せるため、まずの検証に向きます(参照*1)。
一方で、より高い品質や細かな制御を求めるなら上位モデルの選択肢があります。Google AI UltraではImagen 4による画像生成が案内されており、制作物の品質を優先したい場面の候補になります(参照*1)。
また、Googleの画像生成AIモデル「Gemini 2.5 Flash Image」は通称「nano banana」として紹介され、風景・正方形・ポートレート・フレキシビリティの4スタイルと、10種類のアスペクト比に対応するとされています。最初から「縦長のSNS投稿用」「正方形のサムネイル用」のように形を決めて作りやすいのが特徴です(参照*2)。
より高品質な方向では「Nano Banana Pro」が、2K〜4K解像度の生成、照明・カメラアングル・アスペクト比などの細かな制御、文字表示の精度、複数画像の同時入力による編集・合成に対応すると発表されています。商品画像の雰囲気をそろえる、複数カットを混ぜて1枚にまとめる、といった業務用途で効きやすい要素です(参照*3)。
海外報道では、Nano Banana Proはインフォグラフィックやスライド資料の作成に強く、最大14枚の異なる画像、または5人のキャラクターを扱いながら一貫性を保てるという説明も出ています。単なる1枚絵ではなく「情報を伝える画像」に寄せたいときの考え方として参考になります(参照*4)。
料金プランと利用経路
Geminiの料金プランは4つが用意され、無料プランでもGemini 2.5 Flashモデルを利用でき、画像生成はImagen 3で行えると整理されています。まずは無料で「どんな指示だと崩れるか」を確認し、必要になった段階で上位へ移るほうが判断が速くなります(参照*1)。
上位の例として、Gemini(Google AI Ultra)は月額249.99ドルで、Pro版相当の機能をほぼ制限なしで利用でき、YouTube Premium(個人プラン)や30TBストレージが含まれ、画像生成はImagen 4を使うとされています。画像制作だけでなく周辺環境もまとめたい場合に検討しやすい設計です(参照*1)。
利用経路も、運用設計に直結します。開発者向けにはGoogle AI Studioを通じたGemini API(APIは、別のサービスから機能を呼び出す仕組みです)、企業向けにはVertex AI(企業向けのAI基盤)を通じて使えるとされ、Gemini 2.5 Flash Imageの料金は1枚あたり0.039ドルと説明されています。大量に作る場合は、1枚単価でコストを読める経路が向きます(参照*2)。
自動化の入口としては、Node-RED(画面で処理の流れを組む自動化ツール)向けに、Geminiの統合ノードが公開されています。Imagen 3やGeminiでの画像作成・編集を部品化できるため、定型業務に組み込みやすくなります(参照*5)。
Geminiアプリでの画像生成・編集の基本手順

ここからは、迷いが少ないGeminiアプリ中心の進め方を整理します。操作手順が固まると、後半のプロンプト改善や、社内での手順共有が進めやすくなります。
画像生成の基本操作
基本は、Geminiにアクセスして、日本語で具体的な指示を入力するだけです。送信すると数秒から数十秒で2〜4枚の画像が生成されるとされており、まずは候補を並べて「近いもの」を選ぶやり方が合います(参照*6)。
保存もシンプルです。PCなら画像上のダウンロードボタンや右クリックから「名前を付けて画像を保存」を選び、スマートフォンなら長押しして「写真を保存」などを選ぶ流れが紹介されています。比較しながら改善するために、採用しなかった案も含めて一度保存しておくと振り返りが楽になります(参照*6)。
Geminiアプリは「わずかな指示だけで魅力的な画像を生成・編集できる」と案内されています。最初は短い指示で出し、足りない点だけを追加していくほうが、意図がぶれにくくなります(参照*7)。
自然言語による画像編集と反復作業
Geminiの画像編集は、テキストで「ここをこう直して」と伝える形で進められます。GeminiアプリでGoogleアカウントにサインインし、アップロードした画像やアプリ内で作成した画像を編集でき、対応形式はPNG、JPEG、WEBP、HEIC、HEIFとされています。まずは手元の写真を1枚アップして、明るさや雰囲気の変更から試すと感覚がつかめます(参照*8)。
反復作業のコツは、1回の指示に詰め込みすぎないことです。たとえば「背景を夕方に」「人物はそのまま」「文字は入れない」のように、変える点と残す点を分けて伝えると、意図が伝わりやすくなります。
モデル面では、Geminiアプリ内で「Nano Banana」を試せる案内があり、Gemini 2.5 Flashを基盤とする画像生成・編集モデルだと説明されています。生成と編集を同じ流れで回すなら、編集まで含めた得意分野でモデルを選ぶのが近道です(参照*7)。
自動化したい場合は、Node-REDのgemini-image-generateノードのように、画像の作成・編集を部品として組み込む方法も示されています。たとえば「毎週の投稿用に同じサイズで作る」「社内資料の表紙を定型で作る」といった反復に向きます(参照*5)。
失敗しないプロンプト設計:思い通りの絵に寄せる実践術

画像生成の結果は、プロンプト(指示文)の書き方で大きく変わります。ここでは、難しい言葉を増やすのではなく、伝える順番と粒度を整える方法に絞って説明します。社内で手順を横展開する場合も、この型があると教育コストを下げられます。
プロンプト要素の分解
高品質に寄せる基本は、プロンプトを具体的にすることだと紹介されています。誰が何をどうしているかを明確にし、スタイル、色、時間帯、光の具合、雰囲気など、必要な要素だけを足していくと結果が安定しやすくなります(参照*6)。
例として、悪い例は「猫の絵」、良い例は「夕焼け空を背景に、窓辺で丸くなって眠っているふわふわの三毛猫の、温かみのある水彩画風イラスト」という形で、状況と質感まで言葉にする差が示されています。SNS用なら「正方形」「余白多め」、資料用なら「文字を載せる余白を確保」など、使い道の条件も同じ文章に入れるとズレが減ります(参照*6)。
ただし、細部を足しても狙い通りの配置にならないことはあります。たとえば、2枚の画像をスタイルガイドとして使い、看板の位置やスケール、車の配置などを細かく修正しても、想定したレイアウトに近づかなかったという体験談があります。行き詰まったら「配置の言い直し」より、構図を別案に切り替えたほうが早いこともあります(参照*9)。
構造化プロンプトと再現性
文字入りのカードなどでは、画像と文字が混ざって崩れる問題が起きやすく、これを避けるには「入れ物」と「中身」を区別させる構造的な指示が有効だという考え方が示されています。JSON(項目を決めて書く形式)による構造化プロンプトと自然文の指示を組み合わせ、スタイル別の事例で使い回せるテンプレートを作る手法が紹介されています(参照*10)。
たとえば、次のように「目的」「サイズ」「絵の要素」「文字の要素」を分けると、直す場所も分かれます。
- 絵: 背景、主役、光、色
- 文字: 文言、位置、フォントの雰囲気、可読性
この分解をしておくと、2回目以降は「文字だけ直す」「背景だけ変える」がやりやすくなります。
上位モデル側の説明として、Nano Banana Proは4K出力、多言語の文字描画、複数画像の参照融合、スタイルの一貫性制御、企業向けの制作パイプラインを実現するシステムだと整理されています。参照画像を約14点前後使って一貫性や色の安定性を高める、という方向性も示されており、再現性を上げたい場面では「参照を増やす」「条件を固定する」が考え方として合います(参照*11)。
また、Nano Banana Proは2K〜4Kの高品質生成に加え、照明やカメラアングル、アスペクト比などを細かく制御でき、文字表示の精度も高いとされています。プロンプト側は、毎回ゼロから詰めるのではなく、固定テンプレートを作って「変える項目だけ差し替える」運用に寄せると、品質と工数の両方を管理しやすくなります(参照*3)。
用途別:実践Gemini画像生成ワークフロー事例

ここでは、実際にどう使われているかを、用途別に手順としてイメージできる形で見ていきます。個人向けの分かりやすい例と、業務での運用に近い例を分けて紹介します。
年賀状とSNS投稿の事例
日本国内の事例として、日本郵便株式会社は、GoogleのAI「Gemini」の画像生成モデル「Nano Banana Pro」を活用した、無料で手軽にユニークなAI年賀状作成ツールの提供に協力すると発表しています。生成した年賀画像は実際に年賀状として差し出せるとされ、画像生成が「作って終わり」ではなく「実務の手続き」までつながっています(参照*12)。
特設サイトは https://goo.gle/nengajyo で、開設期間は2025年12月15日11:00〜2026年1月15日と案内されています。専用ジェネレーターで9つのテンプレートから選び、複数枚の画像をアップロードして生成し、テキストメッセージの追加や縦横比の調整もできるとされています。テンプレートがあると、構図や文字の領域が最初から決まるため、初心者でも破綻しにくい設計です(参照*12)。
年賀状として差し出す場合は別途料金が必要で、例として印刷枚数10枚なら印刷料金4,220円〜と案内されています。社内で配布物を作る場合も、生成コストだけでなく印刷や運用コストまで含めて試算すると、稟議が通りやすくなります(参照*12)。
SNS投稿の運用例としては、Google CloudのVertex AIとGAS(Google Apps Script。Googleのサービスを自動操作する仕組み)を組み合わせ、スプレッドシートの記念日を読み込んで、スクリプトが自動で「スイカの日をテーマにした美しい水彩画を生成してください」といった指示をAIに送る方法が紹介されています。背景も調べさせてImagenで描かせる連携を試みると、情緒ある1枚ができたという記述があり、投稿ネタ作りと画像生成を一連の流れにしています(参照*13)。
このタイプの運用では、毎回の出来を偶然に任せない設計が効きます。たとえば「季節」「色」「余白」「文字を入れるか」を固定し、記念日だけ差し替えると、投稿全体の統一感が出やすくなります。
記事コンテンツと業務資料の事例
日本国内の事例として、TechSuite株式会社は「バクヤスAI 記事代行」の記事内画像挿入オプションに「Gemini Nano Banana Pro」を導入したと発表しています。2025年9月の提供開始以降、最新AIで進化させることで視覚的訴求力と独自性を高め、コンテンツマーケティングを支援すると説明されています(参照*14)。
制作プロセスとして、記事内容を解析して最適なビジュアル構成を自動生成する「AIによる初期デザイン」、ブランドイメージや読みやすさを考慮する「人間デザイナーによる調整」、専任担当者が最終確認する「品質チェック」という流れが示されています。業務で使うなら、生成結果をそのまま採用する前提ではなく、確認と修正の担当を最初から決めておくと運用が止まりにくくなります(参照*14)。
業務資料の方向では、海外の報道でNano Banana Proがインフォグラフィックに優れ、スライド資料を作成できるという説明が出ています。最大14枚の異なる画像、または5人のキャラクターを扱い、一貫性を保てるという話は、部署紹介資料や研修資料のように「同じ登場人物が繰り返し出る」制作で活きます(参照*4)。
また、Nano Banana Proは2K〜4K解像度で、照明・カメラアングル・アスペクト比などを細かく制御でき、文字表示の精度も高いとされています。表紙や見出し画像のように「文字が読めないと使えない」場面ほど、モデル選びと指示の分解が効きます(参照*3)。
記事や資料で失敗しにくい流れを、手作業でも再現できる形にすると次のようになります。
- 本文の要点を3つに絞る
- 要点ごとに1枚ずつ画像の役割を決める(説明、雰囲気、手順など)
- まずは低コストの条件で複数案を出し、採用案だけを編集で詰める
この順番にすると、画像が先に暴走して本文と合わなくなる事故を減らせます。
安全・品質・権利:画像生成で避けたい落とし穴と対策

画像生成は便利ですが、権利や信頼性の扱いを誤ると、社内外でトラブルになります。ここでは、ディープフェイク、著作権、そして「AI生成かどうかの確認」を、業務で使う前提で押さえます。
ディープフェイクと著作権のリスク
画像生成では、特定の人物や有名人の顔画像の生成が禁止されており、ディープフェイクやセンシティブな内容も制限されると説明されています。ポリシー違反を含む指示は拒否されるため、作業に入る前に「作ってよい対象か」を確認するのが基本になります(参照*6)。
著作権侵害のリスクも指摘されており、商業利用では法的責任が生じる場合がある点に注意が必要だとされています。たとえば社内資料として作っても、後から外部公開に転用される可能性があるなら、素材の出どころと利用条件を最初からメモしておくほうが安全です(参照*6)。
海外の事例では、New Yorkerの漫画家の作風を模す試みを通じて、著作権や署名の扱いなど、倫理的・法的な問題が浮上しうることを実感したという記述があります。初回の試作に芸術家のサインが含まれていた点を問題視すべきだという示唆もあり、作風の模倣は「それっぽく作る」以上のリスクがあると分かります(参照*9)。
また、オンライン上でAI生成画像が増え、見分けが難しくなるという注意喚起もあります。記事内では割合の見積もりにも触れられていますが、調査の実施主体やサンプル数などの詳細条件は示されていません。数値の真偽よりも、「受け手の誤解が起きやすい状況になっている」という前提で運用ルールを整えるのが現実的です(参照*15)。
SynthIDと検出ワークフロー
Googleによれば、Gemini 2.5 Flash Imageで作成・編集された全ての画像にはSynthIDというウォーターマークが埋め込まれ、人間の目では判別できないようになっているとされています。見た目で判断できない前提で、仕組みで透明性を持たせる方向です(参照*2)。
さらに、Googleの対話型AI「Gemini」で、画像が生成されたものかを確認できるようになったという報道があり、SynthID Detectorを一般公開する発表があったとされています。同じニュースの中で、AI画像編集ツール「nano banana pro」も取り上げられ、Pro版では画像内に読みやすいテキストを生成でき、4K解像度まで高精細化できるとも説明されています(参照*16)。
ただし制約として、Geminiが判定できるのはGoogleのAIで生成されたかどうかに限られ、他社のAIツールで作られたかどうかは分からないとされています。検出結果だけに頼らず、素材の入手経路や作成ログとセットで管理する必要があります(参照*16)。
実務での検出ワークフローは、難しく考えなくて大丈夫です。外部公開する画像は「作成に使ったモデル名」「元にした画像の有無」「編集指示の要点」をメモとして残し、必要に応じてSynthID Detectorのような手段で確認する流れにすると、後から説明しやすくなります(参照*16)。
おわりに:困ったときほど「モデル選び×手順×プロンプト」で解く
Geminiの画像生成で詰まりやすい場面は、モデルの得意不得意、アプリでの反復手順、プロンプトの分解が噛み合っていないことが原因になりがちです。うまくいかないときほど、まずモデルと利用経路を見直し、次に手順を固定し、最後にプロンプトを要素ごとに整える順番が効きます。
画像は一発で当てるより、候補を出して選び、言葉で直して寄せていくほうが、業務では再現しやすくなります。年賀状でも、SNSでも、記事や資料でも、この3点セットで組み立て直すと、判断と作業が進めやすくなります。
監修者
安達裕哉(あだち ゆうや)
デロイト トーマツ コンサルティングにて品質マネジメント、人事などの分野でコンサルティングに従事しその後、監査法人トーマツの中小企業向けコンサルティング部門の立ち上げに参画。大阪支社長、東京支社長を歴任したのち2013年5月にwebマーケティング、コンテンツ制作を行う「ティネクト株式会社」を設立。ビジネスメディア「Books&Apps」を運営。
2023年7月に生成AIコンサルティング、およびAIメディア運営を行う「ワークワンダース株式会社」を設立。ICJ2号ファンドによる調達を実施(1.3億円)。
著書「頭のいい人が話す前に考えていること」 が、82万部(2025年3月時点)を売り上げる。
(“2023年・2024年上半期に日本で一番売れたビジネス書”(トーハン調べ/日販調べ))
参照
- (*1) 日本パソコンインストラクター養成協会 – 日本パソコンインストラクター養成協会
- (*2) ZDNET Japan – グーグル、画像生成AI「Gemini 2.5 Flash Image」(nano banana)を一般提供
- (*3) プレスリリース・ニュースリリース配信シェアNo.1|PR TIMES – JAPAN AIが「Nano Banana Pro」と「Gemini 3 Pro」に対応
- (*4) CNBC – Google launches Nano Banana Pro, an updated AI image generator powered by Gemini 3
- (*5) node-red-contrib-gemini
- (*6) AIの基礎知識 | 人工知能・AIを活用した、様々な業務の自動化、効率化に役立つ基礎知識をご紹介します。 – Geminiで画像生成する方法とは?無料での利用、画像生成に関する制限と利用上の注意点、コツまで解説
- (*7) Google Play のアプリ
- (*8) Learn Prompting's Newsletter – Can Google Gemini Replace Photoshop? AI Image Editing with Natural Language
- (*9) Poynter – I’m no cartoonist. Neither is Google’s Gemini
- (*10) Nano Banana Studio – Nanobanana ゲームカード資産生成完全ガイド:7つのスタイル実戦事例とプロンプト集
- (*11) Data Studios ‧Exafin – Google Nano Banana Pro: Advanced Image Generation, High-Fidelity Editing, Multimodal Controls and Enterprise-Grade Visual Production
- (*12) プレスリリース・ニュースリリース配信シェアNo.1|PR TIMES – 日本郵便 with Google Gemini 「#Geminiで年賀状」の提供開始
- (*13) マーケティングサイエンスラボ – Geminiと作る「今日の何の日」ボット開発記:日曜プログラマーがAIで画像生成からインスタ自動投稿まで実現した話
- (*14) プレスリリース・ニュースリリース配信シェアNo.1|PR TIMES – 【バクヤスAI 記事代行】記事内画像挿入オプションにGeminiのAI画像生成Nano Banana Proを導入しました
- (*15) Generative Artificial Intelligence – New Gemini Image Generation Updates
- (*16) CNET Japan – Geminiに「この画像はAI生成?」と聞けるように “見えない透かし”で判別 制約も