AIで“観光雑誌の表紙”を作ってみた（座標指定×2人旅）

最近、画像生成AIの“レイアウト力”が上がってきてますねぇ。
「SNSで観光雑誌風画像を作った」というポストを見つけたのですが…
本物と見分けつかねぇ！！！と思ったので、試しにやってみました。

今回の肝はこんな感じ。

縦長9:16をフルに使う
“初夏の昼・快晴”でトーン固定
緯度経度を入れて場所の空気感を寄せる
2人組の女性を“同じ人物”として続編にも登場させる（参照画像前提）

なお、指定した緯度経度（41.745297768881926, 140.72118892843）は、だいたい北海道函館市の立待岬の座標帯です。
私は大学4年間を函館で過ごしたので、何度か言ったことがある思い出の地です。

当記事の画像生成AIモデル
Nano Banana Pro（Gemini 3 Pro Image）

今回使ったプロンプト
1. ①【雑誌の表紙】
2. ②【特集ページ】（①の画像を参照して続編）
このプロンプトの“効いてる”ポイント
つまずきポイント
まとめ：最終プロンプト

今回使ったプロンプト

今回は以下のXのポストを参考にさせていただきました！

Seedream4.5×Nano Banana Proを一緒に使うと簡単に雑誌風画像が出来上がる。これは金沢編！
誰でも簡単に出来ます。プロンプトはこちら↓
空想写真家さんのプロンプトを参考にさせて頂きました。

【プロンプト（写真集版）】緯度と経度が36.578134061857426,… https://t.co/VFMVw20TGf pic.twitter.com/Z8a5kRxE3d
— おさむ／AI副業 (@osam__AI) December 8, 2025

①【雑誌の表紙】

文字の表示は、正直まだ100%にはなりません。
日本語は特殊な文字だからというのはあると思いますが、GeminiでもChatGPTでも日本語表示は安定しません。
そのため、文字は後入れする前提でスペースを確保する方針にしました。

雑誌の表紙風にAIに出力してもらった写真画像 — 雑誌の表紙風にAIに出力してもらった画像

【雑誌の表紙】
初夏の昼・快晴の天気。場所は緯度と経度が41.745297768881926, 140.72118892843の位置。20代後半の女性2人が観光している自然なスナップ。旅行者らしい服装と小物（帽子、カメラ、トートバッグ）。表紙デザインとして美しい余白を確保し、上部に大きなタイトルが入るスペース、下部に特集見出しが入るスペースを空ける。文字そのものは生成しない（読める文字は入れない）。写真とレイアウトの完成度を最優先。

内容は悪くないのですが、アスペクト比が1:1で出力されていて、指示通りになっていません。

Geminiはアスペクト比をプロンプトで指定しても、ほぼ指示通りになりません。
「aspect_ratio」というパラメータを使用する必要がありました！
2026年1月時点では、そのパラメータを指定しても1:1で生成されます。
Googleも認識済みで、修正に取り組んでいると発表はしています。

②【特集ページ】（①の画像を参照して続編）

雑誌の特集ページ風にAIに出力してもらった写真画像 — 雑誌の特集ページ風にAIに出力してもらった画像

【特集ページ】
前回の画像を参照し、同じ女性2人組が緯度と経度が41.745297768881926, 140.72118892843の周辺エリアで観光してるように馴染ませてください。縦長9:16。1ページ内に複数の写真がある“雑誌の特集ページ”のレイアウト（大写真1枚＋小写真2〜4枚）。シチュエーション例：坂道の路地、海沿い、展望スポット、カフェ休憩、夕方手前の光。文字は生成しない（読める文字は入れない）。代わりに、見出しや本文が入る余白とボックスだけ配置して、デザインとして美しく整える。

こちらも同様で、内容は悪くないのですが、アスペクト比が指示通りになっていません。

Geminiはどういうわけか、最後に読み込まれた画像アスペクト比を使う傾向があります。
そのため、新規チャットで9:16の画像を読み込ませたうえで、プロンプトを打つと成功率がグッと上がります。

このプロンプトの“効いてる”ポイント

自分用の分解メモです。

季節×時間帯×天気（初夏／昼／快晴）
→ 色味が安定しやすい。青空・強めの自然光で“観光パンフ感”が出る。
緯度経度
→ AIがそのまま地理を正確に理解するとは限らないけど、少なくとも「日本のどこか」みたいな雑さから抜けやすい（体感）。
“観光雑誌の表紙のように美しくレイアウト”
→ 写真1枚をドン、よりも「余白・タイトル帯・キャッチ」っぽい構図に寄る。
“重要なページだと思って”
→ これ、文章生成AIでは効きやすい指示だけど、画像でも“気合い入った構図”に寄ることがある（完全に体感）。

つまずきポイント

たぶん全員が踏むのではなかろうか？と思うので共有です。

文字はだいたい潰れる／変なフォントになる

プロンプトで「文字が潰れないように」と言っても、画像生成はまだ事故りがち。
個人的には、“文字は最小限（または後入れ）”が安定だと思いました。

生成時：見出しは「英字っぽいダミー」か「短い単語」まで
仕上げ：Canvaや画像編集で、本物の日本語テキストを後から載せる

とはいえ精度は上がってきている

2022年頃から一般向けに生成AIが普及し始めた時。
最初は画像はおろか、出力される文章でさえ日本語がかなりおかしな感じでした。

ですが、2026年現在では文章は人間とぱっと見では区別できないほどの精度になってきています。
さらに画像内に日本語を入れ込む場合も、短い言葉なら成功率は高くなってきているように感じます。
運が良ければ、何度か生成すると完璧な当たり画像を引けるかもしれません。

アスペクト比を指定する

Geminiに関しての話になりますが、以前は「aspect_ratio」というパラメータを使用しないと画像比率が指示通りになりませんでした。
ところが、2026年1月時点ではこの指示も効かなくなっています。

Geminiはどういうわけか、最後に読み込まれた画像アスペクト比を使う傾向があります。
そのため、新規チャットで9:16の画像を読み込ませたうえで、プロンプトを打つと成功率がグッと上がります。

ChatGPTも指示通りの画面サイズにならないことがありますが、近い比率で出してくれることが多い印象です。
Geminiは高性能だと言い張る人がいますが、正直他のツールと組み合わせた時の話ですよね？
単体では他のAIにボロ負けしていると感じるのは私だけでしょうか・・・

まとめ：最終プロンプト

縦横比（Aspect Ratio）を9:16にする。プレーンな9:16の画像を新規チャットで読み込ませる。
まず①のプロンプトで 表紙を生成（数枚出して、いちばん“雑誌っぽい余白と見出し位置”のやつを採用）
次に②へ進む前に、①で採用した画像を“参照画像”としてセット
②のプロンプトで 特集ページを生成（人物が同じになっているか／写真が複数シーンに見えるかを見る）

※「前回の画像を参照」は、参照画像機能（画像を添付して生成するタイプ）があるサービスだと効果が出やすいです。

プロンプト①
初夏の昼・快晴の天気。場所は緯度と経度が41.745297768881926, 140.72118892843の位置。20代後半の女性2人が観光している自然なスナップ。旅行者らしい服装と小物（帽子、カメラ、トートバッグ）。表紙デザインとして美しい余白を確保し、上部に大きなタイトルが入るスペース、下部に特集見出しが入るスペースを空ける。文字そのものは生成しない（読める文字は入れない）。写真とレイアウトの完成度を最優先。

プロンプト②
前回の画像を参照し、同じ女性2人組が緯度と経度が41.745297768881926, 140.72118892843の周辺エリアで観光してるように馴染ませてください。縦長9:16。1ページ内に複数の写真がある“雑誌の特集ページ”のレイアウト（大写真1枚＋小写真2〜4枚）。シチュエーション例：坂道の路地、海沿い、展望スポット、カフェ休憩、夕方手前の光。文字は生成しない（読める文字は入れない）。代わりに、見出しや本文が入る余白とボックスだけ配置して、デザインとして美しく整える。