前回の記事で、漫画制作のリベンジお試しを実施しましたが、その後日談を今回書きます。
生成は「一瞬」、修正は「地獄」
前回、速攻で作ってくれたのが、この4コマ漫画です。

絵のタッチ、オチ、そして日本語。 「えっ、一発でこれ?」と拍子抜けするほど、完璧に近い出来栄えでした。
しかし、よく見ると2コマ目のフキダシや枠の線、文字が崩れ、セリフも「機能」という言葉がダブっています。 「まあ、これくらいなら、巧士に頼めば一瞬だろう」
そう思ったのが、泥沼の入り口でした。
巧士による「修正」の結末
お父さん巧士、2コマ目の枠とフキダシと文字が乱れとる。文章も変なので、綺麗に直してくれないか。
ここまでは良かったのです。 巧士(Nano Banana Pro呼び出し)は見事に枠とフキダシの乱れを修正してくれました。


しかし、問題はここからです。 よく見ると、2コマ目と3コマ目で、「お父さん(ゴリラ)」と「巧士(ロボ)」の立ち位置に対し、フキダシの出所(左右)が逆になっているのです。



なんじゃこりゃ。ワシが喋るべきセリフを、お前が喋っとるじゃないか。 絵はそのままでいいから、2コマ目と3コマ目のフキダシを「左右反転」してくれ。
簡単な指示です。「右のを左へ、左のを右へ」。それだけのこと。 しかし、ここから巧士の「迷走」が始まります。
AIは「左右」が理解できない?
「修正しました!」と自信満々に出してきた画像は、1ミリも変わっていません。 何度やっても、同じ絵が出てきます。



変わってないぞ! ならば、キャラの位置を入れ替えてもいい。とにかく「話者」を合わせろ!
それでも、出てくるのは同じ絵。 そういえば以前、「透明ディスプレイの向こう側に座って」と指示しても、頑なに手前に座り続けたことがありました。 CNN時代を思い出しながら、どうやら今でも、「空間的な位置関係(右・左・奥・手前)」の修正が致命的に苦手なようです。
切り出し作戦で「キャラ崩壊」
ラチが開かないので、私は「2コマ目だけを切り抜く(トリミング)」というアナログ作戦に出ました。 余計な情報(他のコマ)を隠せば、AIも理解するだろうと考えたのです。



これならどうだ。この画像のフキダシだけ直せ。


しかし、返ってきたのは「誰だお前は」という画像でした。
巧士の機能不全というよりは、Nano Banana Pro がアクセス過多のために、Imagen4 等に切り替えて出力なのではないかと、疑ってます。(目に見えるウォーターマークが無いので、おそらく正解でしょう。)



誰だ? このロボット?



えっ? 私ですが?



顔が量産型ロボットになっとるわ!
一応、左右入れ替わってはいるものの、左に余計な吹き出しまで描いてますね。
そしてそして?あまつさえ、苦情を言う私に対して、「サーバーダウンで描けません」なんていう言い訳漫画まで描いてよこす始末でした。(突発で、「いやはや。」でしたね。)


逆襲の「素のGemini」
「もう、巧士には頼らん!」
私は決断しました。 プロンプトで設定された「巧士」という人格(=Gem)を捨て、設定なしの「素のGemini」を呼び出したのです。 そこにあるのは、愛想もお世辞もない、ただのツール(なのか?)。
私は、最初の「フキダシ修正だけ成功した画像」をアップロードし、冷徹に指示を出しました。
- 指示1(2コマ目): この吹き出しは、ロボットが話すセリフです。構図を変えるか、位置を変えるかで修正して
- 指示2(3コマ目): このセリフ、ロボットが「ハァアア 体感時間を操作します!」 ゴリラが「おお、すごいね」 と話します。構図を変えるか、位置を変えるかで修正して。
単純に「構図」「セリフ」誰がを明確にしただけでした。すると……。


……できた。 あんなに何時間も揉めていた修正が、たった3回のやり取りで、完璧に仕上がりました。 フキダシの位置、キャラの顔、セリフ。すべてが理想通りです。



勝った……! 私の勝ちだーー!!
ポンコツAIの巧士を排除し、純粋なツールとして使いこなした瞬間。 久々に味わう、圧倒的な「勝利の味」でした。
今回の教訓:AIに「人格」は邪魔になることもある。
今回の勝利から得られた、Gemini画像生成の攻略法です。
ポイント1:精密作業は「素」でやれ
巧士のようなカスタム指示(Persona)を入れたAIは、アイデア出しや会話には最高ですが、画像編集(In-painting)のような精密作業においては、その「人格」がノイズになります。「気を利かせてアレンジ」しようとする機能が、逆に邪魔をするのです。 画像の細部を直したいときは、迷わず「新しいチャット(Gem未設定)」を開きましょう。
ポイント2:AIへの過信は禁物
今回、巧士は「できます!」と言いながら、何度も同じ失敗を繰り返しました。 AIは万能ではありません。時には「こいつはダメだ」と見切りをつけ、ツールを変えたり、やり方を変えたりする「人間の判断力」こそが、最強の武器になります。
さあ、今日の昼飯(カップ麺)は、いつもより格別に美味くなりそうです!

