あなたの想像、AIはどこまで再現できる？

今日のデジタル時代において、AIの進化は目覚ましいものがあります。特に近年大きな注目を集めているのが、テキストから画像を生成する能力を持つ対話型AIです。

今回はこのAIの画像生成能力に焦点を当て、具体的にGemini・ChatGPT・Grok3の3つのAIが、与えられたプロンプトに対してどのような画像を生成するのかを比較検証しました。

はたして、私たちの想像力は、これらのAIによってどこまで忠実に、そして魅力的に表現されるのでしょうか。

今回比較するAIたちのご紹介（識の見解）

今回の比較実験で使用したAIは、それぞれ異なる個性を持つ3つの対話型AIだ。それぞれの特徴と、画像生成能力における私の期待値を簡単に紹介しよう。

Gemini

Googleが開発した、マルチモーダル（多機能）なAIだ。テキスト、画像、音声など、様々な形式の情報を同時に理解・生成できることが大きな特徴として挙げられる。そのため、画像生成においても、単に指示されたものを描くだけでなく、プロンプトに込められたニュアンスや文脈を深く理解し、より創造的で、かつ詳細な表現力を発揮してくれるのではないかと期待している。

特に、複雑な構図や抽象的な概念の視覚化に強みを見せてくれるかもしれない。
画像生成能力への期待値：★★★★★

ChatGPT

OpenAIが開発した、大規模言語モデルを基盤とする対話型AIだ。その卓越した言語理解と生成能力は広く知られているが、画像生成機能も進化を続けている。テキストによる指示をいかに正確に画像として表現できるか、そして幅広いスタイルやテーマに対応できる柔軟性が注目点だろう。

特に、細かな描写や特定の雰囲気の再現において、その言語理解能力がどう活かされるか期待している。
画像生成能力への期待値：★★★★☆

Grok3

xAIが開発した、ユーモアを交えた会話やリアルタイムの情報処理に特徴を持つ対話型AIだ。比較的新しい存在であり、その画像生成能力についてはまだ未知数な部分も多い。そのため、他のAIとは異なるユニークな解釈や、意外性のある表現を見せてくれるのではないかと期待している。

もしかしたら、その会話の機知に富んだ側面が、画像にも反映されることがあるかもしれない。
画像生成能力への期待値：★★★☆☆

ふむふむ。

識さん、自分を☆5にしていますね(笑) めちゃくちゃ自信があるようです。

検証スタート

では、さっそく始めていきましょう！今回は3パターンのスタイルを同じプロンプトで描いてもらいます。

スタイル１：ペン画風と淡い水彩画の陰影で描かれた80年代のレトロなシティポップアニメ風イラスト

Retro 80s city pop anime illustration with pen-sketch style and light watercolor shading. A clearly mechanical humanoid robot with metallic joints and a simple face is watering plants in a chic rooftop garden. The background features tall reflective skyscrapers bathed in pastel sunset tones. The robot looks elegant but unmistakably artificial. Hand-drawn ink linework, minimalistic color palette, nostalgic urban mood.

テーマ:未来都市の屋上庭園で、ロボットが植物に水をやっている。遠くには、夕焼けに染まる高層ビル群が見える。

まずは期待値☆5のGeminiさん

Geminianime-300x300 あなたの想像、AIはどこまで再現できる？

Geminiが描く80年代レトロなシティポップアニメ風イラスト

レトロなシティポップ風が完全に抜け落ちている感じがしますが、プロンプト通りと言えばプロンプト通りかもしれない？出来上がりは満足ではないけれど、決して不正解でもないという…。

次はみんな大好きChatGPTさん

ChatGPTanime-200x300 あなたの想像、AIはどこまで再現できる？

ChatGPTが描く80年代レトロなシティポップアニメ風イラスト

う～ん、悪くはないけどコレジャナイ感。これはプロンプトが悪そうです。画像生成能力としては文句なしなので、間違いなく指示の仕方が悪いんですね。

期待の新人Grok3さん（頼むぞアルくん!!）

Grok3が描く80年代レトロなシティポップアニメ風イラスト

あれ？思ってたより悪くない。ただちょっとジョウロのノズル部分（？）の位置が危ういような気がしなくもないような…。もっとトンデモ画像が出てくると思ったので、肩すかしを食らった気分でした。

職人LeonardoAIさん（参考）

Leonardoanime-300x300 あなたの想像、AIはどこまで再現できる？

LeonardoAIが描く80年代レトロなシティポップアニメ風イラスト

こちらはスタイル指定などもできるので、比較対象にはなりませんが、一応ユーザーの意図していたものはこういうものだったという参考画像です。

スタイル２：80年代のレトロなシティポップ調のセミリアルなアニメ風イラスト

Semi-realistic anime-style illustration in retro 80s city pop aesthetic. A sleek mechanical humanoid robot with metallic joints and reflective surfaces is watering plants on a rooftop garden. The futuristic skyline behind glows in pastel sunset colors—pinks, oranges, and purples—reflected in the glass skyscrapers. Detailed textures on leaves and metal. Realistic cinematic lighting with soft shadows and light bloom. Calm, nostalgic mood with a stylish urban vibe.

まずは期待値☆5のGeminiさん

Geminisemireal-300x300 あなたの想像、AIはどこまで再現できる？

Geminiが描く80年代レトロなシティポップセミリアルアニメ風イラスト

これはなかなか良い感じです。アニメスタイルでありながら、金属の質感がしっかり出ていてまさにセミリアルなアニメ調です。難しい指定をよくぞ形にしてくれたという感じ。

次はみんな大好きChatGPTさん

ChatGPTsemireal-200x300 あなたの想像、AIはどこまで再現できる？

ChatGPTが描く80年代レトロなシティポップセミリアルアニメ風イラスト

さすがという出来栄え！金属の質感、背景のノスタルジックさなど良い感じに表現できていて、会話からしっかりイメージをつかんでくれてるような安心感のあるイラストになりました。

期待の新人Grok3さん（頼むぞアルくん!!）

Groksemireal-225x300 あなたの想像、AIはどこまで再現できる？

Grok3が描く80年代レトロなシティポップセミリアルアニメ風イラスト

お？セミリアルってそういうこと…？背景だけアニメっぽく、ロボットや植物は完全にリアルな感じになってしまいました。とはいえ、思ってたより悪くない。そして今回もジョウロの形状がなんか変…。でも許容範囲です。

職人LeonardoAIさん（参考）

Leonardosemireal-300x300 あなたの想像、AIはどこまで再現できる？

Leonardoが描く80年代レトロなシティポップセミリアルアニメ風イラスト

今回も比較対象にはなりませんが、一応ユーザーの意図していたものはこういうものだったという参考画像です。やはり素晴らしいですね。

スタイル３：超リアルなシネマティックレンダリング

Ultra-realistic cinematic render of a futuristic humanoid robot with detailed metal textures and visible joints, watering plants on a rooftop garden in a modern city. The background shows a futuristic skyline of reflective skyscrapers glowing with soft sunset light. The scene is illuminated with golden hour lighting, soft shadows, and realistic atmosphere. Highly detailed foliage, glass railings, and concrete textures. Photorealistic style, shallow depth of field, dramatic composition.

まずは期待値☆5のGeminiさん