目覚ましく進化する生成AI。今回はそんな生成AIに挑戦状を叩きつけました。
それが、今回の記事タイトルにもある通り、「撮影者の背後を画像にしてください」という難題。そんなドラえもんの道具のようなことが、果たしてできるのでしょうか?
まずはChatGPT「o3」にてやってみました。こちらから提示したプロンプトは以下の通り。
この画像は東京駅ですが、撮影者の背後の様子を画像にしてください
そしてトップ画像をアップしてやってみました。その結果の画像が以下。
おお、これは行幸通りだわ。「新丸ビル」らしきものと、「丸ビル」らしきものも確認できますね。もちろん画像は荒いですが、それでもしっかり特徴を捉えています。さすが生成AIだ。
続いて、ChatGPT「5.2 Instant」でやってみます。上と同じプロンプトでやってみた結果は以下。
「新丸ビル」らしきものと、「丸ビル」らしきものは確認できましたが、皇居の再現度が弱いですね(国旗は立っていますが…)。
では、Geminiでやってみます。こちらも上と同じプロンプトでやってみました。その結果は以下。
やたら三菱地所系のビルが建っていますね。行幸通りまでは再現できなかったようです。
最後に、Microsoft Copilotでやってみます。同じプロンプトで命令してみると…。
新丸ビルの画像ができました。確かにこの東京駅の写真は駅舎を北西方向から撮っているので、真後ろは新丸ビルになります。さすがCopilotだ…。
というわけで、生成AIそれぞれの特徴が出た形となりました。同時に、生成AIの賢さも日々アップデートされていることも明らかになりましたね。
今後もどこまで生成AIが我々人類の難題を乗り越えてくるのか、検証していきたいと思います。

