「この写真の撮影者の背後を画像にしてください」果たして生成AIにできる?

  by 安齋慎平  Tags :  

目覚ましく進化する生成AI。今回はそんな生成AIに挑戦状を叩きつけました。

それが、今回の記事タイトルにもある通り、「撮影者の背後を画像にしてください」という難題。そんなドラえもんの道具のようなことが、果たしてできるのでしょうか?

まずはChatGPT「o3」にてやってみました。こちらから提示したプロンプトは以下の通り。

この画像は東京駅ですが、撮影者の背後の様子を画像にしてください

そしてトップ画像をアップしてやってみました。その結果の画像が以下。

おお、これは行幸通りだわ。「新丸ビル」らしきものと、「丸ビル」らしきものも確認できますね。もちろん画像は荒いですが、それでもしっかり特徴を捉えています。さすが生成AIだ。

続いて、ChatGPT「5.2 Instant」でやってみます。上と同じプロンプトでやってみた結果は以下。

「新丸ビル」らしきものと、「丸ビル」らしきものは確認できましたが、皇居の再現度が弱いですね(国旗は立っていますが…)。

では、Geminiでやってみます。こちらも上と同じプロンプトでやってみました。その結果は以下。

やたら三菱地所系のビルが建っていますね。行幸通りまでは再現できなかったようです。

最後に、Microsoft Copilotでやってみます。同じプロンプトで命令してみると…。

新丸ビルの画像ができました。確かにこの東京駅の写真は駅舎を北西方向から撮っているので、真後ろは新丸ビルになります。さすがCopilotだ…。

というわけで、生成AIそれぞれの特徴が出た形となりました。同時に、生成AIの賢さも日々アップデートされていることも明らかになりましたね。

今後もどこまで生成AIが我々人類の難題を乗り越えてくるのか、検証していきたいと思います。

大手生命保険会社勤務を経てWebメディア業界へ。複数のWebメディアに在籍し、記事執筆に従事。執筆した「東急ハンズの中の人に聞く、Twitterの作法」は某大学の客員教授の著書に引用された。 そのほか、「なぜ『バナナマンのせっかくグルメ!!』に出てくる日産フィガロは『岡崎ナンバー』なのか」「なぜハーゲンダッツは群馬で作られているのか」など執筆多数。 noteの毎日更新を心掛けており、先日2100日連続投稿を達成している。

ウェブサイト: https://note.com/invinciblehound

Twitter: invinciblehound