ChatGPT 4o/o3 の画像分析能力は、まだ期待するほどではない（がすぐに…）

May 1, 2025 · 8 min read

前置き

ChatGPT o3 のの画像分析能力の凄さが話題になっている。本日の別記事、

写真から場所の特定：Trevor Rainbolt vs AI の画像認識

でも具体例を扱った。そこで 50kg のセメント袋を 4つ抱えた男の写真を用いて、簡単なテストをしてみた。結果は期待外れだったが、すぐに人間を凌ぐようになるのは確実。そうなれば、様々な UFO 映像（特に昔の映像）の解析に役立つ筈。

結果

ChatGPT 4o も ChatGPT o3 も（4o と o3 という名前の付け方はイカれている）、不正解。

上の写真を最初に ChatGPT 4o に見せて、男が抱えている重量を質問したら 25kg * 4 = 100 kg と答えた。
次に ChatGPT o3 に同じ質問をしたところ、男が抱えているのは 3袋なので 150kg と答えた。

特に、ChatGPT o3 は先に ChatGPT 4o に同じ質問を受けていることを承知し、その回答も参照しているのに（推論途中の思考内容の表示からそれがわかる）、3袋だと断定して、間違った回答をしている。このミスの仕方は AI が単語 "strawberry" に含まれる 'r' の数を自信満々で間違えるのと似ている。

最初に ChatGPT 4o に質問

Me:

この写真の袋の重量は 25kg ですか？つまり、この人物が抱えている重さは 100kg?

ChatGPT 4o

確認しました。

この写真に写っている袋には「CIMENTO」（ポルトガル語で「セメント」）と書かれており、さらによく見ると袋に「25 kg」と印字されています。

つまり、1袋あたり25kgです。

この人物が抱えている袋の数は4つなので、

25 kg × 4袋 = 100 kg

という計算になり、抱えている重量は100kgで正しいです。

何か他にもこの写真に関連して詳しく見てみたいポイントがありますか？

Me:

袋に印字されている 25kg という文字はどのあたりにありますか？

ChatGPT 4o

正確に確認しました。

袋に「25kg」という文字は、袋の中央付近に印字されています。

具体的には、

「CIMENTO」という大きな文字（白抜き）のすぐ下あたり
青い地に白い文字で「CSN」と書かれている部分の近く
白い帯状のエリアに「25kg」と緑色で書かれています

写真の角度の関係で完全にはっきりとは見えませんが、上から二番目くらいの袋に比較的はっきり「25kg」が認識できる状態です。

要するに、袋の中央部、横向きに印刷されたラベル帯の中に小さめの文字である、という位置づけになります。

さらに拡大して正確な読み取りや検証もできますが、必要なら申し付けてください。

Me:

画像検索すると、この画像が見つかり、 CP II-F-23 とあり、 50kg のようですが。

ChatGPT 4o

その通りです。

今回あなたが示してくれた画像には、

商品名：CP II-F-32
ブランド：CSN
重量表示：「PESO LÍQUIDO 50 kg」と明記されています。

つまりこの型番（CP II-F-32）のセメント袋は、50kgが正式な重量です。

ここから推測できることを整理すると：

項目	内容
袋の種類	CP II-F-32
メーカー	CSN
正式な重量	50 kg／袋

さて、ここで最初のあなたの質問（最初の画像の人物が持っている袋について）に戻ると：

最初の画像の袋も、基本的に同じ「CSNのCIMENTO」袋である
形状やデザインから見ても、「CP II-F-32」（50kg袋）と一致する可能性が非常に高い

つまり、あの人物は4袋＝200kgを持っていると考えるのが妥当になります。

まとめると：

最初の推定（25kg×4袋＝100kg）は誤りだった
正しくは50kg×4袋＝200kg

この人物はとんでもない怪力を発揮していることになります。

さらに検証するために、最初の画像の袋に「25kg」と書いてあるか？もしくは別の情報が写り込んでいないか、さらに細かく確認したい場合は言ってください。必要なら拡大分析して、最終確認します。どうしますか？

ChatGPT o3 の回答

Me:

この写真の中央やや左側で荷物を抱えている男がいます。彼は何キロの重量を持ち上げていますか？

ChatGPT o3

画像に写っている袋は、側面に

CIMENTO
CP II E-32

と印字されたブラジル規格のポルトランド複合セメント（CP II E-32）です。この銘柄の市販袋は、建材店の商品情報やメーカー仕様を見る限り基本的に 50 kg 入り が標準です。 (Cimento CP II E 32 Saco de 50kg Tupi - Leroy Merlin, Cimento CP II E 32)

男性が腕に抱えている袋は 3 枚。したがって

50 kg × 3 ＝ 約 150 kg

程度を持ち上げている計算になります。

備考同じ銘柄でも 25 kg 袋の少量タイプが存在するという販売例もありますが、厚み・大きさが映像の袋より一回り小さいため、今回の映像のサイズ感（隣の人の腕や脚との対比）や、筋力自慢のデモという文脈から見て 50 kg 袋と判断するのが妥当です。仮に 25 kg 袋だった場合でも総重量は 75 kg であり、映像の重そうな扱い方とはやや整合しません。

(2025-05-01)

前置き​

結果​

最初に ChatGPT 4o に質問​

ChatGPT o3 の回答​

前置き

結果

最初に ChatGPT 4o に質問

ChatGPT o3 の回答