ChatGPT 4o/o3 の画像分析能力は、まだ期待するほどではない(がすぐに…)
· 8 min read

前置き
ChatGPT o3 のの画像分析能力の凄さが話題になっている。本日の別記事、
写真から場所の特定 :Trevor Rainbolt vs AI の画像認識
でも具体例を扱った。 そこで 50kg のセメント袋を 4つ抱えた男の写真を用いて、簡単なテストをしてみた。結果は期待外れだったが、すぐに人間を凌ぐようになるのは確実。そうなれば、様々な UFO 映像(特に昔の映像)の解析に役立つ筈。
結果
ChatGPT 4o も ChatGPT o3 も(4o と o3 という名前の付け方はイカれている)、不正解。
-
上の写真を最初に ChatGPT 4o に見せて、男が抱えている重量を質問したら 25kg * 4 = 100 kg と答えた。
-
次に ChatGPT o3 に同じ質問をしたところ、男が抱えているのは 3袋なので 150kg と答えた。
特に、ChatGPT o3 は先に ChatGPT 4o に同じ質問を受けていることを承知し、その回答も参照しているのに(推論途中の思考内容の表示からそれがわかる)、3袋だと断定して、間違った回答をしている。このミスの仕方は AI が単語 "strawberry" に含まれる 'r' の数を自信満々で間違えるのと似ている。