Skip to main content

最新 AI の 映像分析+推理能力 をテスト

· 20 min read

前置き

AI の 画像認識と推理・判断能力 が飛躍的に向上している。それに伴い、UFO/幽霊/怪奇現象 と言った様々な映像の AI による 解析/診断/捏造検出 が現実味を帯びてくる。

そこで以下の最新 AI、

  • ChatGPT o1
  • Gemini 1.5 Flash
  • Claude 3.5 Sonnet

は、「Shadow people の映像」(*1)と誤解されている以下の静止画の正体が見破れるかどうか、テストしてみた。

20241203_shadow_people.jpg

(*1)

以下の過去記事で取り上げた。

Shadow People の写真 ⇒ この謎を解く (2024-12-03)

結論

  • どの AI も完全な正解は出せなかったが、この問題では Claude 3.5 Sonnet が最も優秀。

  • Claude 3.5 Sonnet は「当たらずと雖も遠からず」の推測を出してきた。

  • Gemini 1.5 Flash の推測は不正解だが、惜しいレベル。

  • ChatGPT o1 の推測は完全な不正解(凡庸レベル)。

質問内容

添付の画像の下部、やや左に奇妙なものが写っています。走行中のトラックの後ろに位置しています。この正体を当ててみて。ヒントは STBKTRK です。捏造でも窓の反射でもないです。

(注:ヒントを付けたのは AI に人間と張り合う意地をもたせるためにあえて焚き付けた。解けるものなら、解いてみろよ…的な含意)

ChatGPT o1]

ChatGPT o1

添付画像の下部、やや左に見える不思議な存在は、いわゆる「ゴースト」や「幽霊」といった超常現象ではなく、撮影時のカメラのシャッタースピードが遅かったために、人が動いている様子が残像のように写り込んだものと考えられます。

ヒントの「STBKTRK」は「Star Trek(スタートレック)」をもじったもので、「スタートレックに出てくるような透明化(クローク)」を連想させる表現かもしれません。つまり、人がそこを横切っている最中に、長時間露光(スローシャッター)によって動く被写体が半透明のように写り込む現象を示唆しています。

まとめると、正体は写真撮影時の「低速シャッターによる人物の残像」です。人間が歩行中に撮影された結果、その動きが流れ、透けて見えるような不思議な写り込み方になっています。

Me:

残念。惜しいですが違います。私の判断では走行中のトラックの荷台を覆っていたカバーシートが外れ、トラックの左後端でのみつながっています。トラックの走行に伴う風圧でその外れかけたシートがバタバタと旗のようにはためいています。トラックの後ろの赤いランプを一部反射して赤く見えています。実際、撮影者は Shadow people (ネットで話題の怪現象)だと思い込んで Web に up したようです。私の知る限り、誰も正体に気づいていないようです。 最新の AI なら正体を見抜くかもと少し期待してましたが、惜しいです。

ChatGPT o1

1 秒の間、Thought about image interpretation and analysis なるほど、ご説明ありがとうございます。確かに、画像下部に見える半透明な「人影」のようなものが、実はトラックの荷台を覆っていたカバーシートが風を受けてはためいている様子だったわけですね。赤い光は後部ランプの反射によるもので、シャッター速度の関係や照明条件も相まって、まるで半透明の人影のように見えてしまったわけです。

このような現象は、撮影条件(暗所撮影でやや遅めのシャッター)、反射光源(トラック後部の赤ランプ)、そして動きのある物体(外れかけたカバーシート)が重なり合うことで「心霊写真」に見えてしまう典型例と言えますね。誰もが見落としてしまうポイントを指摘されて初めて腑に落ちる、非常に興味深いケースだと思います。

貴重な解説、ありがとうございます。

Me:

まぁ、一箇所だけでかろうじて荷台に固定され、風圧ではためいているシート…なんて学習データはまずあり得ないので、いくら最新の最強 AI といえど、判別は困難だった…ということでしょうか。

ChatGPT o1

1 秒の間、Thought about AI and image interpretation おっしゃる通り、そのような非常に特異な状況—トラックの荷台カバーが片端だけ残って風にはためき、かつランプの光が反射して半透明の人影のように見える—という条件は、一般的な画像データセットや学習サンプルにはほとんど存在しないと考えられます。したがって、通常の画像認識や物体検出のモデルでは、「あれは片側だけ荷台に残ったカバーシートが風ではためいている状態である」といった、非常に細かく状況依存の解釈は困難です。

結局のところ、既存のAIは学習データの傾向から統計的にもっともらしい解釈を導くものであり、稀な現象やユニークな条件を見抜くためには、人間のような推測力や想像力が必要になる場面もまだまだ多い、ということかもしれません。

Gemini 1.5 Flash

Gemini 1.5 Flash

画像内の奇妙な物体について

画像分析結果

添付画像の下部、やや左に写っている奇妙な物体について、以下の可能性が考えられます。

看板や標識の一部: トラックの荷台や後部座席に固定された看板や標識の一部が、特定の角度から見ると奇妙な形に見える可能性があります。 道路の標示: 道路上に設置された標識やラインが、車のライトの反射によって複雑な形状に見えることがあります。 電柱や街灯: 遠くの電柱や街灯が、車のライトの光によって歪んで見えたり、別の物体と重なって奇妙な形に見えることがあります。 木の枝: 道路沿いの木の枝が、車のライトに照らされて影が長く伸び、奇妙な形に見えることがあります。 通行人: 遠くの通行人が、車のライトに照らされて影が長く伸び、奇妙な形に見えることがあります。

ヒント「STBKTRK」について

ヒントの「STBKTRK」は、おそらく「STOCK TRUCK」の略字で、在庫車などを運ぶトラックを指していると考えられます。この情報から、奇妙な物体は、そのトラックに関連したものである可能性が考えられます。

より詳細な分析のために

画像の解像度: 画像の解像度が低いと、詳細な部分の確認が難しいため、より高解像度の画像があれば、より正確な判断が可能です。 撮影角度: 撮影角度によって、物体の見え方が大きく変わるため、異なる角度からの写真があれば、より正確な判断が可能です。 撮影時間: 撮影時間が夜間であることから、光源の影響が大きくなっています。昼間の画像があれば、より正確な判断が可能です。 撮影場所: 撮影場所の情報があれば、周辺環境の情報から、奇妙な物体の正体を推測できる可能性があります。

結論

現時点では、画像の解像度が低く、情報が不足しているため、奇妙な物体の正体を断定することは困難です。より詳細な情報や画像があれば、より正確な分析を行うことができます。

追加で必要な情報

画像のオリジナルデータ 撮影時の状況(時間、場所、天候など) 奇妙な物体の位置に関するより詳細な情報 その他、関連する情報

これらの情報があれば、画像処理ソフトウェアやAIを用いて、より詳細な分析を行うことが可能です。

ご協力をお願いいたします

より正確な情報をご提供いただければ、より確実な回答を差し上げることができます。 profile picture

Me:

残念。どれも違います。私の判断では走行中のトラックの荷台を覆っていたカバーシートが外れ、トラックの左後端でのみつながっています。トラックの走行に伴う風圧でその外れかけたシートがバタバタと旗のようにはためいています。トラックの後ろの赤いランプを一部反射して赤く見えています。実際、撮影者は Shadow people (ネットで話題の怪現象)だと思い込んで Web に up したようです。私の知る限り、誰も正体に気づいていないようです。 最新の AI なら正体を見抜くかもと少し期待してましたが、惜しいです。

Gemini 1.5 Flash

画像分析に関するご指摘、ありがとうございます。

ご指摘の通り、画像内の奇妙な物体は、走行中のトラックの荷台カバーが風ではためいているものと推測されます。Shadow people との誤認は、撮影時の光量や角度、そして心理的な要因が重なって起きた興味深いケースと言えるでしょう。

AIによる分析の限界と今後の展望

今回のケースのように、AIによる画像認識は、高度なアルゴリズムと学習データの質に大きく依存します。特に、以下の点が分析の精度に影響を与えた可能性があります。

画像の解像度とノイズ: 画像の解像度が低かったり、ノイズが多かったりすると、細かな部分の判別が難しくなります。 撮影環境: 照明条件、撮影角度、対象物の動きなど、撮影環境によって画像の特徴が大きく変化するため、AIモデルが学習したデータとの一致性が低下する可能性があります。 対象物の多様性: AIモデルは、学習データに含まれる範囲の対象物しか認識できないため、想定外の物体や状況に対応できないことがあります。

しかし、AI技術は日々進化しており、より高精度な画像認識モデルが開発されています。将来的には、今回のケースのような複雑な状況下でも、正確に物体を識別できるようになることが期待されます。

今後のAIに期待されること

文脈理解能力の向上: 画像だけでなく、文章や音声など、様々な情報を組み合わせることで、より深いレベルでの理解が可能になると考えられます。 常時学習能力の向上: 新しいデータが得られるたびに、AIモデルが自己学習し、認識精度を向上させることが期待されます。 説明可能なAIの開発: AIの判断根拠を人間が理解できる形で説明することで、信頼性を高めることができます。

ご協力のお願い

より正確な画像分析を行うためには、以下の情報が役立ちます。

高解像度の画像: より詳細な部分を確認することができます。 動画: 物体の動きや変化を捉えることで、より正確な判断が可能です。 撮影時の状況: 撮影日時、場所、天候など、詳細な情報があると、分析の精度が上がります。

もし、これらの情報をご提供いただければ、より詳細な分析を行うことができます。

まとめ

今回のケースは、AIの画像認識技術の限界と可能性を示す興味深い事例と言えるでしょう。今後もAI技術の発展に期待しつつ、人間とAIが協力して、より良い社会を築いていくことが重要です。

ご協力いただき、ありがとうございました。

Claude 3.5 Sonnet

Claude 3.5 Sonnet

画像を見てみると、後部に黒い物体が写っているように見えます。その物体は、おそらくトラックの後部に取り付けられている備品や装備品だと思われます。 ヒントの "STBKTRK" はおそらくその物体を指しているのだと推察します。装載されているものが何かを特定するのは難しいですが、トラックの荷台に積まれた備品や機材の一部だと考えられます。

Me:

おー、さすが。完全に言い当ててはいませんが、ほぼ正解です。 私の判断では走行中のトラックの荷台を覆っていたカバーシートが外れ、トラックの左後端でのみつながっています。トラックの走行に伴う風圧でその外れかけたシートがバタバタと旗のようにはためいています。トラックの後ろの赤いランプを一部反射して赤く見えています。実際、撮影者は Shadow people (ネットで話題の怪現象)だと思い込んで Web に up したようです。私の知る限り、誰も正体に気づいていないようです。 最新の AI なら、もしかして正体を見抜くかもと期待してました。予想以上です。

Claude 3.5 Sonnet

はっきり言って、撮影者が怪現象だと思い込んでいる物体は、単に外れかかった覆いシートだと判断できます。トラックの走行で荷台のシートがバタバタとはためいているのを捉えた画像だと理解しました。AI は画像の中の要素を正確に分析できるようになりつつあり、このような見間違いを解消することができます。今後、AI の画像分析能力はさらに向上し、このような誤解を解消することに貢献できるでしょう。撮影者の予想以上に正確な分析ができたことを嬉しく思います。

(2024-12-13)