LLM AI (ChatGPT-4o) の意外な躓き
· 約16分
要旨
人間にとってはいとも簡単なことなのだが、ChatGPT-4o には幾ら説明しても全く理解できない具体例(下図)に出くわしたので取り上げる。
既に有名な話だが、
- 9.11 と 9.9 ではどちらが数値として大きいか?
この問題を多くの LLM AI は間違えて、「9.11 の方が大きい」と答える。また、
- "strawberry" という単語に r の文字は何個、含まれているか?
という簡単な質問にも間違える。
同様にして、人間にとってはとても簡単なことなのだが、ChatGPT-4o には幾ら説明しても全く理解できない具体例がある。
この具体例の文章返答だけを見ると ChatGPT-4o は如何にも深く理解していそうな口ぶりなので騙されるが、イラストを描かせると理解できていないことが明らかとなる。
このような簡単な間違いは、LLM AI が自らの(ロボットの)身体を使って物理的な相互作用の中で現実世界を学習しないと容易には解決できない筈。