ChatGPT Images 2.0が勝手に「WHY ARE YOU LIKE THIS」の看板を追加した件

要約
Simon WillisonのTwitterでのやり取りから始まった興味深いエピソード。Scott(@scottjla)がChatGPT Images 2.0を使って「馬が宇宙飛行士に乗り、その宇宙飛行士がペリカンに乗り、そのペリカンが自転車に乗っている」という非常に複雑でカオスな画像を生成しようとした。プロンプトには「WHY ARE YOU LIKE THIS」という文字を含めるよう指示していなかったにもかかわらず、モデルが独自の判断でこの看板を画像に追加した。これはWillisonの「ペリカンが自転車に乗る」ベンチマークに対する返信として行われたテストだった。
洞察・気づき
このエピソードは、現代のAI画像生成モデルが単なる指示の実行者ではなく、ある種の「センス」や「ユーモア」を持ち始めていることを示している。ChatGPT Images 2.0が状況の奇妙さを理解し、それに対してコメント的な要素を自発的に追加したことは、AIが文脈や皮肉を理解する能力を持ち始めていることを暗示している。一方で、これは生成AIの「予期しない創造性」の例でもあり、ユーザーの意図しない要素が追加される可能性があることを示している。AIがより人間らしい反応を示すようになる一方で、制御可能性とのバランスが今後の課題となるかもしれない。