認知シナジーフレームワークによる大規模言語モデルのユーモア生成技術

要約
大規模言語モデル(LLM)におけるユーモア生成は、標準的な訓練目標である「最も可能性の高い次の単語を予測する」ことが、コメディに必要な驚きや不調和と根本的に矛盾するため大きな課題となっている。この問題を解決するため、研究者らは心理学的ユーモア理論に基づく「Cognitive Synergy Framework」という新しい手法を提案した。この手法では、Mixture-of-Thought(MoT)アプローチを用いて、The Absurdist(不条理主義者)やThe Cynic(皮肉屋)など6つの異なる認知ペルソナを展開し、与えられたプロンプトに対して多様なコメディ的視点を合成する。このフレームワークで作成した理論的根拠のあるデータセットを使用して7Bパラメータの学生モデルをファインチューニングし、Direct Preference Optimization(DPO)と新しいOffline Group Relative Policy Optimization(O-GRPO)を比較した。その結果、7Bモデルは大規模な指示調整ベースラインを大幅に上回り、最先端のプロプライエタリモデルと競合する性能を達成した。
洞察・気づき
この研究は、AIによるユーモア生成という創造的タスクにおいて、単純にモデルサイズを拡大したりアライメントアルゴリズムを改善するだけでは不十分であることを示している。むしろ、人間の認知プロセスを模倣した多様なペルソナベースのデータキュレーションが最も重要であるという発見は、AI開発における新たなパラダイムを提示している。この認知的アプローチは、ユーモア生成だけでなく、創造性を要求される他のAIタスクにも応用できる可能性がある。また、比較的小規模な7Bモデルが大規模モデルを上回る性能を示したことは、効率的なAI開発の方向性を示唆しており、計算資源の制約がある環境でも高品質な創造的AIシステムを構築できることを意味している。この研究は、AIの創造性向上において心理学理論の活用という学際的アプローチの有効性を実証した重要な成果と言える。