科学家用Oogiri游戏提高大模型创造力，能自动生成幽默段子和编写剧本

当前，尽管思维链（CoT，Chain-of-Thought）极大提升了大模型的逻辑推理能力，并让大模型能够逐步推导解决方案。

但是，这种链式思维模式采取一步一步思考的方式，在面对需要创造性思维的问题时会显得力不从心。

在探索如何解决这一难题时，中山大学教授林倞团队联想到人类解决问题时常有的“灵光一闪”（LoT，Leap-of-Thought）现象，于是尝试从创造性思维着手，来提升大模型的创造力。

图 | 左起：林倞、黄中展、钟珊珊（来源：课题组）

基于此，在近期一项课题之中，他们研究了大模型的 LoT 能力，探索了提升大模型创造力的新方法。

尤其探索了大模型的跳跃性联想能力和非传统推理思路能力，即如何让大模型超越逻辑链，实现更加灵活、更加创新的思考，以适应那些需要跳出常规思维框架的任务。

图 | 两种不同的思维示意图（来源：CVPR）

机缘巧合之下，该团队发现了 Oogiri 游戏这一平台。Oogiri 游戏起源于日本，通过提供各种多模态内容，能够提示玩家想出幽默的、有创意的反应，以达到令人惊讶的喜剧效果。

图 | Oogiri 游戏样例（来源：CVPR）

基于 Oogiri 的数据，他们也想探索如何让大模型生成幽默观点、进行跨领域联想、以及在没有直接线索的情况下提出新颖观点。

即如何通过使用 Oogiri 这种传统幽默喜剧游戏，来搭建提高大模型创新能力的平台。

在收集 Oogiri 数据的过程中，他们发现 Oogiri 数据来源不统一、而且格式多样。

于是，该团队综合使用光学字符识别、图片裁剪等方法，针对数据进行人工清洗和人工筛查。

借此将 Oogiri 数据整理成统一的问答格式，从而构建出多模态、多语言的 Oogiri-GO 数据集，并基于此来探索大模型的创造力。

但是，“灵光一闪”这件事情很难得到量化。因此，如何解决大模型创造力量化的问题，成为他们验证本次方法的关键。

后来，课题组基于 Oogiri-GO 设计了选择题和排序题，并以此作为评估数据，让大模型可以像做卷子那样完成评测。

图 | 本次方法生成的样例（来源：CVPR）

日前，相关论文以《让我们走出框框思考：用创造性幽默一代探索大语言模型中的思维跃迁》（Let’s Think Outside the Box：Exploring Leap-of-Thought in Large Language Models with Creative Humor Generation）为题发在国际计算机视觉与模式识别会议（CVPR，Conference on Computer Vision and Pattern Recognition）。

中山大学硕士生钟珊珊、中山大学博士生黄中展是共同一作，中山大学教授、IEEE Fellow 林倞担任共同通讯作者[1]。