当前,尽管思维链(CoT,Chain-of-Thought)极大提升了大模型的逻辑推理能力,并让大模型能够逐步推导解决方案。
但是,这种链式思维模式采取一步一步思考的方式,在面对需要创造性思维的问题时会显得力不从心。
在探索如何解决这一难题时,中山大学教授林倞团队联想到人类解决问题时常有的“灵光一闪”(LoT,Leap-of-Thought)现象,于是尝试从创造性思维着手,来提升大模型的创造力。
图 | 左起:林倞、黄中展、钟珊珊(来源:课题组)
基于此,在近期一项课题之中,他们研究了大模型的 LoT 能力,探索了提升大模型创造力的新方法。
尤其探索了大模型的跳跃性联想能力和非传统推理思路能力,即如何让大模型超越逻辑链,实现更加灵活、更加创新的思考,以适应那些需要跳出常规思维框架的任务。
图 | 两种不同的思维示意图(来源:CVPR)
机缘巧合之下,该团队发现了 Oogiri 游戏这一平台。Oogiri 游戏起源于日本,通过提供各种多模态内容,能够提示玩家想出幽默的、有创意的反应,以达到令人惊讶的喜剧效果。
图 | Oogiri 游戏样例(来源:CVPR)
基于 Oogiri 的数据,他们也想探索如何让大模型生成幽默观点、进行跨领域联想、以及在没有直接线索的情况下提出新颖观点。
即如何通过使用 Oogiri 这种传统幽默喜剧游戏,来搭建提高大模型创新能力的平台。
在收集 Oogiri 数据的过程中,他们发现 Oogiri 数据来源不统一、而且格式多样。
于是,该团队综合使用光学字符识别、图片裁剪等方法,针对数据进行人工清洗和人工筛查。
借此将 Oogiri 数据整理成统一的问答格式,从而构建出多模态、多语言的 Oogiri-GO 数据集,并基于此来探索大模型的创造力。
但是,“灵光一闪”这件事情很难得到量化。因此,如何解决大模型创造力量化的问题,成为他们验证本次方法的关键。
后来,课题组基于 Oogiri-GO 设计了选择题和排序题,并以此作为评估数据,让大模型可以像做卷子那样完成评测。
图 | 本次方法生成的样例(来源:CVPR)
日前,相关论文以《让我们走出框框思考:用创造性幽默一代探索大语言模型中的思维跃迁》(Let’s Think Outside the Box:Exploring Leap-of-Thought in Large Language Models with Creative Humor Generation)为题发在国际计算机视觉与模式识别会议(CVPR,Conference on Computer Vision and Pattern Recognition)。
中山大学硕士生钟珊珊、中山大学博士生黄中展是共同一作,中山大学教授、IEEE Fellow 林倞担任共同通讯作者[1]。
图 | 相关论文(来源:CVPR)
总的来说,本次成果可以帮助人们开发更加智能、更加有趣的互动娱乐内容,比如自动生成幽默段子、编写创意剧本等。
当然,本次方法并不仅仅局限于幽默生成,还能用于研究大模型的创新思考能力。
课题组表示:“Oogiri 只是我们的研究平台,而我们的研究核心在于提升大模型的创造力。”
他们希望 LoT 思维模式能让大模型像人类一样具备跳跃式思考的能力。
下一步,他们计划继续针对大模型创造力开展研究,探索更多可以激发和衡量创造性思维的场景和任务。
并打算将本次框架应用于更广泛的领域,比如用于艺术创作和科学假设生成等,以便进一步拓展 AI 的能力。
同时,他们也将努力让大模型的创造性输出变得更加可控、更加人性化,以确保该技术是安全且负责任的。
参考资料:
1.https://arxiv.org/pdf/2312.02439
运营/排版:何晨龙
01/ 触碰科技边界,探索改变世界的无限可能!近80位科技领袖与青年人才一周后星耀上海
02/ 科学家揭示全新微生物代谢方式,硝酸盐去除率均接近100%,为废水反硝化提供新范式
03/ 科学家研发AI病理学大模型,受训于28个癌症中心3万病人数据,为病理学诊断打造新工具
04/ 石墨烯制备迎来新里程碑:科学家在无氧环境下造出石墨烯,成功弥合质量和可重复性的差距
05/ 浙大校友将Cas9基因编辑效率提升百倍,打造基因编辑通用型改造策略,助力治疗基因疾病