题图|视觉中国
人人都是内容创作者。无论是你打工要汇报PPT,还是上学要撰写文章,都需要经历“内容生产”环节。
随着人工智能技术的发展,内容创作领域正经历一场革命,AI工具可以很大程度上帮我们设计PPT、生成专业长文。
但仔细一想,现有的AI工具似乎陷入“帮了,但没完全帮”的困境。
专业工具功能强大,但往往因为较为复杂,生成过程对指令技巧要求较高,对用户来讲学习成本和门槛也比较高;而集合类AI工具操作简单,但其功能不够精细,产出的内容大都是无效、泛泛而谈的,缺乏个性化、定制化的内容。举个例子,如果现在让手机里的AI助手生产出一篇结构完整、资料详实的专业报告。试过的都知道,可谓是异想天开了。
这也造成了在AI时代,不少内容创作者,看似工具多多,但似乎挑不到一件趁手的。
百度文库尝试给出了解法。在刚刚过去的2024虎嗅F&M创新节上,百度文库AI产品负责人钟昊介绍了百度文库重构为“一站式AI内容获取和创作平台”后的全新进展。
在钟昊看来,理想的内容生产创作有三大特征:端到端交付、纯自然交互和全模态支持。具体到操作层面,就是能在一个平台上生产完整的内容、用户用最自然的交互即可实现编辑意图(无需学习复杂的操作)、支持对不同模态素材的加工创作。
而理想的内容生产创作,应该如何落地实现?AI时代,百度又是如何打造爆款内容生产力工具的?钟昊也给出了一一解答。
“进击”的百度文库
在大模型最初火热之时,百度创始人李彦宏就说要用大模型把所有应用重做一遍。而重构的技术基础就是文心大模型。
而在内容生产创作领域,大模型的AI能力主要体现在两部分,一是跨模态AI生成能力,它让不同格式的处理和转换畅通无阻;二是全场景智能交互能力,它让AI能够理解用户的指令,并实现自然的交互。
早在2023年3月份,百度文库团队就开始投入重构。作为一个15年历史的产品,百度文库拥有14亿的文档资源,是内容创作的宝贵原料,而光有内容还不够,百度文库希望让用户可以实现一站式的内容获取、生产、编辑全流程贯通。
所以,从2023年5月份开始,百度文库开始进行融合编辑器的建设。而融合编辑器要给用户带来自由的感受,意味着其必须是跨模态(在计算机与人工智能领域,“模态”可以大致理解为“数据类型”)的。
“专业的编辑器功能很多,但其中可能有80%-90%日常都用不到。用户一旦要用到,还要现学,学习成本太高了。我们希望能让大模型直接能听懂我们想要什么。”钟昊说。
比如,如何让产品更好地理解用户的指令?如果用户对生成结果不满意,能不能局部修改?怎么让用户体验更丝滑?文库团队希望能给用户创造更大的自由度。
所以,文库团队在模态融合、前端交互和自然语言处理上下了大量功夫。比如在自然语言处理上,团队不断进行用户调研,聆听用户对市面上Chatbot(聊天机器人)使用难点的反馈,并基于此不断优化,让用户无需学习复杂的操作,无需操作层层叠叠的按钮和界面,就能自然实现自己的编辑意图。
经过持续打磨、拓展和细化,百度文库的全模态AI能力矩阵进行了全面的进化升级,实现了更多、更全面场景的覆盖。尤其是在智能PPT、智能文档、行业研究报告、AI全网搜索、智能有声画本、智能小说、智能漫画、拍图生文等核心能力上持续优化,涵盖学习办公、家庭教育、兼职赚钱多场景。
百度文库全模态AI能力矩阵
比如,在学习办公场景下,百度文库的专业搜索功能在提供优质信息外,还能将搜索的信息以结构化的、图表的形式呈现出来。例如针对“小球藻CGF活性因子提取方法”的专业内容搜索,文库能够提供详细的实验方法、流程描述以及相应的注意事项,并且还会将提取方法中的每个步骤详细拆解,生成直观的流程图。
并且,与其他搜索工具相比,百度文库的AI搜索引用源更加丰富,一方面参考了全网的海量信息,另一方面还充分引用了文库中多达14亿的专业内容文档,同时也涵盖了百度学术的相关内容。
“扎实且全面的知识库,对攻克大模型“幻觉”问题很有帮助。”钟昊介绍道。大模型存在一个普遍问题——会产生 “幻觉”,也就是生成的内容可能存在不符合事实的情况。而百度文库在近一年的AI重构过程里,始终聚焦该问题。
百度文库的另外一个明星AI功能就是智能PPT,一经推出就很受欢迎,迅速占领了智能PPT领域的市场,目前,其市场占有率已经达到80%,稳居第一。在其他公司只能生成PPT大纲或草稿时,百度文库就已经可以通过一句话主题、上传文档、上传草稿等多种形式,生成图文内容丰富、结构完整、版式布局专业精美、直接可用的PPT,还能让用户上传自己的模版,模型理解后生成PPT,大大节省了用户在PPT排版和美化上花费的时间。
在家庭教育场景,百度文库推出了“智能画本”功能,让家长可以制作画本给小朋友阅读。孩子不认真写作业怎么办?智能画本就会生成一个寓教于乐的画本大纲,再根据大纲生成配有多种声音可选择的画本视频,还将支持用户自定义自己的声音。同时,家长甚至可以通过上传照片,定制以孩子形象为主角的画本,孩子看到自己成了画本故事里的主角,代入感也会更强。这个功能在推出之后,非常受家长们的欢迎。
在兼职赚钱场景,百度文库通过智能漫画、智能小说等跨模态AI创作功能,帮助人们更容易地将创作内容商业变现。AI拍图生文功能则能够满足用户在小红书、闲鱼等平台的推广文案创作需求,为兼职创作者提供一站式创作支持。
同时,在专业创作领域,百度文库推出了全新的AI Native产品“橙篇”,是行业内首个集专业知识检索与问答、超长图文理解与生成、深度编辑和整理的一站式AI自由创作平台。
橙篇最大的亮点就是长文写作功能。背靠百度文库、百度学术以及全网数十亿的专业信息和资料,橙篇在生成长文时能提供专业、权威、准确的知识依据,而且在专业长文生成和自由编辑方面,橙篇也都走在行业前列。
目前,百度文库的AI MAU(月活跃用户)已突破7000万,达到国内第一梯队。在大模型重构以来,百度文库已然从一个文档共享平台成功进化为 “一站式AI内容获取和创作平台”。截至2024年10月,百度文库AI用户数累计超过2.3亿,AI功能累计使用次数超过28亿。
“自由”的创作工具
在重构一年多以来,百度文库团队也一直在思考,如何打造一款高自由度、集成化的工具,能够破除跨平台、跨格式的限制,让用户实现更加低门槛、随心所欲的创作。
大会上,钟昊向观众介绍了“自由画布”,这是百度文库和百度网盘联手推出的AI创作新物种,并即将全面开启公测。
在自由画布诞生之初,文库团队就定下了这款产品的底色:自由。百度文库一站式的产品定位,以及融合编辑器的持续迭代,成为“自由画布”诞生的土壤。
对于自由画布的核心竞争力,文库团队给出的答案就是:“多格式、全模态”,并且贯穿在内容生产到消费的每一个环节。
比如以前,用户日常接触到的格式多达100多种,让产品能识别、理解、并展示市面上全格式的内容,并不是件容易的事。比如,用户写文章要用Word,编辑图片要用Photoshop,做PPT要用PowerPoint,处理不同格式的文件时,还要在不同平台不停地切换、跳转,繁琐且耗时。
但自由画布做到了。“我们需要一款工具,能像我们的大脑一样,可以处理全模态的信息。画布里面的格式、模态和编辑器都是充分自由的,无论是Word、PPT还是音频、视频都能拖入画布,这样边界就不存在了,自由画布都能识别、处理。”钟昊说。
在自由画布上,融合编辑器的能力也得到了飞跃,易用性大大提升:用户通过“一拖一圈”,就能实现对内容的整体或局部调用;使用最简单的交互,就能“指哪改哪”,让自由画布去做局部内容的修改,无需亲自修改编辑和排版。
以前段时间火热的山西旅游为例,在创作山西大同相关内容时候,用户可以将有关大同的音频、图片、视频等素材导入自由画布,进行后续的AI创作。用户可以标记这些素材里的重点部分并决定使用方式,通过直接圈选、输入指令等,即可生成大同攻略海报、小红书文案等不同格式的内容。在此基础上,用户可以进一步实现格式的流转,还能进行一键链接分享,或者直接存储到百度网盘。
操作极简、高度自由、功能强大,自由画布做到了“工具是为人服务的”,也真正满足了端到端交付、纯自然交互和全模态支持的特征。
下一步去哪?
自由画布,凸显出百度文库强大的AI能力,也透露出百度文库和百度网盘借助AI能力进一步打通、重构的可能性。
作为“AI创作新物种”,自由画布可以说是百度文库和百度网盘融合的“第一步”。作为两个国民级的应用,一个有着大量的公域资料(百度文库的14亿在线文档),一个有着大量的私域素材(用户个人授权的网盘存储内容),打破了私域与公域资料的界限,创作将更自由、更个性化,让两个十余年的老牌产品,蜕变成智能生产力的代表。
在未来,大模型还能给这两个产品的融合带来哪些可能性?
百度文库和百度网盘的融合将走向何处?答案或许逐渐清晰。