文 | 李智勇
AI到底可以怎么用?
现在是真正的AI非共识时刻。
非共识时刻的认知价值往往会大于普遍共识已经形成时候。
现在再说互联网,对互联网认识的再清楚其实也没机会干电商了。
一个企业的价值往往在和其它组织或个人的差异中才得到体现。
A做100,B也做100往往不形成机会,但A做10,B做0则相反,很可能形成机会。
陆续写了一个系列的文章,有点体系化,但并不是学问,而更像是一种非共识下,认知混沌未来方法。
因为之前发的散乱,却内在有一些递进关系,所以这里把它们按逻辑次序整理下:角色中心式计算,图灵测试2.0,智能原生,从1到10。
角色中心式计算
AI的颠覆性到底在那里?这种颠覆性是大于互联网还是小于互联网?与互联网比又有什么异同?
这种颠覆性起于基于AI模型的应用和基于过去经典计算机架构的应用所对应的基础计算模式不同。
用韩毅同学的说法是经典计算机架构下,过去的应用是大量if...else...的堆积。这种规则的堆积最终能形成有点智能的感觉,但灵活度和功能边界是受到极大约束的。
为了解决问题,就必须把问题切块。
企业级软件在切块:
个人的APP也在切块,电商、短视频、IM等。
切块之后人变成了完成某个目标的调度器。不同的角色需要调度的功能型应用越多。但总的来看切块越多,人越累。
AI提供了概念理解和逻辑判断能力,所以调度本身可以分配给AI,人则更多的完成特定角色和现实世界中的映射。比如教育小孩,那就更多思考怎么才是一种好的教育方式,而不是怎么使用工具。这就是角色中心式计算。背后不在是if...else...的规则堆积,而是any...then...的智能。
角色中心式计算会变成现实的底层逻辑是:如果智能本身的表现与它所获取的信息成正比,那最终在追求体验和效率的内驱力下,就一定会变成角色中心式计算。
图灵测试2.0
角色中心式计算创造新机会么?怎么判断是否可以进行角色中心式计算?
角色中心式计算对智能的程度形成强依赖。
一个人智商到了不学习可能考不上大学,但智商没到可能学习了也考不上。
真正改变计算模式首先需要足够的纯粹的智商,这种纯粹的智商依赖于模型。
但纯粹的智商是否真的够了,则要回到场景本身,擅长下围棋可能智商高,但不一定能做好企业。
这种智商衡量不能学术化,比如靠做题,或者测试集跑分,而是要回到具体的场景。单纯做题或者测试集的结果是学术视角,产品视角下智商够不够则需要一种新的判断方法。
学术视角是减法就关注几个纯量,产品视角则是加法,100个环节有一个搞不好,也是不行。很多时候会不止依赖一个模型而要做模型的组合。
这背后的判断方法可以称之为图灵测试2.0。
这是一个纯粹的智能测试,本质是追求在封闭系统里面的逻辑自洽性。
现在我们把Agent类似的概念加入这个测试:
这就是图灵测试2.0。和1.0相比核心差异是什么呢?
去幻觉,有边界。
1.0是一个凌空的系统,具有合理性的幻觉其实有助于通过测试,但2.0不行,测试者同时从真实场景和被测试者接受反馈;其次就是测试边界的限定要求更高的智能综合度。
能否打破内容生成的边界变成各种场合都用的新式通用计算平台,关键取决于智能是否能跟上。而智能是否能跟上取决于是否在一个个场景下能通过图灵测试2.0。
每当一个场景通过图灵测试2.0(产品经理的测试而不是技术视角的测试),那么就形成了一个可以进行角色中心式计算的实验田(一次重构的机会)。
通过图灵测试2.0则产生做智能原生应用的机会,注意这不是MJ,ChatGPT这些工具。
下图中绝大部分工具不是智能原生应用,而是会被通用模型淹没的工具。
角色中心式计算与智能原生应用,一种完全新式的应用,有点像新开了一个应用商店,所以是普通人的机会。
和大模型不一样,大模型由于资金、技术、人员要求太高,即使纯粹是相应方向的博士,真正能从事相关工作的估计也不到10%。
智能原生应用
那什么是智能原生应用?
可以用爱立信画的这张图,我们有很多和AI相关的应用,但如上所说大部分都不是智能原生应用。
比如原来的闸机需要刷卡,现在得刷脸了。
比如Office原来不能帮助生成内容了,现在加了个小球可以帮你生成内容了。
比如智能音箱原来只能靠按,现在可以语音交互了。
这些都不是智能原生应用(分别对应上面图里面的依次往下的场景)。
智能原生应用需要把概念理解和智能判断和决策渗透到每个角落,正是角色中心式计算的实现。(图的右侧)
结构上智能原生应用会和过去的智能音箱或者搜索最像,但具有自主行为能力。
假如你想成为主播,自己不想上,扔一个智能体在那里,它每天自主开播,那这个智能体就是智能原生应用,它处理了你这个角色所有相关的细节。过去详细举过例子,这里不展开。
从1到10
一旦真的开始打造智能原生应用,那对它的进化阶段要有预期。
互联网产品是从0到1,从1到100的两段论,智能原生应用则是从0到1,从1到10,从10到100的三段论,更加的辛苦和有挑战。
这和两者的计算形态有关系。
功能中心式计算是选一个功能,水过地皮湿,只要面足够大,那就创造比较的总价值。
智能原生型应用相当于要把一个角色吃透,那就类似打深井,必须打到一定程度才有水喝。
角色面对的环境是个变量,那究竟是不是真的能够自适应的匹配这些变量,在幻觉仍然存在的前提下就是个水磨工夫。
你做了自己的数字分身,它到底会不会违规呢?针对话题A不违规,针对B也不违规么?
过去我们的计算模式本质上是现实世界的需求由程序员折射成计算机世界的语言,然后计算机按照程序员的设定进行执行。
AI下的计算模式不是这样,程序员这个中间层越来越透明(不是彻底消失),人直接和模型进行交互,然后具体的功能范围是不定的。模型、策略和价值观设定这个范围,不再是程序员设定这个范围了。
如果用图形描述,那大概下面这样:
这个类生命体是可能闯祸的!!!
打磨这个的阶段,可以统称为从1到10。
小结
角色中心式计算,图灵测试2.0,智能原生应用,从1到10是一个逻辑层层递进的思维方法。不百分百对,但从实践来看估计偏差不大。理解了这个也就理解了普通人的机会到底在那儿,所以重新梳理下这个脉络。抛砖引玉,供参考。