胡郁:科大讯飞联合创始人谈人工智能时代的创业趋势

发表时间: 2023-12-05 10:06

过去半年,ChatGPT席卷全球,所有人都惊异于AI技术出现的“涌现”能力。无数的“AI+”应用诞生、无数的科创公司成立,行业巨头们纷纷把开发大模型提上日程,小微企业都在努力优化经营与组织结构。人工智能会对商业会产生什么影响,又会带来哪些创业新方向?


在嘉宾派杭州站访学期间,嘉宾商学未来研究院院长、科大讯飞联合创始人胡郁为嘉宾派校友们带来了主题为《新时代人工智能带来的商业生态系统范式转移及应对》的授课,讲述自己对人工智能的理解和观察。以下为授课精编版,Enjoy~



在中国新的时代背景下,科学技术应当与产业、商业结合在一起。大国的崛起、民族的复兴,由政治、军事、科技、经济、文化、艺术等方面依次进行。政治上觉醒后,军事上能守住自己,科技和经济发展起来,中国的文化和艺术就会变成世界上最好的,让大家看到中华文明的魅力。


当前整个世界正处在新一轮范式转移的过程中。这个过程提供了弯道超车和换道超车的可能性,弱小的有可能超过强大的,强大的有可能变得更强大。在我自己的研究领域,我把它归纳成为信息与智能,即数字化、信息化、网络化、智能化这条路线。这方面我将跟大家分享过去25年积累的一些经验。


不管我们创业,还是生活,不外乎寻求真相和真理,这是一种价值观的表现。我们在工作中或者人际交往中遇到的各类问题,归根结底就是真相到底是什么。因为真相永不可得,所以要通过听取大量的陈述。真理是客观世界底层的运行规律。通过总结归纳在创业、生活过程中犯过的错误、得到的经验,获得底层逻辑和本质认知,这就是我能得到的真理。


今天我主要讲5个方面的内容:


第一个方面是人工智能的发展历程和最新的进展。

第二个方面是探讨关于商业生态系统的演变规律及其过程。

第三个方面是讲人工智能带来的商业生态系统的范式转移。范式转移可以用在很多的方面,比如研究的范式转移、商业的范式转移、管理的范式转移,甚至是整个社会的范式转移。近十年以来,我们在考虑PC互联网时代和移动互联网时代以及智能物联网时代的商业生态系统如何发生范式转移。

第四个方面是关于人工智能未来创业浪潮走向何方。

最后一个方面是关于未来科技型创新创业公司应该是什么样子,新时代的创新创业应该怎么样才能够符合当前的趋势。

前面两个部分是预设和准备,第三个部分是核心内容,最后两个部分是答案和展开。


嘉宾商学未来研究院院长、科大讯飞联合创始人胡郁在嘉宾派授课


1、人工智能的发展历程和最新的进展


大众眼中的人工智能和真正研究人工智能的专家、科学家眼中的人工智能可能是不完全一样的。最早向大众灌输人工智能思想的是科幻作家、科幻片导演,但科学家的人工智能是另外一条道路。


在人工智能的历史进程中出现了三次浪潮,其底层逻辑符合两个方面,一是Gartner技术成熟度曲线,二是人的认知曲线。



在Gartner技术成熟度曲线方面,Gartner每年都会发布关于技术成熟度曲线的报告,指出哪些技术处于刚开始发热阶段、泡沫的顶端,以及跌落的低谷,哪些会后面逐步成熟,我们会发现,每一次的人工智能浪潮,基本都符合这个曲线。


在人的认知曲线方面,第一阶段是人不知道自己不知道,这时处于愚昧之巅;第二阶段是人知道自己不知道,这时会从愚昧之巅跌入深谷;第三阶段是人知道自己知道并开始反思,开始慢慢爬坡;最后一个阶段是人不知道自己知道,这时便处于真正的较高的水平。每一次浪潮,无非是从个人认知变成整个社会的群体效益。


1936年图灵提出“图灵机”;随后冯诺依曼提出CPU、内存和硬盘的三级存储和执行架构;1946年世界上第一台电子数字计算机ENIAC被发明;1956年达特茅斯会议首次提出人工智能的概念;1957年Perceptron神经网络软件发明、Logic Theorist出现,达到第一次浪潮的高峰;1970年到1980年人工智能进入第一次冬天。


70年代微软、苹果、英特尔成立;80年代苹果和微软分别发布Macintosh(麦金塔)OS和Windows操作系统,掀起个人电脑热潮;随着日本第五代计算机计划失败,以及美国星球大战计划的停止,2000年左右人工智能陷入第二个谷底。但中国863计划在90年代末测试和定型,造就了中国人工智能公司第一次创业浪潮。


2006年Hinton的深度学习论文掀起人工智能第三次浪潮。2012年Ilya Sutskever设计出基于DNN的神经网络算法Alex Net,奠定了深度神经网络在图形学图像学方面的霸主地位。2012至2014年,众多机器视觉公司创立,我在讯飞提出了把人工智能按照表现分为四类,即运算智能、感知智能、运动智能和认知智能。2016年AlphaGo战胜李世石,2017年战胜柯洁。2019年我提出用AI Agent这个概念去引导下一代商业生态系统范式转移的可能性。2022年年末OpenAI出现,让大家相信人工智能在某些领域的突破。



运算的核心在于存的多算的快,例如AlphaGo就是运用了存得多算得快的特点。而人类的大脑结构不是为了运算智能设计的,所以人类发展了数字计算机以弥补和完善该能力的缺失。



碳基生物需要的首先是感知智能。感知智能的一个很简单的定义是,眼观六路、耳听八方,主要体现在包括图像识别、语言识别、语音识别等方面。



运动智能包括智能运动和智能移动。智能运动就是我们能通过神经控制自己的肌肉,而智能移动要解决“地图”和“导航”的问题。生物的智能运动发展的顺序是先有运动神经,然后发展出呼吸和消化。到了寒武纪生命大爆发,生物长出眼睛和耳朵,有了感知,因此运动变成一种反馈系统。多细胞变成浮游生物、鱼类、两栖类、爬行类,最后变成哺乳动物,通过感知周围的世界来控制个体的运动,形成闭环。所以感知智能和运动智能是人和动物在进化的过程中不断的发展出来的。



人类和动物的本质区别不在于人类会用火,也不在于人类会用工具,而是人类发明了语言。《人类简史》中介绍了基因考古学的研究结果——非洲的智人走出非洲以后,把欧洲的尼安德特人、中国的直立人、东南亚的梭罗人等猿人灭绝了,成为了地球的主宰。因为他们掌握了语言,而语言发挥了三个作用,一是让人类能更好的描述周围的信息;二是人类可以组织超过50人的团队,以更大的规模去攻打其他的猿人;三是通过语言可以把人们想象的东西描述出来。


2014年我提出认知智能的概念,它表示语言的理解、知识的表达、逻辑推理和最终决策。不断发展的脑科学提供了感知和认知组合的科学依据。人类和动物都有感知智能和运动智能,但认知智能是人类独有的,所以人类成为了主宰。人类和动物都缺少的是运算智能。



人类发明计算机弥补了人类在运算智能上能力的缺失。如何实现这些智能分为几大派别,分别为符号主义,行为主义或者连接主义。从行为主义的角度来看,我对它的一种分类,其实就是从智能的行为上来分类的。


人工智能的实现方法现在基本已经统一到深度神经网络。神经网络的参数巨大、训练样本很多、训练速度很快。在某些感知智能、运动智能、认知智能方面,神经网络达到了我们人类一样的表现,但机理并不完全一样。



人类基因图谱计划完成后,美国推出brain initiative计划,欧盟推出human brain project,中国启动脑计划。全脑模拟就是把人脑860亿个神经元、15万亿个竖突和轴突的连接全部复原出来,再用PET-CT正电子CT和fMRI功能性磁共振,把血液、血氧的流动全部模拟出来,用超级计算机像模拟核聚变和模拟全球气候一样来模拟人脑。全脑模拟如果成功,将为数字化生存提供可能,但将带来一系列伦理问题。



我们很多学科里有很多动力学,如分子动力学,电磁动力学,流体力学和空气动力学。人类在实现一个目标时,大多时候是工程先行,而不是理论先行。早期的鸟飞派认为只要尽力模仿鸟就可以实现飞行,而真正让人类学会飞行的是钱学森的老师冯·卡门,他在40年代建立了空气动力学。


大脑的学习包括四个层面,一是Architecture 和infrastructure,二是scalability,三是学习方法论,四是学习的素材。深度神经网络在某些方面已经掌握了大脑非常复杂的原理。智能与我们人在学习推理过程中的神经网络结构、规模(100亿个节点还是10亿个节点,还是1000亿个节点)、学习方法论(无监督学习、有监督学习、强化学习)、学习的内容(文字、图片)、知识智能(像ChatGPT一样通过阅读图文来学习知识)和具身智能(通过跟环境的互动过程-如站在这个位置拿桌上的水,来学习经验和常识)有关。如果我们把人脑的原理弄清楚,受此启发,但不是完全的重复,那么在上述四个层面的基础上,数字电脑通过掌握了人类学习的方法论,同时有比人脑要快很多的运算能力,那么有可能创造出超脑。


通过学习被人类标注信息的有因果关系的大数据,深度神经网络取得巨大成功。但容易被忽视的是学习的过程,一个有学习能力的电子脑,必须在真实的应用环境下去学习。但如果这个电子脑不好用而没有人使用,那么就收集不到机器学习需要的数据,没有数据就没内容可学,电子脑就永远达不到好用的水平。也就是说需要一个研究、工程、产品、用户的迭代过程。


跨越鸿沟的理论可以做相应的解释。一个新技术,特别是人工智能技术进入到人群的时候,首先使用的一定是那类尝鲜的用户,这类人会贡献数据与经验。当系统能够自我学习,就像水波纹扩散出去,使用人越来越多,收集的数据也越来越多,系统性能越来越好,它的震动就越来越小(震动是错误率)。当扩散到越来越多的人时,错误率不断下降。最后使用的大众人群在第一次使用时的感觉就会特别好。自动驾驶、图像、语音基本都要遵循这个规律,即要符合研究-工程-产品-用户的闭环迭代进程,我把它称为“涟漪效应”。



人工智能的两个应用方向,一是交互,它可以用在各种各样的人机交互的领域;另一个是让机器学习专家知识,形成了医疗、法律、教育等各种各样的方向的专家系统。


深度神经网络的历史可以追溯到1943年提出的神经元数学模型;1957年单层的感知机被提出;1969年明斯基证明神经网络在单层情况下无法解决异或逻辑问题;1986年出现了反向传播方法;1999年的时候,Yan Lecun提出的CNN卷积神经网络,成功在美国邮电系统实现邮政编码识别;1997年LSTM被提出;2006年Geoffrey Hinton发布文章。



2006年以后,深度学习继续在三个方向得到了快速的发展。


第一条主线是无监督深度学习结构,重点是能够自主无监督的学习,具身智能就属于这种,它不需要人为地标定监督信息。第二条主线是监督深度学习结构,从ReLU到DCNN,直到2014年发展出能够处理串行数据的Encoder-Decoder,到2017年提出了Transformer架构。这个过程中,还有一个非常重要的概念Attention,它可能与人类的注意力机制有一定的关系,该机制处理了人类在语言里面经常会出现的乱序问题。这两条线描述的是智能训练四个模块里的结构差异,这些不同的结构,有的能进行有监督学习,有的能进行无监督学习。


另一条主线是学习方法论,即优化算法,2006年使用的是SGD,在优化里常用的方法,如统计梯度下降法,像dropout、ADAM、Batch-norm等方法快速被提炼出,它们还不是完全的学习策略,但在过程中起到了非常重要的作用。


CNN借鉴了人类大脑皮层视觉皮层对于图像信息的处理方式。视觉皮层在不同区域所处理的图像的层次不一样,浅层次的细胞处理细节和边缘信息,中层次的细胞处理轮廓,后层的细胞处理整张脸(比如说鼻子,眼睛和脸庞)。从神经学的角度来讲,simple cell用于感受局部边缘信息,complex cell综合多个simple cell的信息,这也是Hubel和Wiesel提出卷积神经网络的一个来源。



ChatGPT使用的是Multi-head Attention Self Transformer结构。这个结构可能与人类大脑皮层新皮质里的皮质柱结构比较类似,但是和中脑、小脑不完全一致。transformer能够解决语言理解、知识表达和部分逻辑推理的问题,但人类和动物所有的问题都能用这种结构解决吗?


信息是客观存在的主体通过物质载体表达的内容。智能体出现后把信息记录下来变成了数据,但数据本身不包含知识。数据到知识是智能体总结的自然原理和规律,以及对个人和社会的本质认知,这是ChatGPT学习的主要数据来源。



ChatGPT这种Self attention transformer似乎不擅长数学,因为人类的大脑皮层和新皮质不善长数学。从这点上看,ChatGPT能够做到的可能就是学会文字描述出来的知识,并在这个范围内进行推理。


ChatGPT很好的掌握了语言知识、部分的常识和泛百科,当它达到一定规模以后,形成了逻辑链,产生了逻辑推理能力。


动物进化有两个重要的能力,一是谨慎生存,二是好奇探索,这两种力量互相平衡,经过几十亿年的筛选,地球上出现了有可能是宇宙中人类唯一知道的智能体,就是我们人类本身。


当动物有运动智能和感知智能以后,首先演化出来的不是认知智能。随着生物体越来越复杂,意识和情感开始出现。在大脑皮层之下,有脑干,即小脑,在大脑皮层和小脑中间的地方叫丘脑,里面有杏仁核、海马体,这与人类的记忆力有关,与我们的意识和情感可能也有关系。


人和动物在大脑皮层之下的中脑,也就是丘脑和小脑里面的神经元结构,与我们的大脑皮层也就是新皮质的神经元结构是不完全一样的。动物和人类在在谨慎生存和好奇探索之上拥有的是想象力和创造力。自从人类拥有了认知智能以后,把人类的想象力和创造力推向非常高的水平,即抽象能力和联想能力。从新的数据里面发现新的知识,除了有好奇心、想象力、创造力,最重要的是能够把原始数据的信息抽象出来,并能联想到模型或解释。


因此,并不是把神经网络结构规模做得足够大,就一定会产生那些我们原来认为低层的能力,因为它们的结构可能完全不一样。所以生成式大模型ChatGPT继续升级,并不一定会产生意识和情感;也不要认为生成式大模型一定能够从新的数据里面发现新知识,因为它们可能缺乏谨慎生存、好奇探索的驱动力。


ChatGPT是通过reading的方法进行学习,它是一种学习方法论,即Reading Aritificial Intelligence Learning——“知识智能”,以便于与后面的“具身智能”相对应(从智能的结果表现上分为运算智能、运动智能、认知智能和感知智能;从学习方法上分为“知识智能”、“具身智能”)。


从实用的角度,知识智能生成式大模型面临着价值观和意识形态的倾向性问题。但它本身没有意识,它的倾向性是我们可以通过学习策略和内容的调整来实现。另一个问题是存在人工智能的幻觉。参数以及网络结构的调整以及技术进步可能可以使“幻觉”的比例下降,但当“幻觉”比例下降时,它表现的好像没有那么聪明了。


语言理解、知识表达、逻辑推理和最终决策四步中,ChatGPT能把前面三步做的更好、更省力、更快,但最终决策的按钮可能还得放到人类手中。这样的组合让我们不用纠结它是不是百分之百准确,或者它自己会不会产生坏的想法。



2、商业生态系统的演变规律及其过程


一个公司值多少钱,最终由商业生态系统决定。当我们把技术产业化时,需要做一家公司,要不就是给政府服务,要不就是给其他公司服务,要不就是给最终用户服务。


在移动互联网时代,本质上是苹果生态和安卓生态的竞争。苹果的优势是完全自己做硬件、操作系统(包括人机交互方式)、芯片和算法。而谷歌开发安卓具有非常大的开放性,除操作系统外,其他全部开放,因此手机公司可以用自己的芯片、硬件和算法。这种生态的竞争揭示了商业生态系统的本质。


公司能够做多大与其在商业生态系统中的位置紧密相关。任何一家公司都一定会参与到一个生态系统中。公司能够做多大,首先要看它所在的生态系统整个管道有多粗。现在最大的两个生态系统,是ICT和汽车。其次要看它在生态系统中的位置,即离这个生态系统中直接产生现金的地方有多远。因为只有生态系统靠近钱来源的生态链上的公司赚得到钱,才有可能把钱给生态链节点后端的公司。最后要看这个生态系统寡头化程度有多深。标准化程度高的手机行业容易寡头化,但有政治属性、难以跨国服务的电信运营商,以及满足消费者多样化需求的服装玩具公司很难寡头化。



在To C消费品方面,我们可以发现诸如电脑、冰箱、洗衣机、智能手机等行业很容易形成寡头化,主要原因在于这些产品标准化程度高、消费者个性化需求低。而诸如衣服、鞋子、家具等行业很难形成寡头化,因为消费者个性化需求高。


所有的商业生态都是围绕人类的需求而来。人类的需求可以统一成两个词——消费和消费品。消费和消费品的生产过程,称为供应链。人在生产过程中叫生产者,通过生产过程,人们获得收益。把消费和消费品交付到消费者的过程,称为服务链,包括品牌、市场、公关、销售以及物流、仓储、运营、运维。人在服务链中作为服务者开展工作并获得收益。人作为生产者和服务者,在供应链和服务链中赚到钱后,成为消费者,去购买消费和消费品。


美国20世纪经济大萧条期间,由于自由市场经济的失灵,罗斯福实行新政,即本质上运用凯恩斯主义的计划规划经济(也叫做国家资本主义)。凯恩斯主义在基础设施建设方面发挥重要作用,而参与其中的企业需要同政府做交易,这类商业生态模式称为To G。在消费和消费品变化非常快的领域,自由市场经济反应更为迅速、市场调节更加有效,参与其中的企业需要不断满足最终消费者需求,这类商业生态模式称为To C。而在供应链和服务链中,公司是服务于消费和消费品公司的,这类商业生态模式称为To B。



根据两个市场、两种经济模式的划分,我们可以得到四种经济组织形式。在国内,中国在改革开放后,实行的是计划规划经济和自由市场经济结合的平衡策略,在涉及广泛公共利益的基础设施建设等领域实行计划规划经济模式。在国际上,中国援建非洲港口、铁路等基础设施建设,以及近年来提出的一带一路建设,均属于国际计划规划经济,其更多是出于政治因素的考量,而不仅仅是经济诉求。在国际自由市场经济的竞争方面,具体体现在日用消费品、高科技消费终端等产品的竞争。



简单定义具备生态系统控制权的公司,即市值达到1000亿人民币或者1000亿美金的公司,该公司一定是其所在商业生态系统的核心。具有控制权的公司被称为Keystone——拱心石公司。例如,在PC生态系统时代,微软和英特尔的市值从未低于4000亿美金,而惠普、联想、戴尔的市值从未超过500亿美金。而在当前,英特尔市值仅1200亿美金,因为在移动互联网时代,英特尔的重要性(控制权)显著下降。


如何成为商业生态系统的Keystone?一些公司依靠商业模式创新,另一些依靠产品创新,但更多的公司依赖于核心技术创新。诸如Microsoft、Intel、Google、苹果,它们均通过技术创新创造了新的商业生态系统,并成为其中的Keystone,成为时代的巨头。



商业生态系统的构造既需要延续性创新,也需要颠覆式创新。技术创新可以是延续性的,巨头有人、钱、资源和场景,通过富有成效的管理,对延续性创新起到决定性作用。但破坏性创新,尤其是低端颠覆创新,恰恰是由创业公司和小公司来主导的。创业公司需要找到正确的非共识,但风险在于非共识大多数可能不正确。破坏式创新体现在低端颠覆上,意味着在开始阶段,技术突破不是高大上的,而是仅满足小部分人的需求,但随着时间推移,随着它追上主流技术的效果,能够最终实现超越。


创业公司成长需要从利基市场走向大众市场。从利基市场起步,即从满足专业用户需求开始,通过非主流渠道抵达在非主流场景的非主流用户。颠覆式创新在公司创立、成长、成熟、衰退的生命周期中需要跨越鸿沟,通过涟漪效应抵达大众市场。


任何的产品和技术都有尝鲜者、发烧友和早期消费者,他们愿意为噱头买单,但并不意味着早期的产品和技术就能够跨越鸿沟,到达主流市场。例如大多数人没有养成语音输入的习惯,因为语音输入还没有跨越鸿沟。又如1987年已经出现触摸式交互的操作系统,但直到2007年iPhone发布才开始在大众市场普及。鸿沟的跨越和商业生态系统的范式转移,整个过程需要非常长的时间。



创业公司需要先聚焦到非主流人群在非主流场景的非主流需求,而不是一开始就瞄准主流人群在主流场景的主流需求,否则无法保证自身存活。如果创业公司想成长为巨头,需要考虑产品能否跨越鸿沟。商业生态系统中存在大量的公司,无法跨越鸿沟的公司无法在其中占据位置。


成为商业生态系统的核心有两种方法,第一种是在已有的稳定的商业生态系统里逐步爬升,例如服装代工厂逐步建立和打造自有品牌。第二种是颠覆原来的商业生态系统,创造新的商业生态系统,例如横扫全球的服装公司Shein。


嘉宾派学员在授课现场


3、人工智能带来商业生态系统范式转移


推动商业生态系统范式转移有四条主线。第一条主线是基因与生命,第二条主线是能源与动力,第三条主线是材料与制造,第四条主线是信息与智能。


第一条主线为基因与生命。从1859年达尔文的物种起源到孟德尔发现遗传规律,到1953年沃森和克里克发现DNA双螺旋结构,直到最近的基因编辑技术,基因与生命与植物、动物和人类息息相关,其创造了人类本身,人类的发展也进一步推动了生命科学的发展。


第二条主线为能源与动力。伴随人类对能源利用的变化,从最早的生物能源,到化石能源,再到新能源,动力系统也不断迭代——由风车和水车,到蒸汽机,再到内燃机,最后到革命性的高功率密度电动机,能源的使用效率、使用精度与使用功率不断升级。


第三条主线为材料与制造。在旧、新石器时代,材料是石头,制造工艺是制作和利用石头工具;进入青铜时代、铁器时代,制造工艺依赖于金属的冶炼和锻造;橡胶、塑料、玻璃等非金属材料出现后,非金属材料的化工工业蓬勃发展;伴随硅芯片材料、超材料等新型材料被发明,数控机床、工业机器人、超高精密微制造等逐步被广泛使用。


第四条主线为信息与智能。人类独有的语言,让信息可以被记录。最早人类在石头和甲骨上记录语言、传递信息;纸被发明后成为更普及的信息载体;有线电线和无线电、计算机、有线互联网以及无线互联网被发明后,人类开始进入人工智能时代。


以上的四条主线,都会导致人类商业生态系统的变革。我们正在使用的任何一项物品,均涉及到这四条主线中最少三个的组合,但一定有一条主线占据主导位置。例如手机涉及到信息与智能、材料与制造、能源与动力。


只有在商业生态系统的范式转移中,创新型创业公司才有可能成为新的巨头,才有弯道超车和换道超车的机会。每一条主线的范式技术进步都会导致范式转移,但信息与智能这条主线的节奏和时间周期最快。


在无线电被发明之前为电信静默时代。在该时代,消费和消费品厂商通过报纸杂志将信息传递给消费者;消费者通过写信将信息反馈给消费和消费品厂商。在电信静默时代,以泰晤士报、纽约时报、时代周刊和美国邮政系统为代表的报纸、杂志和邮政系统等基础设施是商业生态系统的keystone。


伴随麦克斯韦和法拉第发明电磁方程,人类开启广播电视电话时代。在该时代,消费和消费品厂商通过电台广告和电视广告宣传产品;消费者通过电话搜寻或反馈信息。在广播电视电话时代,以ABC美国广播公司、福克斯为代表的电台、电视台以及以AT&T美国电报电话公司为代表的电信运营商是商业生态系统的keystone。


在PC互联网时代,消费者花费更多的时间在联网的PC上。交互方式转变为GUI与鼠标的图形交互方式;消费和消费品厂商更多地通过网页提供产品与服务信息;消费者通过搜索引擎搜索产品和服务信息。在PC互联网时代,以微软和英特尔为代表的核心软件与硬件厂商,以及以Yahoo、Google为代表的互联网流量入口是商业生态系统的keystone。


在移动互联网时代,消费者花费更多的时间在智能手机上。交互方式转变为触摸交互。消费和消费品厂商更多地通过APP提供产品与服务信息;消费者通过社交媒体、APP等渠道搜索与反馈产品和服务信息。在移动互联网时代,以苹果、三星、华为等为代表的硬件厂商,以BAT、Google、亚马逊、Facebook为代表的原PC联网巨头,以及以头条、美团和滴滴为代表的新移动互联网巨头是商业生态系统的keystone。在该时代,延续性创新是主流,颠覆式创新是少数。


PC互联网公司和移动互联网公司本质上是信息消费和信息消费品公司。由于信息的复制成本几乎为零,边际扩张成本特别低,因此特别容易形成马太效应和寡头化,从而实现赢者通吃。其赚钱能力和聚集度要比传统的消费和消费品巨头强很多,因此它们并不屑于去做实体经济。


诸如伊利、蒙牛、娃哈哈、农夫山泉、格力、海尔、美的等传统消费和消费品巨头在直达消费者的过程中,需要通过整合网页、APP、外卖与电商平台等手段提供消费和消费品,这个过程产生了新的巨头,即信息消费和信息消费品巨头。这就是传统的To C巨头和BAT之间的关系。


在AloT(智能物联网)时代,整个商业生态系统会如何变化呢?真正的元宇宙是什么呢?“元宇宙时代”难道破产了吗?


我在2022年上海世界人工智能大会的元宇宙峰会上提出,人类生活在三个宇宙中,一是自然宇宙,对应现实世界和物理世界;二是心智宇宙,对应心理世界,是由人的意识所构成的,包括小说、图画、音乐、话剧等由语言、文字记录的信息;三是数字宇宙,对应虚拟世界。


元宇宙是一个产业化、商业化和资本化的概念。它的一端是技术,其技术体系中包含智能体和非智能体、通讯和交互、沉浸式体验等。它的另一端是需求和场景,其需要满足功能性和情感性的需求。功能性的需求一般由工具来满足,标准化程度较高;相较而言,情感性需求则非常主观、个性化明显。中间的部分是载体,包括软硬件一体化设备、运行在这些软硬件一体化设备上的互联网软件及服务、以及包括芯片、操作系统、云计算、大数据、无线和光通讯等方面的基础设施。


技术有三个层面,一是智能体与非智能体;二是通讯与交互;三是沉浸式体验。


智能体需要具备感知智能、运动智能和认知智能。随着机器的感知智能、认知智能、运动智能的突破,将来会有两个新的智能体,分别是在物理世界的智能机器人和在虚拟世界的数字虚拟人(人工智能)。智能机器人可以联通到虚拟世界。


非智能体包括山川河流、花草树木,人造房子、智能手机和车。智能手机和车本质上是信息化产品而不是智能体。


在智能体和智能体之间的通讯要求低延时、多链接和大宽带。通讯技术最核心的性能就是响应的速度、连接的数量、以及带宽的多少。


交互方式不断演进,在互联网时代是GUI,在移动互联网时代是触摸交互,而将来在AloT时代,是基于视觉呈现的多模态主被动全双工语音交互。当人类的互动对象由非智能体变成了智能体,在这样的场景下可能通讯和交互将变成同一件事情。


人类获取信息最主要是靠视觉,由于人类的身体没有显示屏,因此当人类要把脑子里的信息表达给其他智能体,包括将来的数字虚拟人(人工智能)和智能机器人,语言是最快捷的方式(在脑机接口没有被突破之前)。虽然人类的身体没有显示屏,但机器可以读懂人类的脸部表情和肢体语言,这就是基于视觉呈现的多模态主被动全双工语音交互。其中主动就是人主动搜索,人被动就是机器推荐;机器主动(人被动)就是机器主动推荐,机器被动(人主动)就是人搜索。



第三个层面,元宇宙的本质是深度的沉浸式体验。人类的“眼耳鼻舌身意”带来“色身香味触法”不同的沉浸式体验。在自然宇宙和物理世界、现实世界,这种沉浸式体验是最强的,但是在数字宇宙、虚拟世界中,我们希望人和人之间、人和智能机器人以及数字虚拟人(人工智能)之间的沉浸式体验也要足够强。


我们之所以希望人类智能体和将来的新的智能体(智能机器人和数字虚拟人)以及和非智能体(山川河流、人造之物)之间的通讯和交互的沉浸式体验越来越好,是为了我们的功能性需求和情感性需求得到更好的满足。当功能性和情感性需求得到更好的满足时,人们愿意为这种需求的满足付出更多代价。


To C、To B、To G领域均涉及到产品的定价问题。在To C方面,因用户采购产品和服务得到功能性和情感性需求的满足,其心理定价非常主观。因此To C产品定价,尤其是满足情感性需求的To C产品定价,受BOM成本、消费者个人收入影响较小,而消费者的心理对价起关键性作用。


对于满足功能性需求的工具,因其标准化程度高,行业容易寡头化;而对于满足情感性需求的产品,个性化程度高,行业呈现多样化。


满足情感性需求的内容主要来源于三个方面。一是现实世界,通过录像机、录音机采集现实世界的信息进行欣赏;二是心理世界,如创作与欣赏音乐、绘画、诗词等;三是数字宇宙和虚拟世界,如现在的AIGC与将来的人工智能体,会帮助人类创造全新的内容。


创造内容需要对内容进行确权,web3.0技术和区块链技术可以作为底层的技术体系帮助确认内容的价值。


相较于移动互联网时代,消费和消费品厂商提供APP来实现自助服务,在AloT时代将出现人工智能助理实现自主服务。


代表消费者买方利益的智能助理(AI Agent)与代表卖方利益的人工智能专家系统(AI Expert)进行自主交易。从经济学和社会学原理上,因代表不同利益群体,因此买卖双方的Agent不能够合二为一。


传统消费和消费品厂商仍然存在,但它们要使用新的信息通讯手段,建立自己的企业代言人——人工智能,甚至是机器人与客户交流。


在商业生态系统范式转移的过程中,一方面在延续性创新上,原来的信息消费和信息消费品巨头会逐步的制造和拥有人工智能和机器人,尝试转变为新一代的智能信息消费和智能信息消费品新兴巨头。另一方面,在颠覆式创新上,一定会出现一批创新创业公司,它们利用人工智能范式转移的机会做出全新的产品、服务和商业模式,具备成长为新巨头的可能性。


未来10年,做一般消费品的公司,要学会利用新一代的智能信息巨头提供的智能信息消费和智能信息消费品来触达目标客户群。


嘉宾派学员在授课现场


4、人工智能未来创业浪潮路向何方


我们可以从哪几个角度看待在新的商业生态系统范式转移的过程中的创新(对于大企业甚至是巨头和寡头开创一个新的方向或者是第二曲线)和创业(对于所有的原生创业公司)呢?


在未来十年To C业务的巨大机会体现在软硬件一体化设备、互联网软件及服务以及基础设施等方面。我们可以简单的预测一下。



第一个大的机会是新型的软硬件一体化设备。一类是携带式的,如手表、耳机、AR/VR眼镜;一类是跟随式的,如智能机器人和智慧新能源车;一类是固定式的,即固定在某个场景中能为人类带来沉浸式体验的智能硬件。虽然越来越多的固定式智能硬件能够提供智能双向交互能力,但是相对于未来的最终产品,目前的产品更多是处于过渡阶段的“中间功能”与“中间产品”,尚未跨越鸿沟。


第二个大的机会是新一代的互联网软件及服务。面向消费者的AI Agent和面向消费和消费品厂商的AI Expert。AI Agent会采用基于视觉呈现的多模态主被动全双工语音交互方式,代表用户寻找满足功能性和情感性需求的产品或服务。而AI Expert会替代现有的信息消费,出现一大批在社交、电商、游戏、餐饮、住宿、出行、娱乐等各方面特别在行的超级智能信息服务专家系统。


第三个大的机会是新的基础设施,包括算力系统(在云网边端的各种芯片)、云端和终端的分布式操作系统、有线和无线的新型通讯基础设施(包括新一代光交换,5G或6G无线通讯,卫星通讯系统等)。


1987年移动操作系统和移动硬件问世,但直到2007年1月iPhone发布才逐渐普及。因此我们可以预测AI Agent 和 AI Expert首先会在PC、手机上被使用,但因缺乏自然交互,用户体验可能不佳。每一轮范式转移的开始都是软件、算力和通讯在原来的硬件体系里变化,这具有过渡性和延续性,而硬件变化需要时机。


Google做Google Glass,亚马逊做Echo,Meta做Quest等都是互联网软件服务公司推动新一轮范式转移的表现。但互联网软件服务公司与软硬件一体化设备公司这两个生态位是正交的,即软硬件一体化设备公司期望其硬件可以使用所有的互联网软件服务;而互联网软件服务公司期望其服务可以用在所有的硬件上。因此,仅依靠互联网软件服务公司很难推动新一轮范式转移。


从硬件发展的历史来看,每十年有一次国际市场机遇。下一个十年爆发的科技新消费品可能会是下一代手机和智能家庭服务机器人。



无论大品类或小品类,获取用户心理对价的唯一方式是创新品类。若公司的产品品牌等于该产品品类,那么其将获得最高的心理对价。如茅台、简爱纯酸奶等均通过品牌定位,占领大品类或小品类的用户心智,获得高心理对价。


创新的软硬件一体化设备存在一个悖论,即新的品类出来前,消费者不觉得该品类有存在的必要性。因此创新品类,要获得高心理对价,需要将品牌定位等于该品类。由于消费者是自然正态分布,因此总有人愿意为品类买单,总有人不想交智商税,这就是品牌定位的作用。


手机行业的发展给大家的启示是利用软件思维来做硬件产品,因为销售硬件后可以后续收费。但多数硬件产品并不像手机,首先大多数硬件产品没有高毛利率;其次若没有日活、月活,那也就没有后续价值。


下一代手机一定是某一种组合,这种组合一定与新型显示装置、便携式硬件,和自然交互的操作系统有关系。


原来的蓝牙耳机仅充当连接的工具,但新型的耳机,用户除了要求音频通道功能外,更多是看中了耳机对应的软件APP作为智能助理的功能。



具身智能是一种学习方法论。我们把通过“跟周围的环境进行交互,包括看到、听到、闻到、尝到、触摸到以及他们之间的交叉验证”而学习到的“常识”和“经验”,甚至包括“技能”(例如使用工具)的过程叫做“具身智能”。


在具身智能里,新的智能体在拥有众多模拟器的虚拟世界中,通过模拟物理学、化学的各种原理,学习常识和经验的速度非常快。因此我们可以使用具身智能在虚拟环境里训练机器人的各种能力,特别是感知智能和运动智能。当我们把训练成果移植到现实世界里的机器人身上,就可以实现将来的家庭服务机器人的主要功能。


具身智能最大作用是用来训练感知智能和运动智能,即智能运动(感知周围环境从而控制躯干和四肢进行空间运动,最后实现自己的意图)和智能移动(知道自己在物理世界中的位置并进行规划、导航和移动,从到达目标位置)。同时还能学习“常识”、“经验”和“技能”。



智能服务机器人能否进入大众家庭的核心在于降低成本。通过降低智能关节的机械精度,其成本将直线下降。而使用新型的算力和算法(包括最新的具有人工智能运算能力的新型算力芯片和“具身智能”新算法),部分或者全部替代原来在工业机器人时代起到主力作用的控制芯片(主要是高速DSP数字信号处理芯片和传统控制论的自适应控制算法),将弥补其精度不足的缺陷。


新型算力依靠于人工智能芯片,而人工智能芯片的成本正不断下降。新型人工智能的算法的成本是研发成本,随着产销量的不断增加,摊销的研发成本将越来越低。所以通过具身智能的学习方法论,再加上适中的智能关键硬件和智能芯片及人工智能算法的组合,就有可能实现真正的家庭服务机器人。



从路径来看,家庭服务机器人可能将从家庭娱乐机器人和社会服务机器人两条路径进化而来。


未来自动驾驶汽车和将来的家庭服务机器人需要克服三个问题,一是安全性问题,二是法律性问题,三是伦理问题。在安全性、法律性和伦理性问题解决之前,家庭娱乐机器人既可以做到不会伤害人类,又同时能够满足人类的情感性需求。


人形机器人除了满足人们功能性需求,更重要的是满足情感性需求。机器人只有是人形的,才容易获得消费者的情感寄托。


在沉浸式场景中,通过穿戴式设备,人们可以通过与周围环境进行互动,得到更多的功能性和情感性需求的满足。


如果人们对于To C方向的人工智能产品有情感的需求,那么这个行业一定不是寡头化的,而是多样化的。用户在情感需求上的多样化,将给中小企业带来更多的生存与发展机会。


在To B领域,在生成式大模型取得突破后,传统厂商无需担心被替代。生成式大模型类似985、211大学生,其可以掌握部分常识、语言智能和泛百科和逻辑推理能力,但其并不掌握对行业的认知、方法论和价值观,或者是行业Domain Know How。


行业头部企业会要求具有生成式人工智能的“数字虚拟员工”进行私有化部署,否则其核心信息会被生成式大模型系统学走,造成核心资产和机密的流失。但行业中的长尾公司,对行业底层逻辑并不掌握,其核心信息无关紧要,反而需要SaaS化的服务外包。


大语言模型要与其他的大模型,如CAD/CAE、智能传感大数据模型等综合在一起,比如德国宝马工业4.0工厂——灯塔工厂,是一个数字孪生工厂,它在物理实现的生产流程之前可以将产线配置优化、解决问题,在数字孪生的虚拟工厂里快速迭代模拟。该环节涉及数据流转,从而带来安全问题。计算平台需要解决大模型(语言、视觉、感知)、运算模型、过程管理的数据分析、流程优化、以及处置(即自动化机器,之前出现过RPA,现在升级为copilot)。


智能工业互联网生态面向供应链,其中的核心技术提供方可以做大模型大数据;解决方案公司用于解决涉及供应或生产链出现的具体问题。咨询公司在战略到执行层面提供咨询与服务,可以帮助核心技术、解决方案更好地落地到具体的工业生产中。


商业互联网也是一样。每一个消费和消费品公司如果要建立自己的智能企业虚拟代言人,需要选择合适的核心技术提供方和解决方案公司。


商业化大数据除了需要消费和消费品公司自己的数据外,还需要社会化数据及政府部门的数据,以用于品牌、营销、公关、销售、运营和支持中。在这个过程中,需要格外关注数据安全问题。


面向服务链的智能商业物联网生态,同样需要战略到执行、咨询到落地,因为每家公司都需要在人工智能时代确定自己的战略。


嘉宾商学未来研究院院长、科大讯飞联合创始人胡郁在嘉宾派授课


5、将来的新型创业公司是什么样的?


技术创新需要实现盈利性。核心技术创新公司有四个特点。


第一个特点是至少有一到两项核心技术是世界上最好的。

第二个特点更重要,即要有好的商业模式。

第三个特点是最重要的,即公司盈利后应继续投入到更多、更深入的核心技术系统创新中,这一点是本质。

最后一个特点就是,其面向的市场应是全球化的,解决的问题是全人类的问题,其客户应是整个人类社会。


在组织形式上,到底是一个大公司把一个国家要做的事全做,还是有很多具有相同价值观的小公司相互配合来做出影响世界的事,这是值得探讨的。


硬科技公司需要核心创业者懂得源头核心技术系统创新。诸如国家主导的两弹一星、航天、航空、航母。民营企业在此方面能力较弱,但也涌现出以华为、字节跳动为代表的具有很强的源头核心技术系统创新长项的民营企业。


在新一代的核心科技创新型企业中,企业家和科学家是最重要的两个发动机。对企业家来说,其更关注商业模式创新,在产业化层面更关注产品创新、应用创新、微创新和内容创新。而科学家则主要解决源头核心技术系统创新的问题。


新时代的创新要把三种创新和六种人——中间的是产品经理、硬件系统工程师、软件系统架构师和内容创作艺术家,两头是科学家和企业家,集合在一起才能出现越来越多的核心科技创新企业。



科学家期望通过底层的点状技术突破,使技术使用在更多地方;而企业家需要找到技术最具商业价值的刚需和痛点,通过工具和内容来满足最重要的功能性或情感性的需求,即商业生态系统中最核心的那个点。


作为核心科技创新公司,必须拥有一两项最核心的技术,但用户要的不是技术本身,而是需求的满足,这需要很多项技术的组合。通过独有技术可以建立壁垒和护城河,但不代表仅靠几项独有技术就可以满足用户需求。优秀的企业家,需要真正做到三种创新、六种人的结合。


科学家的技术不可能在短期内取得非常大的改进,因此企业家需要利用现有的技术,创造用户价值,从而产生商业价值。与此同时,通过持续性的提升和改进技术,更好地满足更多的人的需求,公司的市场规模才会扩大,产品和服务才有可能从利基市场走向大众市场。当这两条线同时往前螺旋型地驱动的时候,一个持续性盈利、一个科学和商业结合的结构便得以形成。


核心技术有其自身的发展规律,从最早的科学发现,到一定阶段后厘清科学原理,开始进行研究和工程,最后才达到能够大规模产业化的关键时刻。核心技术从孕育到最后成型这段时间非常宝贵,只有在这个时间段实现从技术到产品到商业的全过程增长飞轮和螺旋式上升的快速发展,才能找到“最佳时机”。否则,要不成为先烈,要不就是因技术通用化而丧失机会。


科技创新型的企业处在商业生态系统里的核心位置,加上正确的发力时机,它就具备了成为一家伟大企业的基础。


将来的商业生态系统可能是混合正交的,不同的公司应该通过聚焦不同维度的工作,同时相互配合形成具有很强生命力的“混合正交的商业生态”,才能共同在世界范围内的计划规划经济和自由市场经济市场实现“共赢博弈”。


“后人工智能时代”将给我们的教育带来巨大的挑战,人类儿童的培养可能也已经来到“范式转移”的关键时刻。在幼小阶段,我们应该培养那些人工智能短期内还不具备的能力,即着重培养好奇心、想象力、创造力、抽象能力和联想能力。在K12阶段,我们可以让孩子利用在幼小阶段训练的更加完善的独有的以上能力,在当时不断进化、不断完善的人工智能技术助手的帮助下,培养出更复杂创新的整体能力,这可能是人类教育所面临的新的范式转移。


我的授课就到这里,谢谢大家!


嘉宾派学员与胡郁合影


分享 | 嘉宾商学未来研究院院长、科大讯飞联合创始人 胡郁

编辑 | 韩哲

出品 | 嘉宾商学