今天开始端午小长假了,难得一次不调休的假期,大家应该都很开心。
休闲的好时光,就不讲公司了。
前两天研读了一份文件,一份“孙凝晖”院士的演讲稿,这是一位长期从事高性能计算机科研工作的科学家,著名的“曙光计算机”就是他带头研发出来的。
前两年的“新一代人工智能(2030)专项”项目,是我们非常重要的AI研究项目,他负责总体设计“神经网络处理器关键标准与验证芯片”。
可以说在我们的人工智能行业,这是一位泰斗级大师,所以前阵子他的演讲,我很认真的进行了研读,加上一些我自己的思考,分享给大家。
2022年因为OpenAI公司推出了ChatGPT,以非常快的速度火遍全球,从那一年开始,各种大模型都竞相登场,所以2022年也被称为大模型元年。
人工智能虽然这两年一直在被广泛讨论,热度也从未消退,但毕竟是一个新型技术,所以很多人可能没有真正理解人工智能,不知道它是如何发展的,也不知道它将如何赋能千行百业。
今天我就在孙院士的基础上,讲讲人工智能。
人工智能的核心就是智能计算,计算的载体当然就是计算机。
“计算”这个行为大概经历了四个发展阶段,第一个阶段八十年代之前出生的应该都经历过,那就是算盘,那个时候计算器都还没普及。
到了第二代的时候,电子器件发展起来,就出现了计算器和计算机,从手动进入了自动时代。
再后来互联网高速发展,计算范围无限扩大,不再局限于普通计算行为,万物皆可算,所以进入第三代网络计算时代。
虽然第三代的计算能力已经非常强,但是必须依赖人为给予的信息,机器不能按照需求自己思考自己获取信息,所以就有了第四代智能计算。
现在我们正处于从第三代到第四代的转型期,这也是全球很多地方都在打造数字化的原因。
如果把计算系统分类的话,可以分为五类,第一类就是孙院士研发的那种高性能计算平台,一般不对外使用,只在科研和核心领域部署。
第二类是企业计算平台,也就是服务器,国内几大平台比如百度、阿里、腾讯提供的都属于这一类。
第三类是个人电脑,第四类是我们的手机。
第五类的嵌入式计算机,嵌入式可以简单的理解为根据特定的应用场景,单独设计出来的专用计算机。
其实我们每天都在用嵌入式系统,比如计算器、电视机、各种家电等等,里面都有嵌入式模块,它不是我们常用的电脑系统,而是根据需求把硬件和软件集成到一起的系统,自动化程度很高。
现在我们人类正在打造第六类计算平台,就是智能计算系统,不过目前还处于初级阶段。
如果成功了,那就等于一台具有高度自主化的智能机器人,也就是科幻电影里面的那种。
智能计算的起源其实比较早,1946年的时候,国外科学家就想模拟人的大脑,研发出可以自己思考的机器。
但是那个时候的技术还太落后,至少算力就远远不够,所以失败了,最后退而求其次研发出了自动化计算机。
不过人类对这个目标的追求并没有停止,10年之后,1956年就产生了人工智能的概念,到现在已经快70年,人工智能AI才总算有了眉目。
经过前些年的声音识别、人脸识别和自动驾驶的发展,现在基本上完成了“深度学习计算系统”的搭建,也就是大模型的雏形。
要让机器具备智能化能力,必须要先让他具备学习能力,我们人类获取信息主要是靠各类神经元,先感知,然后存到大脑。
人工智能也是一样的,所以现在的AI学习系统,就叫“神经网络”。
把大量的数据经过标记后放到库里面,AI的神经网络就会去寻找并且吸收这些数据,理论上只要数据足够多,AI就会变成一个超级大脑。
从现在的进步程度来看,速度确实非常快。
2020年之前,AI还只是处于“小模型+判别式”的状态,也就是它只能根据定好的框架,识别并且简单的判断。
现在已经变成大家所熟知的“大模型+生成式”,也就是不仅是机械式的判断,而是可以自主学习,然后自主输出想法和结论,等于是经过思考生成一个全新的东西。
之所以称为“大模型”,因为参数足够大,比如ChatGPT-3就有1700亿个参数,用了上万块V100 GPU进行训练。
ChatGPT-4的参数规模更是到了万亿到十万亿的级别,而且还在快速上升。
即便是这样,用过的朋友都知道,其实缺陷还是很多,说明参数远远不够,学习程度也还远远不达标。
所以现在国内外都在耗巨资打造新的“智算中心”,越到后面,AI对算力的需求越恐怖,简直是难以想象的地步。
参数规模、数据量、算力这三个要素,就决定了AI模型的先进程度,这里面的原理,其实现在科学界都还没搞明白。
研究发现当参数规模到达一定程度,也就是突破某个阈值后,AI的能力就会大幅度提升,但是至今都不知道为什么会有这个差别。
好像跟人类的“厚积薄发”有异曲同工之妙。
现在AI人工智能的发展方向主要有四个:
第一个是多模态方向
这是模拟人类做出的选择,我们人体的感知和输出有眼、耳、鼻、舌、身、嘴这七个,是与生俱来的。
AI如果要足够智能化,当然不能只具备一项能力,比如视觉和听觉必须是要同时具备的,这就是大语言模型的研究方向。
第二个是视频生成
这个大家都知道,2月份OpenAI发布了视频生成模型SORA,就是基于这个东西,他们正在搭建一个“世界模型”,也就是试图预测下一秒会发生什么。
这个世界模型虽然现在问题还很多,但是非常有“科幻感”,感兴趣的可以在网上搜一下,想象空间是真的很大。
第三个是机器人
现在不少机构都在研究虚拟和现实的结合,也就是真正的机器人,不用实时控制,机器人具备信息吸收能力,然后有一颗强大的智算大脑。
按照设想,机器人具备学习能力,通过采集实时数据,能够感知周围的一切,并且进行理解,得出结论后可以自主行动。
这跟人类其实已经差不多了。
第四个是科学发现
到今天为止,我们所有的科研结果,都是大胆猜想,小心求证,最后实验很多次才总结出来的,这非常耗时耗力。
人类的猜想是需要前提的,那就是大量的知识储备和经验积累。
这一点显然AI能做得更好,因为理论上它们可以有无限的知识做支撑,并且吸收无数人的科研经验,这样就能具备比人类更强的推理能力。
这个方面其实已经在初步应用了,我之前分析万华化学的时候还专门讲过一些。
比如催化剂实验,很多都是一万多个分子式的可能性,这些分子式都要去组合然后合成,看哪一组结果更好。
要知道一个经验丰富的硕士生,一年也只能做20个左右的分子合成。
也就是要研发一个催化剂,需要10~20个人做一辈子的实验,才能完成。
这个工作完全是可以交给AI来做的,效率会提高很多很多。
还有更高级一点的,比如新药研发,比如蛋白质结构的预测研究等等,这些东西未来肯定会有AI的用武之地,以后的科研效率,想必要大大提升了。
虽然人工智能目前还处于初级阶段,但是相信没人会否认AI的价值,尤其是企业端。
现在我们的人工智能技术离国外还有比较大的差距,而且这个差距还没有看到缩小的趋势。
到那时即便再艰难,我们也还是要努力追赶。
在追赶方式的选择上,就有了诸多分歧。
1、首先要确定的,是走闭源封闭,还是走开源开放?
这里面有三条路,第一条是往兼容外国AI体系上面靠。
这也是目前国内多数企业正在走的,比如尽量去兼容他们的CUDA,很无奈,这也是性价比最高的办法。
因为硬件的被限制,我们的算力严重不足,再加上我们大大小小的各企业,都是自己做自己的,没有形成行业生态,算法方面同样缺陷很严重。
所以如果不去兼容他们领先的,我们的差距可能会越来越大。
第二条是在某些特殊领域建立闭源封闭系统,比如气象、军事等等特殊领域,现在一些大的国企就是在做这个。
好处是安全性高,自己用着放心,但缺陷是发展速度会比较慢,因为毕竟脱离了行业,注定没法全球化。
第三条是全球共建开源开放,这是一个很美好的构想,但是难度很大。
国外那些巨头的态度先不去说,我们的身份就不一样了,之前在互联网时代,我们本质上是使用者和参与者,享受到了全球互联网开源的红利。
这次如果共建人工智能全球开源,我们就变成了发起者,是要充当主力角色的。
以我们目前的实力,难度还是太大了,没法主导全球AI的走向。
2、我们未来到底是拼算法,还是拼智算基建?
不要以为人工智能好像有点类似互联网,是虚拟的,没什么基础建设。
这是种误解,即便是互联网,当年西方建立信息高速公路,也是花了绝大代价的,才成功引领了全球的互联网。
人工智能也是一样的,AI的核心是智算,智算取决于数据、算力和算法,数据的采集和存放,就是一个非常庞大的工程。
算力就更不用说了,我们现在都还生产不出高端芯片,根本没法拼算力。
本次大基金三期落地,就是为了大力扶持半导体行业。
所以整个人工智能的基础建设,是一项极其庞大的工程,需要巨额资金投入很多年才行。
现在我们很明显是选择了新型基建这条路,而且在数据方面,我们还取得了先机。
这个我在前不久讲海康威视的时候也提了一下,这几年我们的数据化转型越来越快,未来必然还会加大扶持力度。
毕竟再强大的算力,也必须要有数据支撑才行。
大家可能对我们的数字化转型没太多概念,其实已经慢慢渗透到我们的日常生活中了。
比如智能家电、智能驾驶、安防、可穿戴设备等等,无时无刻不在走向数据化。
一旦把这个新型基建布局完成,好处是非常大巨大,必将复制我们在工业制造上的成功模式。
我们的工业产品在全球为什么会有这么强大的竞争力?
因为各生产企业成本足够低。
这个成本怎么降下来的?
能源、运输、交通、服务、产业配套等方面,我们都非常完善,所以企业除了原材料和经营成本之外,其他外在的成本,相比于国外就有了很大的优势。
未来的人工智能也是一样的,AI的最终应用,终归还是要服务于企业和消费者,如果成本太高,客户也就没法享受到廉价的智算服务,行业就没法发展。
所以接下来的几年,在人工智能基础建设领域,我认为会有一大波机会。
3、我们的人工智能到底是为了服务实体经济,还是服务虚拟经济?
很显然西方选择的是虚拟经济,比如虚拟现实、元宇宙、区块链、大模型等等,这些东西全都是他们炒作起来。
我们不一样,我们是制造业大国,我们的实体经济占比很高,这也是我们能这么快崛起的优势所在。
所以尽管虚拟经济入门会更容易一些,产业链延伸的时候也简单一些,但是并非长久之计。
AI这个东西注定只能成为一个“赋能”的角色,否则就真成科幻小说了。
那么什么叫赋能?
降低企业的生产成本,提高企业的经营效率,加快技术的研发速度,这就是赋能。
所以未来我们的人工智能,应该与世界上其他的人工智能天差地别,这也是我们巨大的潜力。
现在我们的人工智能很难很难,有些企业甚至有点绝望,因为被卡的太难受了。
西方的AI综合能力本来就要远远高于我们,我们一直都是在跟着跑。
即便是这样,还把高端芯片给停了,我们的算力根本上不去。
他们训练一个大模型的某个阶段,可能需要两三个月,我们至少要一年以上。
现在国内做得好一点的企业,比如华为、曙光、龙芯、海光、寒武纪等诸多公司,都被列入了清单。
所以导致我们现在芯片工艺要落后他们2~3代,后果就是芯片性能也要落后2~3代。
再加上他们起步早,不管是人才储备,还是资金投入上,都占有很大的优势。
我们现在的高端AI人才,是非常稀缺的,诸多企业由于技术和规模都比不上人家,自然也就缺钱,研发投入就会比较少。
要知道英伟达这么厉害了,他每年的研发投入都是几百亿,是我们国内公司的10倍以上。
这是我们人工智能目前很大的一个困境,没有任何捷径可走,只能咬着牙通过前面说的那几条路,慢慢追赶。
什么时候能追上?此时此刻来说,还遥遥无期!
不过我们从来都不缺耐心,这么大的工程,本来就不是一朝一夕的事情,所以也不要太着急。
即今江海一归客,他日云霄万里人!
更何况我们并非江海归客,而是披星戴月的赶路人。
相信我们建设全球AI开源体系是迟早的事情,风水轮流转,也该轮着我们主导一回了!
为什么会有这个自信?
因为目前全球只要我们选择了最难最辛苦的人工智能基础建设道路。
先苦后甜,是我们的优良传统。
我做了下面这张《A股核心资产研究汇总》表,里面精选了上百家优质公司,并附数万字的分析方法。
所有分析过的公司都会在上面这个表里更新数据。
一起探索企业基本面的研究,收获必然巨大。
小拇指,发财手点个赞......
#财经##人工智能##让AI触手可及#