深度剖析人工智能的奥秘

发表时间: 2018-09-28 11:38

【袁岚峰】

今天袁老师和大家深入的谈谈如何浅谈人工智能~

大家好。这次我们要谈的主题啊是一个超级热的主题,也就是近年来整个科技界可以说最热的一个关键词,你肯定知道是什么了吧?就是人工智能。你也许要问了,那我以前为什么不谈人工智能?原因很明显,因为我完全不是一个人工智能专家。我对于人工智能所知甚少,那这一期为什么要谈一谈呢?因为一方面是因为世界人工智能大会要在中国上海市召开,这是全世界人工智能界一个盛会。( 袁岚峰博士应上海电视台之邀探营世界人工智能大会的视频见科技袁人上一期,链接:

https://mp.weixin.qq.com/s/6rvnfJNlZPBxD8DeweeIvw)

为了准备这个事情,我也去咨询了一些人工智能方面真正的专家,麻省理工大学评出的中国“35岁以下科技创新青年35人”,朱明杰博士,一见面他就叫我师兄,哦这又是我们科大师弟,然后跟他聊起来好多做人工智能的都是科大师兄弟。经常谈到的,我的朋友风云学会会员陈经,他就是做人工智能研究的,他就是一个人工智能的开发者。然后另外一位是我的科大师兄,加州大学洛杉矶分校的计算机科学与统计学教授朱松纯老师。

我以前向大家介绍过,朱松纯老师写过一篇4万字非常长的一个对于人工智能的非常全面介绍,这个文章呢叫做《浅谈人工智能》,名字叫浅谈,但实际上它是我见到的对于人工智能最深入的介绍。那么一个最基本的问题,就是人工智能现在是一个什么样的发展状况呢?

你也许啊会在很多地方看到,说这个人工智能马上就要超过人了,甚至说要取代很多人的工作了,然后很多人关心人工智能并不是因为他们对这个科技发展感到多么欢欣鼓舞,而是出于一个忧虑:啊我的工作明天就没了。就好像以前看到一个电视节目,这个撒贝宁跟人工智能专家座谈。人工智能专家就说我们非常有信心,五年之内很多的工作就会取代,然后撒贝宁说那我的工作呢,他说你呢大概三年,然后小撒就一脸很悲壮的,啊我只剩三年了。实际上呢这都是开玩笑的,实际上你如果去问业界的专家,你会得到印象正好相反。他们真正关心的是人工智能能做的事太少,而不是太多。

那种讨论这个人工智能取代人类,人工智能消灭人类。这个种种哲学性的问题呢。他往往不是研究人工智能的。比如说朱松纯教授在他这个文章一开头呢就说到,媒体现在对于人工智能的夸大宣传已经到了让他们这些人非常吐血的程度。比如说经常被媒体拿出来说的人是霍金,当然霍金先生已经去世了。霍金他是干什么的?他是一个物理学博士,是研究黑洞的,研究宇宙学的。他从来没有搞过人工智能啊;而且他已经患渐冻人症那么多年,本来他的科研就没法做了,结果你把它当成一个人工智能的专家出来,让他大谈特谈人工智能的危险,你不觉得这很搞笑吗?



斯蒂芬·霍金

还有就是埃隆·马斯克,马斯克呢他也不是研究人工智能的,所以你为什么要把这些人的观点看特别重要?其实你更应该看看那些真正研究人工智能的人。如果去看那些真正研究人工智能的人,你会发现他们有一种戒慎恐惧的心理。他感觉这个媒体把人工智能说的太过了。实际上人工智能呢在它发展历程当中,已经经过了好几次的高涨和好几次的寒冬。

实际上人工智能是20世纪50年代开始出现的这么一个学科,然后在这中间这个发展状况,用朱松纯的话说就是Boom and Bust。是西方经常这么形容,就一哄而上,然后又一哄而散,每次都是大家对他寄予一个过高的期望,然后一大堆人来了,然后过一段时间发现研究不出来,远远达不到期望,然后大家一会又全跑了。

比如说在朱松纯80年代刚开始学人工智能的时候,他是1986年上的科大,那时候呢人工智能处于一个非常悲催的境地。那时候没有人好意思说自己是搞人工智能的,那你就说了那这些人当时在干嘛呢?他们会自称自己是搞计算机科学的,或者是搞数学的。然后你再问他具体干什么,他会说我是搞计算机视觉的,或者诸如此类一个非常具体的领域,他绝对不会告诉你他是搞人工智能的。在那个时候人工智能这个词几乎都被污名化了。

所以在这个行业里面坚持到现在的人,忽然发现近几年来人工智能这词变得如此之热,然后许多外行都趋之若鹜,然后任何人任何企业都觉得只要沾一下人工智能这个词就变得高大上起来,市场估值就可以翻几番。他会觉得非常不可思议,梦幻般的体验。

实际上呢我在合肥市委党校讲课的时候,我去讲量子信息,结果讲完之后,立刻就有一位非常热心的学员起来提问,他问的是量子计算跟人工智能是有什么关系?量子计算能不能帮助人工智能突破现在的弱人工智能达到强人工智能以至于达到将来的超人工智能。

我说:哇这个问题提得很好。确实是,当然任何人都能看出来,这两者肯定是有关系的,如果量子计算机造出来了,当然是有助于人工智能的实现,不过前提是你能造出来嘛。你得完全分清楚,这两个技术不同的层次,量子计算这是一个有原理,但是实践当中还有巨大困难的技术,还完全没到实用阶段,只是在一个实验室演示的阶段。

而人工智能呢是一个真实在用的技术,大家都用了这么多了,比方说AlphaGo在下棋,还有像无人驾驶很多技术都是真的能用的嘛。无论有没有量子计算,人工智能都会继续发展。当然了如果有量子计算当然是个好事,不过前提是你得能造出来。所以啊那我们来讲点干货,人工智能的业界它实际是一种什么发展状况呢?

陈经就告诉我了。实际上大部分的人工智能研究,应该说应用,就是你整天在媒体上看到说人工智能又做到这个又做那个,下棋又赢了,打游戏又赢了。这些事情都是一种比较简单的技术路线,就是说收集大量的数据,比方说有很多人发动了几百万人去标注数据,搞那图片识别的。

然后大量的数据来训练,然后去做一个,这实际上是相当于一个拟合的工作,就是有一个多元函数,然后你不知道这个函数结构长什么样的,但是没关系,你从大量的数据去拟合,就是神经网络那个思想,然后最后拟合出来的结果,你可以对一个输入给出一个很好的输出,你可以识别出来,这是个什么东西了,甚至比人的识别能力还要高。

这当然很好,但是这个前提是说因为你有个很大的数据,而且呢你也不知道因果关系,但是总体这样是可以用的,很多时候你是可以超过人的。这是绝大多数的人工智能研究是这么做的。

陈经说呢这是一个比较低级的路线,现在出现了一种比较高级的路线,就是AlphaGo那种路线。他说这个大数据呢我们还是要用大数据,但是这个大数据不是靠人工标注了,不是去发动了全世界数以百万计的研究生去做这个人工标注,而是让机器自己跟机器博弈,然后让它自动去生成数据。你看AlphaGo后来为什么变得那么强?

AlphaGo一开始是学习人类的棋谱,到后来呢它再次升级之后变成AlphaGoZero,为什么叫AlphaGoZero呢。因为它不再学习人类棋谱了,它从头开始,你唯一给它输入的就是围棋的规则,然后它根据规则自己跟自己对弈,然后很快就积累了数据,然后很快它就找到了这个围棋最好的做法,然后超越了人类所有的棋手,这时人类棋手是远远地瞠乎其后。

现在都变成人类要向AlphaGo要向计算机的棋手来学习怎么下围棋。计算机棋手不需要向人类学习任何东西了,这是一个现在比较高级的技术路线。它对于研发能力要求是很高的,尤其是对于计算能力要求是很高的。但是AlphaGo这个团队最大的贡献,就是证明了这样一条技术路线是可行的。



阿尔法Go与李世石

所以人工智能确实是取得巨大进步,在很多行业都刷新了以前记录,都做到以前做不到的事情,比方说人脸识别。这个人脸识别本来应该是人的强项是吧?但很长时间,其实人脸识别大家已经做了几十年了,很长时间,计算机是达不到人的水平的,它实际上就没有多大用处。

但是像这个商汤科技汤晓鸥,他也是我们科大一位师兄。汤晓鸥呢是第一个做出一个算法,使人脸识别,机器的这个识别率超过人。这样突破这个临界值了,然后人脸识别立刻就得到爆炸性的应用,现在比方说你去任何一个地方,你去一个宾馆住店,他第一件事他都会扫一扫,让你看一下摄像头来识别一下你是不是就身份证上那个人,这些变成一个非常常用的技术。像这种啊你就并不需要他那个基本原理有多大突破,只需要他那个应用的指标突破了某个水平,比方说超过了人的水平,那他就非常重要的经济上的意义了。但是这是不是就够好呢?如果在研究人工智能理论的人看来,这当然还远远的不够好。

如说像朱松纯教授,以及他在文章里面多次引用的他的一些前辈,比如说Judea Pearl教授,他们就一再向大家指出,当前的所有的人工智能其实在专家看起来完全没有智能。这当然要看你怎么定义智能了,但是这它实际的意思是说,当前这个人工智能它唯一做的都是分析数据,都是你给他大数据,然后它从中去学习,然后最后学出来一套基于大数据,它做的超过人了,但是你觉得这是我们人类学习一个知识的方法吗?

​其实压根不是啊。朱松纯在他这文章里面就举了一个非常有意思的例子,说乌鸦和鹦鹉。大家知道这个乌鸦和鹦鹉呢是两种鸟类,它们的体型和大小都差不多,但是朱松纯告诉大家,乌鸦就比鹦鹉要聪明得多。为什么呢?你说你看起来鹦鹉好像很有智能,你就跟这个鹦鹉说话,然后把一句话重复几次之后,鹦鹉就学会了,鹦鹉学舌嘛。鹦鹉可以模仿人类说话,说得也很好。但是你如果跟这个鹦鹉去对话,尝试上几次,你就会发现其实鹦鹉完全不知道自己在说什么,因为它根本不理解它说的那些东西,它是一个机械的重复而已。

现在其实你可以看到很多所谓聊天机器人,你平时能够见到唯一的在日常生活当中能够见到的所谓人工智能应用,就是这个聊天机器人。网上呢也会传很多的聊天机器人的视频啊、图片啦、文字记录啦,你乍一看的时候你会觉得非常的惊艳,你说哇这个聊天机器人这么聪明啊。它是不是已经是具有人类自我意识了,它是不是已经通过图灵测验了?完全没有啊。

比方说有人给我看一个说是英国开发的一个聊天机器人叫做索菲亚,这聊天机器人聊得这么好,以至于沙特阿拉伯给了她一个沙特阿拉伯的国籍,当然是机器人的国籍。说这是历史上第一次有一个机器人被授予了一个国籍的,然后给大家看,聊得很嗨啊。像这种你不能跟她多聊,聊的多了,你就会发现它其实就是东拉西扯,来回就那几句,你可能就发现它其实并不知道自己在说什么。



索菲亚在被授予沙特阿拉伯国籍的会上发言

那反过来说朱松纯为什么说乌鸦就非常聪明,他给大家举个例子说,他说的乌鸦啊都是真实世界的乌鸦,都是有人拍下来的,比方说他看到有一只乌鸦,这个乌鸦呢拿到一个坚果,它想吃到这个坚果里面那果实,但是呢啄不开这个果壳,它怎么办呢?然后它就做了一个观察,它发现啊这个坚果如果落在公路上面,有一个汽车压过去,果实不就出来了吗?好。它做出这个观察,但是呢,然后它也意识到,这样汽车在来来往往的时候,它不能去吃这个果实,因为太危险了,随时它就挂了。然后它又做了一个观察,它发现马路上是有红绿灯的,当红灯的时候汽车就不走,这个时候它就可以去吃那个果实,就非常安全。

然后它还需要做一个推论,就是在这个红绿灯地方观察到的事情,在另外一个红绿灯那也能行。所以呢它最后就做出这么一个决策,它把坚果叼到某个红绿灯的地方,在绿灯的时候放下去让汽车把它压碎,然后在红灯的时候下去吃,然后它就真的就吃到了。你说这是多么聪明的一只乌鸦。人看到这个例子会说:哇这个是表现出真正的智能。但是乌鸦做事的范式呢跟我们平时理解的人工智能的那种做事范式正好相反,朱松纯就指出我们绝大多数做人工智能的研究者都是大数据小任务,Big data Small task。



乌鸦学习历程

乌鸦正相反,它是小数据大任务,你说乌鸦有什么大数据呢?它只是观察了屈指可数几个例子而已,因为它的生命只有一次,它不能自己跑到红绿灯那地方自己去多做几次实验,它早不知道被碾死多少次了。所以真正的智能是能够通过很小的数据,就能提炼出当中的规则,然后就能够进化出,立刻就推演出一个非常好的做法。

它为什么能够做到这一点?因为它有因果关系,而传统的人工智能纯粹是一个统计,它是做的一个相关性的分析。那比方说公鸡打鸣,太阳就会升起,这两者之间是一个相关性的关系,但是我们并不会认为这两者之间是因果性的关系,对吧?假如你把全世界的公鸡都给杀掉了,太阳也不会不升起,对吧?或者你强迫全世界所有公鸡在半夜打鸣,太阳也不会半夜就升起,对吧?所以这样的事情呢只是相关性不是因果性。

又比如说呢如果下雨那有很大的概率地面就湿了,OK但是假如我们反其道而行之,我们人工的去把这个地面打湿了,那你觉得会有很大概率下雨吗?这好像完全不相关,对吧?所以像朱松纯和他这位前辈JudeaPearl就向大家强调,因果的逻辑跟相关的逻辑是不一样的。我们如果想真的达到一个智能的程度,你应该用一种数学语言明确的把这种因果的逻辑描述出来。

但是这个因果和相关区别在什么地方?他说这关键是在于因果性,我们是在讨论一个带有可能性的世界,是多个世界,而相关性是只有一个世界,那个世界发生了什么就是什么,你不能去改变它,所以那只有一个世界。你可以对这个世界所有一切都了如指掌。但是由于你不能改变它,所以你没法说这其中任何两件事件有因果关系。

而一个因果性的世界是说我们可以介入,我们会做出一些反事实的推理,我们会说假如我们当初那么做,那么这个事情可能会发生什么样的变化。当我们能够这么设想,然后去做一些实验去验证的时候,我们才是在做一个因果性的推理。

朱松纯建立一个非常浩大的人工智能的一个框架性的思考,他说在这当中我们应该考虑两件事,一个是这个物理规律,就是这个物理世界,那些自然界的规律,比如说一个东西要怎么才能放得稳,它需要一个什么样的支撑。然后另外一个是人的动机,这个是来驱动人去做思考做事情的动力。比方说人做图像识别,他在识别什么?其实最根本的识别是功能。比方说一眼就可以看出来,这个地方是厨房,那个地方卧室,那个地方是书房,他首先想到是这个地方是干什么的,从此出发,他立刻就能看出这个图片的很多特征。

比方说你可以看出一个现代人的厨房,跟一个古代人的厨房,虽然看起来外表相差甚远,你如果要计算机去识别,它根本不会认为这两个是同样的东西,它模式识别,它怎么都看不出来,但是人一眼就看出来,这玩意都是厨房,它的功能是一样的。这是因为人能够分出这背后的因果关系,然后以这两个特征朱松纯就称应该把牛顿和达尔文统一起来。

牛顿就是物理世界的规律,达尔文就是生物世界的规律。然后你把这个物理世界的因果性跟这个生物世界的基于这种动机价值观的因果性结合起来,这个才是关于人工智能或者说的更广泛一点,他希望把这个人工智能提升到一个科学,就是关于智能的科学The Science of Intelligence这样一个程度,他觉得这应该是未来的人工智能科学的一个思考的一个框架性的出发点。



古今厨房

我觉得这是非常高妙的一种思考。然后我就问陈经了,那你觉得我们的朱松纯师兄说的这些怎么样?他说说的当然是很好,业界都是非常敬佩朱松纯的,不过他说的也许在目前改变不了业界大多数人做法,就是说朱松纯其实非常鄙视那些刷榜的人,就是说你下载了人家的软件,下载人家代码,然后呢搞一个很大的数据集,然后搞一大堆人去调参数,然后最后呢你刷出来的结果,你把识别率又提高多少个百分点,然后超越别人。这业界发的绝大部分文章都是这种,他实际上很看不起这种,凑热闹,这个东西跟科研相去甚远。但是朱松纯说的再好也改变不了,大多数人还是会做这个事情,为什么呢?

因为这个事情确实有用,你如果把人工智能看成一个工程看成一个实践,那么这些事情就是当前最有用,而且确实非常有成果,而且主要它并不是人工智能这个领域本身的人在孤芳自赏,是因为有很多其他领域存在这个现实的需求嘛。所以他们会希望大家用人工智能应用去帮助他们做到各种各样的事情,不管是医疗、图像识别、还是无人驾驶。

很多领域它都有这个需求,所以人工智能它的发展其实在当前这个阶段,更多的是人工智能专家跟各个行业的专家,大家来共同研讨,做一个深入的沟通。知道每一个行业里边他们真正的问题是什么,然后基于这个行业的专业知识跟人工智能专业知识大家结合起来,然后这样就可以一块取得突破。

所以你可以理解为人工智能帮助很多已经有深厚积累的领域做出了突破,那个功劳其实有一大半是那个领域自己的,但人工智能帮它完成这个临门一脚。这样的工作确实非常有用,所以大家还会持续不断做下去。朱松纯说的可能一时半会不会改变这个状况,不过呢我们应该这么想,就是一个学科的发展,它是要有理论提供一个框架,然后有实践去不断来消化这个理论的成果。然后很可能消化一个理论需要很长很长时间,但是呢最终你整个学科能够达到的上限,还是取决于你的理论框架。

比方说,我就听到过这样说法,说人类在20世纪初的时候做出了相对论和量子力学这两大科学革命,然后直到现在呢相对论和量子力学都是人类两个最最基础的物理学理论。那有趣的事情就是人类直到现在都没有充分的消化这两个科学革命的后果。你看比方说量子科技,实际上指的是量子信息啦,现在发展的还是非常方兴未艾,或者按照他们比较业内人的说法,叫第二次或者是第三次量子革命。

那么也就是说对于量子力学这个已经有一百多年历史的理论,大家还在不断地发掘出其中出人意料的以前没有想到的新的内涵。就是说我们消化的还远远不够呢。所以呢就有人猜想,我们现在还没有出现一个新的科学革命,大概就是因为我们还没有把上一次科学革命的那个成果消化殆尽吧。

但是说到底呢最最根本的你能够达到上限还是取决于那个理论框架,这不就像三体里面讲那个基本的故事吗?智子并不需要锁死人类所有的科技发展,它只是需要锁死那个最最基础的高能物理学,或者说粒子物理学就足够了,你就没法再发现更深入的层次。



三体 智子

以当罗辑沉睡了数百年之后,醒过来,他发现乍一看好像觉得人类已经发展得非常先进了,结果他就问大史,大史其实也不懂什么科学了,但大史立刻就指出,这没有任何奇怪的,他们只不过突破了一样东西,就是可控核聚变。相当于他有无限能源了,然后它通过无线输电到处给你输电,然后就看到好像能够实现很多不可思议的事情,其实一点都不难。真正令人感到恐惧的是基础物理理论没有进展,比方说罗辑醒来一看,丁仪教授你还在教物理!你还是一个物理学教授,你沉睡了几百年之后,你掌握的知识还是最高深的。这个其实是令人可悲的是吧?所以我们也认为像朱松纯教授做的这种框架性的思考,这种引领未来的思考也是非常有必要的,将来我们需要更多的这种级别的思考。