演讲实录丨李德毅院士:智能时代的农机驾驶——人工智能一百年

首页 2021-01-25 17:35:52

2020年12月20日,由中国人工智能学会主办,CAAI智能驾驶专委会、上海交通大学、上海人工智能研究院有限公司、江苏南京生态科技岛经济开发区管理委员会、中新南京生态科技岛开发有限公司承办的“2020智能网联汽车高峰论坛”在江苏南京中新生态科技岛举办。主旨报告环节,CAAI名誉理事长李德毅院士带来了题为《智能时代的农机驾驶 ——人工智能一百年》的精彩演讲。

演讲实录丨李德毅院士:智能时代的农机驾驶——人工智能一百年

李德毅

CAAI名誉理事长

中国工程院院士、CAAI Fellow


以下是李德毅院士的演讲实录:


今天的报告主要讲三个再认识——对当前时代的再认识,对人工智能的再认识,对农业革命的再认识。


一、对当前时代的再认识


人类从智人发展到当代文明,经历了石器时代、新石器时代、农业革命时代,工业革命时代。如今到了人工智能时代,是否可以换一个视角,看看人类经历了几次认知革命。

人类的第一次认知革命大约发生5000年前,发明了语言,更为重要的是发明了文字和符号,让人类的历史得以记录,从而使得人类智能可以作为知识而独立存在,诞生了文化和文明,形成了智能的生态。

第一次认知革命之后,大约到了500年前,科技开始大发展,人类对客观世界的认知大大地向前走了一步,产生了科学技术是第一生产力的共同理念。人类通过对物质和能量的认知,发明了各种各样强大的机械、动力工具,解放人类的体力。这是第二次认知革命——认知客观世界,发明动力工具。

今天,我们身处在第三次认知革命中。大约从100多年前,我们开始研究人脑是怎么工作的。其实所有的科学归根到底就是研究三件事——地球是怎么产生的,生命是怎么产生的,人脑是怎么工作的。人工智能工作者更多地希望用人工智能来解放人的智力,所以把它称之为第三次认知革命——认识人类智能,发明人工智能。

现在有人希望看到人工生命,我个人认为生命是人类存在的底线,对待底线要谨慎再谨慎,在生命和意识都还没研究清楚时,还是要让人工智能脱离我们的生命体而独立存在。但将来也许会有第四次认知革命——认知精神和意识,创造人工生命,成就智慧人类。


二、对人工智能的再认识


为什么要对人工智能再认识?因为早在1956年的达特茅斯会议上,就已经提出了关于人工智能的7个议题,现在看这7个议题也不落后。

人脑在进化过程中,其中一个突出的进化就是让人脑后天有更大的可塑性。人脑组织结构的进化和后天学习成就了人类智能。这里的组织结构主要表现在遗传基因和可塑性,而人类的智能——知识、文化和文明主要是后天形成的。人类最伟大的智能是发明了教育,人的一生中有四分之一的时间在接受科学技术、接受群体智能,把别人的群体智能变成个人的智能。这种群体智能、个体智能的正向迭代,大大超过了人类自然进化的速度,才使得人类站到了生物链的顶端。所以说智能植根于教育,文明是智能的生态。

关于人工智能有23个权威的定义,其中一个是强调要像人一样的智能,但什么是人的智能需要再定义。我认为,智能是学习的能力,以及解释、解决问题的能力。这里的学习包括传承学习和自主学习;解释、解决问题的能力,就是利用已有的知识,把实际问题置于高一个阶次或者高一个维度的框架下,通过演绎推理,自动获得其解,当然也就可解释了。有了智能的定义,我对人工智能就有了一个新的定义:脱离生命体的智能,是人类智能的体外延伸。

目前,所有的人工智能都是基于图灵机模型和冯•诺依曼架构可存储程序的计算机智能,我把它叫做传统人工智能。那么什么是新一代人工智能?既然是新一代,应该有一个跃升,而不是一个小小的增量,我认为是类脑智能,显然这可以是一个“新一代”。传统的人工智能和新一代人工智能的分界点又在哪?我觉得是机器碾压人类围棋高手,尤其是2016年人类所有的围棋高手都被阿尔法狗打败。

一般认为类脑智能是受脑科学启发的人工智能,但我认为这还不够全面。脑科学主要是关于生命科学和神经科学,我主张还要加入认知科学,包括社会科学和行为科学。这样类脑智能就是受脑科学和认知科学启发的人工智能。启发中重要的一点就是要剥离意识,不要纠结细节,要从介观结构上去类脑,不要从基因、分子、蛋白质这个结构去类脑,在智能行为上类人,在物理装置上重现人类智能。

除此以外,脑科学和认知科学还可以给AI什么样的启发?我们常说,飞机是受鸟启发,潜艇受鱼启发,人工智能受脑科学和认知科学的启发,我列了五条和大家一同体会。

第一,没有感知就不会有认知。现在计算机没有感知,只有键盘、显示屏,输入的是符号,而人脑和外界环境要不停交互,和外部客体之间一直存在着认知对应关系。比如,孩子怎么知道妈妈这个概念的?首先他知道自己有个妈妈,然后知道玩具小熊也可以有个妈妈,再后来知道妈妈也有妈妈,最后告诉他祖国也是我的母亲。四个妈妈都非常对应、十分清晰,最后会形成一个抽象的概念。

第二,脑的不同区域各有分工,实现脑认知的逐层抽象。小脑和大脑分工不一样,即使在大脑里各区域也不同。而现在计算机都是在内存里“折腾”,没有逐层。

第三,脑区大规模神经元组成记忆网络,对认知起决定性作用。它是个网络行为,不是计算机的存储。

第四,记忆认知导致注意力选择。人在看一幅图也好,一个景致也好,都是有选择的。

第五,人脑总是处在学习的状态。

以上第一、二、三、四条是来自脑科学的启发,一、三、四、五条是来自认知科学的启发。

人工智能已经发展了五六十年,它的优秀成果我们要继承下来,大致上讲有行为主义、符号主义、连接主义三个学派的成果。行为主义,希望机器人有像人一样的行为,产生了机器人的行为智能。符号主义希望机器有像人一样的思维,通过计算、预测和推理形成了可解释的AI。连接主义希望机器脑像人脑一样连接,所以有了20世纪70年代的机器学习,有了2 000年左右的深度学习。如今,我们发展新一代人工智能,计算主义学派的计算仍然要发挥下去,可以将连接主义拓展为记忆智能,实现记忆的快提取。人类智能的进化是先低阶后高阶,低阶认知产生感知智能和行为智能,高阶认知产生记忆智能和计算智能;而人工智能的发展恰恰相反,诞生于符号处理,低阶认知一直很弱,必须大大加强。怎么冲出当前传统人工智能的困境?能不能走多边主义的道路?能不能走“智智与共”的道路?我主张发扬计算智能,拓展感知智能、行为智能和记忆智能,用当前记忆把住计算的边界,让记忆认知成为新一代人工智能的突破口。

十几年前我就提出驾驶脑的概念。当时,全球无人驾驶都在讲感知、决策、控制,但仅有感知就能决策了吗?头脑里没有地图敢开车?我们提出一定要有瞬时记忆、工作记忆和长期记忆。工作记忆是当前的驾驶态势图,形成路权。一辆车要往前开,前面的空间越小,速度就越低,怎么把这么多的瞬时数据快速加到你的态势中,形成要解决问题——控制油门、刹车和方向盘的判断点。驾驶地图在人脑中不是一次形成的,这个地方是软地基,那个地方有个足球场,开到那里要慢一点,这些记忆都是靠长期积累的。总方针应该是“感知、认知、行为,再感知、再认知,再行为”。

最近几年我想把驾驶脑进一步推广到新一代人工智能普遍的通用架构。这个通用架构,要能够表达时序特征和时间的尺度特征,反映行为智能、感知智能和认知智能之间的层次性。采用情景数据和知识模型双驱动,不是简单地讲数据和知识双驱动,情境代表语境,数据代表语言,知识代表语义,模型代表算法,要能就地计算免搬移,自定时、自定位,时时刻刻都知道自己在哪里,自学习,自成长,用进废退,厚积薄发,与时俱进。

于是我开始设计一个新一代人工智能时空架构,包括一个外循环和两个内协同。即通过跨模态感知,实现感知行为的外循环,瞬时、短时和长期记忆的协同,以及计算和记忆间的协同。我个人认为,做数据处理应该以DPU为核心,让CPU和GPU作配角;在态势方面,以GPU为核心,让CPU和DPU作配角;只有在计算方面依然是CPU为核心,GPU和DPU作配角,而不是永远CPU作主角。CPU、DPU、GPU在不同的方面,担任不同的主角是很正常的事情。还有一个难点,是需要有一个知识库机器。目前是用搜索引擎,我希望能变成一个硬机器,变成一个知识库机,实现快搜索,以及记忆的快速提取,而通过计算的提取要慢一点。

在这个架构中,学习是对知识的巩固或者修改,这个过程我们把它叫做厚积薄发。当你遇到特定问题时,通过短时记忆触发记忆场景寻找解决方案。比如到一个路口,在场景记忆里路口要慢行,就不能再加速了,这叫做触发激活,激活你的有关知识。此外,短时记忆通过注意力选择,关注感兴趣的瞬时记忆,对数据进行选择压缩。

第二个再认识可以简单总结下。新一代人工智能包括记忆智能、计算智能、交互智能。从冯架构和新一代人工智能架构来看,新架构里包含冯架构,有了时间和交互。交互是同时发生的相互关联,两个人握手你知道我的温度、我知道你的力量,这和以前的先输入后输出是不一样的。高速缓存可以用来作瞬时记忆,外存是个中长期记忆,CPU和DPU、GPU在不同阶段作不同主角。感知能够实现时时刻刻外部世界和人脑概念的对应关系。


三、对农业革命的再认识


现在的农田作业,机械化很好,自动化不够,数字化基本没有。当前网络化和智能化正在倒逼自动化和数字化。智能时代农业革命的硬核,是把人工智能渗透到各式各样农田作业的动力工具中,成为农田作业机器人,发展智慧农业。我个人认为,拖拉机的无人驾驶是智能时代农业革命的起跑线。

农机的自动化即使做到极致,但如果自动驾驶不能像人一样具备学习能力,不能应对各种边缘工况,不能对各种作业机具实现精准操控,也很难完全代替人工劳动。把人类智能通过人工智能渗透、物化到动力工具里,成为会学习的农田作业机器人,正是我们的追求。

会学习的农机学习驾驶的过程是这样的:首先是标杆农机手作业时,驾驶脑在拖拉机里通过传感器开始向人悄悄的学习;拖拉机开了一段时间后,驾驶脑觉得学得差不多了,就可以要求进行操作;但你可能觉得驾驶脑干的还不够好,于是再通过训练指导一段时间;又一段时间过去了,你觉得驾驶脑确实挺好了,就开始批量生产其他的农机。这样反复迭代的有指导学习、半指导学习、无指导学习,就是从简单的动力工具变成智力工具,渗透到动力工具里的一个自成长、自学习的过程。

人类是比较着急的,一旦有智能了就想赶快做出来,我把这些叫做正学习。其实人类学习更多的是试错学习。我们遇到一次事故就永远会记得住,所以试错也很重要。我们可以通过深度学习或者生成对抗样本的强化学习,在拖拉机上装一个事故记忆棒,如果遇到特定的事故时,让事故棒对待它。因此,我们不但要有正学习,还要有试错的负学习。

未来种地是一种享受,田里只有无人拖拉机,人在家里通过智能网联控制它们。基于北斗的高精度地面CORS系统和5G超高带宽、超低延时和超大连接的能力,可极大减少拖拉机载的传感器。目前在拖拉机上使用不太贵的激光雷达就是这个道理,因为拖拉机操纵速度毕竟没那么高。发挥机、路、网、管协同优势,改善智能网联生态,形成垂直系统的农业物联网,实现精准遥控。

可交互、会学习、自成长的农田作业机器人,不但能彻底改变面朝黄土背朝天的农民形象,而且可模拟农业各类能工巧匠的智能,一专多能或多专多能;还可协同农民探索农业性问题,以润物细无声的柔软极大地解放人的体力和智力。新一代农民必将更加智慧,更加优雅的生活。

(本报告根据速记整理)

CAAI原创 丨 作者李德毅院士

未经授权严禁转载及翻译

如需转载合作请向学会或本人申请

转发请注明转自中国人工智能学会