2018年11月18日下午,西安电子科技大学计算机科学与技术学部主任、人工智能学院焦李成教授在成都参加了由中国人工智能学会主办的人工智能大讲堂并做特邀报告,焦李成教授在报告中回顾了深度神经网络发展历程,阐述了复杂影像的智能解译与识别问题,并激励大家在人工智能领域勇攀学术高峰,以下为报告记录。
焦李成:很高兴有这个机会跟大家一起交流。今天的演讲是命题作文,人工智能学会今年开始做人工智能大讲堂,学会理事会将其作为重要的品牌在做,以前是到各个学校去做,现在拿到高峰论坛来做是第一次。上午的也是张院长的命题作文,一定要谈人工智能,人才的培养,我觉得很高兴有这个机会,跟大家一起交流。
一个名字,深度神经网络,两句话大家记住了,李院士讲的是深度学习不是万能的,但是离开深度学习是万万不能的。这件事情作为我们内行人来讲,今年讲的也比较多,内行人也很自然能理解,给我们行业内讲是不讲这个事的,但是给一般的听众讲,包括给政府机关、百千万人才、长江杰青大讲堂都讲了这句话,这句话的意思是只要是能够结构化的、只要是能够有规则的、只要你是有数据的,那么这个问题,你不要企图和人工智能去拼。围棋就是这样,象棋也是这样,它们是封闭、完备的,在这些问题上你算不过人工智能,没有它算得快,同时这些规则在短时间内的实施性,人做不到,人有感情,机器没有感情,它下错一步,你说它怎么这么臭,它并不正视你,而是继续下,人工智能一秒钟算三千步,三万步,而人看三十步已经很伟大了。
这两个视频,一个是我学生做的,西安英卓未来公寓,另外一个是旷视做的。英卓未来公寓从房门开启一直到最后的离开都是通过智能完成的。当然你见不着人,但是人通过智能给了你最好的服务。所以他们开了第四家酒店,让大众能够体验到智能家居的生活、享受到智能的品质。旷视在做人脸识别这件事情,最早做这个事是商汤的Mark,我的学生、也是汤晓鸥老师的第一个学生,他做了20年的人脸识别,20年的坚守厚积薄发,去年的7月份到9月份,三个月内机场、高铁、银行全都用了他的技术。
大家都知道,这是波士顿动力狗。大家看,它的三级跳,人都不一定能够做得到,就是这么灵活,整个机器人经过这么几代以后,智能的行为、协调、所有的动作做的很棒,我觉得对我们人类是一种挑战。在反恐、排爆、探险,救险这些领域当中,这些技术是非常有用且必要的。我的学生做了一款为渐冻人服务的眼球控制智能出行及家居生活的轮椅系统,做了三代,正好有一位渐冻人“泰山英雄”,他的腿动不了,手也不能完全控制,但他靠着手登上了泰山、华山,所以公众叫他“泰山英雄”,有媒体联系到了我们,那么我们将赠送一台智能轮椅给他,人工智能确实能够改变我们人在某些情况下的不方便,我个人感觉还是一件非常有意义的事。这套轮椅系统能让渐冻人及其他肌肉或骨骼受损的人不仅在室外能自己走,跟刚才说的智能公寓结合起来,通过眼睛的控制,能完成从开门到开关灯、开关窗帘、洗澡间等所有的智能生活起居。在杭州的一个比赛中,这套系统也很轰动,得到了大家的认可,拿了一个奖项。当然回来了我们认识了“泰山英雄”,能让他有了适合他的轮椅、能切切实实的帮到渐冻人,这是更重要的,我和我的学生都感到非常高兴。
大家可能看不见,这是星载的,就是照相机和雷达装在卫星上然后拍摄地面的视频,船在动、高速上面的车在动、然后机场的飞机在起飞,这是卫星的视频。卫星视频数据量非常大也非常高维,我们同时做到了在卫星视频数据量级上的舰船、飞机、车辆的监测、跟踪和分类,就是你传送多少、运动速度多少、未知的信息全部能够同时的实时识别出来。
将来首先失业的有可能是播音员,为什么呢?现在的语音合成技术完全可以和董卿一样、和李梓萌一样,听上去有感情,但是声音是合成的。(视频)这样的话就可以全天候的进行播音。刚才举的波士顿动力、渐冻人的轮椅和智能工艺的结合、播音员的语音合成等例子都是活生生正在发生的。所以教育部也很重视人工智能,教育部各个专家组+咨询组31个人,整个分布在十几个高校。
其实我国的人工智能发展计划归结为三步走,四大任务,五大智能技术方向。三步走我们怎么跟、四大任务我们怎么去完成,还有五大方向我们在科研人才的培养上怎样去进行匹配,这是我们需要考虑的问题。我认为可以从四个部分考虑,一是基础理论,二是共性技术,第三是基础支撑平台,第四是智能化基础设施,智能基础设施建设怎么和物联网和云计算的基础设施的建设相互协调起来,是我们需要思考的。
工信部的《新一代人工智能产业发展三年行动计划》大家应该去看,目标很清楚,产品要出来,核心技术要突破,实际上是为整个智能社会和2025智能制造做准备,这件事大家一定要去做,要思考互联网、大数据、人工智能三个支撑体系和基础设施怎么样相互协同,相互协调,共同促进,你跟不上,你一定会落后。人工智能对全社会来讲是共性的技术、普适的技术,对教育来讲同样是共性的、普适的课程,这一点我们现在都无法去想象,人工智能对于教育或者是智慧教育带来的挑战,我希望大家一定要去关注。
高校的行动计划,今年教育部连发五文,时间规划涉及到2020年、2025年、2030年,内容涉及创新体系,人才培养体系,成果转化和示范应用的基地,它的目标是想干什么?对于高校教师,写写论文,带带学生已经不够了。人工智能的方向有什么呢?李院士讲了,这是经过多少次争论后列出来的主要方向,6到8个,要根据各个不同的学校、不同的单位,不同的特色去建相应的方向,一定要有特色而不能同质化。
围绕基础理论的研究基金委是有布局的,也经过了专家组充分的论证。人工智能的理论研究从56年到现在,一直在争论也一直在斗争,但不管你是三起三落还是八起八落,搞学术的人都得搞。别人不做的时候我们在做,别人不待见的时候我们也在做,高潮来的时候,该怎么样还怎么样,做学术的人就要初心不改做自己的事。所以人工智能从诞生之初到现在,从需要模拟人的基本智能,推理、知识、规划、学习、交流、感知到移动和操作物体的能力,始终在延伸,始终在往前走,水平在不断的去提高。人工智能不是人的智能,而是希望能够像人那样去思考,像自然演化那样去学习和进化。另外,进化计算和自然计算结合起来有一些挑战和问题,我觉得这两个之间的概括需要有人去做,我已经讲过几回,今天先不讲,未来希望有机会也跟大家聊一聊进化计算和自然计算的结合。
智能的两条道,学习和感知、优化和识别的能力什么时候都需要、什么时候都是智能的主体,怎么样能够把这两个结合起来?我认为这个时代说对了一部分,这部分就是可以用梯度算法去做,另外一部分是,进化计算在结构优化上一定是比BP强的,梯度从哪儿求这件事情我觉得还是值得思考,无法获得梯度怎么办?人工智能从开始的符号、联结、行为、贝叶斯到类推,人怎么认知、自然怎么学习演化、人是怎么想的、怎么看的、怎么听的、怎么说的、怎么走的、怎么动的……神经网络都做到了吗?我想说的是,从专家系统到中间基于特征的,再到声音、语言,文字、图像以及现在的感知行动结合起来,这件事上是值得我们去走的。
我个人认为人工智能四大挑战,无教师的学习何时能来?无监督的学习深度何时能做?机器人能够像人一样去感知和理解这个世界吗?机器的情感在哪里?前面说的这些都是网络范式去做的,而人是在环境、场景中、运动中去感知,首先是感知这个世界,然后理解这个世界,之后去指挥自己的行为,最后再做一系列的事情。所以最终人工智能要对环境、对场景、对情感去感知和理解,形成动力系统。更进一步,人工智能的发展最重要的还是人,这个时候带来的伦理、法律、道德、宗教等等深刻的社会问题我们怎么去思考它、怎么去理解它以及怎么去面对它。
美国白宫成立了人工智能研究中心,这是绝无仅有的,MIT结合AI成立新的计算机学院。这件事情我觉得对我们整个改革学校的教育,改革下一代的教育都有影响,我们要思考这意味着什么。人工智能改造了计算机的教育,斯坦福始终在创新引领的前沿,我们要思考他们做什么事情,我们要做以人为中心的人工智能的教育和改革。这件事情上,我们教育部的官员和教育工作者都要去好好学习,更要去看别人怎么去做。
所以说到对人工智能的战略投资,包括对社会的变革、长期的革命,MIT这件事情拿了10亿美金,CMU创办了世界上第一个人工智能本科专业,我知道在纽约办了一个艺术学院与人工智能的结合,他们用6.4亿美金,专门办了一个艺术学院。我们不能只知道人家做了这件事,更要看这件事的内容是什么,要眼光面向全世界,要看清楚怎么去做,我们要去引领。我就觉得这三件事情都是今年的,都是刚刚发生的事,所以这件事情上,我觉得美国还是清醒的,站在这个制高点,不能说我们人工智能计划已经很完美。当然国内的布局也很快,这件事情应该说叫做“顺势而为,趁势而上”,但我们千万不要说吃了一碗面条,我们脑子就很聪明,好像不是那么回事,要懂得做全局优化。
我想再强调一下,人工智能、机器学习和深度学习我们内行人应该要搞清楚。现在当然说没有比深度学习更有效的机器学习的办法,人工智能当然要去做事,肯定得靠深度学习,因为你面对的是黑箱、不完全的数据,而且宏观上是大数据,微观上对问题来讲又是小样本。所以对于深度学习,我们内行人离不开他但也不要起哄。在传统的体系结构下,机器学习和深度学习是什么?这个对话不在一个频道上。
有监督、无监督、半监督和强化的算法怎么用要看是什么情况,我们自己做这个内行的人,千万不要说你那个能干什么,这个能干什么,用的场合和问题不一样,你可能在不同的场合,不同的任务,不同的问题需要用不同的方法去解决。我现在就害怕大家陷入一个坑,我们再回到神经网络,最早1990年我出的书里神经网络的四个范式,反馈网络就是现在大家通常讲的网络,或者是递归反馈的。还有自组织网,以及没有体现的完全无监督的学习。
大数据就讲一句,我们所有处理的问题、深度学习的方法,机器学习的方法都一定是面向大数据的问题,但是单个问题拿到的又只是小样本,一定得记住这一点,这个意义上来讲,是大数据小样本再加学习,这件事情上我们一定要把它结合起来做。面对大数据,面对海量数据,面对结构和非结构的数据大部分深度神经网络是不可解释的、是黑箱的。大数据处理的很多方法,同样是不可解释的,因为我们现在处理这些数据时只讲大、只讲海,但处理数据其实也是物理过程,应当像人的认知过程那样是有生物意义和物理意义的,这个层面上来讲,你把那两个意义丢掉了,拿一堆数据就玩、算法递归迭代,最后什么都不解释,人的经验、规则哪里去了呢?你没有用上。我经常讲的,过马路的时候,对面有一个大美女,打了一个手机,还接了一个领导的电话,大车也穿过来了,旁边还有一个小偷跟着你,你怎么处理?肯定保命要紧,先过马路再说,人会分轻重缓急,而且是协同去做。回过头来,我认为最初研究神经网络的几个人是要提的。通过学习的概念,通过学习感知的思想,通过学习优化的思想,这个是神经网络的精髓。然后在这个基础上再去做。中间需要把任务完成得好,就要优化去做这件事情。所以说一定是学习、优化、协同、控制和数据结合的。
我的印象应该是在1988年Lippman的文章,所有神经网络做模式识别边界的分析,边界是那个时候划出来的。大家第一次知道,非线性的问题变得如此简单。那个时候才出来三层神经网络,但三层神经网络可以逼近任意函数,是理论上证明的,不是今天才做的。之后结构的设计、算法的构造,使得方法变得更加有效、实用,离问题更近。以前是数据不够、训练方法欠缺,同时人们的要求也没有那么迫切,硬件的运行也没有那么好,而现在这四个条件,大概相对30年前已经有了巨大的改善,我第一次看神经网络大概是83年,那个时候在成都听加州大学伯克利分校的蔡少棠讲了学一个月,讲的非线性和混沌,那时因为客观条件所限,研究发展不像现在那么迅速,而大数据的出现是应景了,这两者是契合了。这个意义上来讲,在具备了有利客观条件的今天,我们要把问题研究得更透彻,你怎么去进行感知、判断、决策,哪一个是决策者、哪一个是训练层、哪一个是推理层、哪一个是优化层得搞清楚了。非线性的嵌套是有结构的。从简单的特征,到特征的表征,到特征的学习,特征的表征与学习,现在演变成特征的表征学习,神经网络的演化进程是有脉络、有逻辑的。
关于神经网络和专家系统,专家系统三个要点要记住:知识的表示,知识的学习,知识的推理。早期推理知识的办法不多、表征的框架不多、手段不多。神经网络给了大家思想和方法,我希望大家记住对神经网络真正有贡献的是这些人,43年Hebb规则和MP模型。1962年Widrow和他的学生提出了LMS。第一台PC机是他发明的,其算法奠定了自适应信号处理和自适应控制技术基础。这个是俄罗斯籍的斯坦福的教授,这个人记住,其貌不扬,我觉得大家都应该记住他Werbos,BP算法是他提出来的,1974年在哈佛大学拿博士学位的时候,就发表了一篇论文就没有论文了,但是博士学位是拿到了,真正的BP算法是他提出来的,使三层神经网络可学习。整个大概十几年的时间很红火,而且是自己也做过世界神经网络学会的主席和先驱,加州工学院Hopfield,三篇文章奠定了他的基础。另外一个记住一个C.Mead,美国的三院院士,世界第一块神经网络的芯片是他做的,这个人在集成电路一直是明星,大家一定要记住这件事情,神经网络不仅是今天。这个是芬兰皇家科学院的院长T.Kohonen教授,他来过很多回,提出了自组织特征映射网。径向基神经网络出自Billing手,因为他是用基函数来做这件事情,做控制的人全部是用的,很高效。支撑向量机,这些都是神经网络模型,而且都是学习机,大家不要认为是完全跟神经网络没有关系,只是说那一阵跟神经网络“划清界限”。浅层到深层的学习,大家要明白,本质性上改变的是什么?你说前面的网络浅,那在哪里深呢?规模深、特征深、还是机理深?还是怎么做的呢?我说理解深度的时候,我们要去做深在什么地方,对数据的匹配在哪些上面是做了本质性的突破和改变,这件事情上我们一定要去做的。
我还是把他们列在一起,你记住所谓深度大咖的时候,别忘了上面这些人,这些人是他们的祖师爷。
中国神经网络的发展也是有一个过程的。
我们一直不说,但是路一直在走。简单的数据到了具体的对象,到了图像,从小波变换到了小波网络,从伸缩平移到了方向,到了图像旋转变换。所以说包括从地上到了天上,到了空中机载的。对象在变,需求在变,神经网络也好,机器学习也好,方法也在不断的往前走。所以我们是把这个结合起来在走。刚才为什么说我希望讲一下这些道理,因为进化计算的第一篇文章,不叫人工智能,是优化和学习在走,包括免疫的学习优化,包括我们用到多目标上面去做,包括做协同的、量子的,而且用到了真正目标的识别上,我们都做了。这个过程我们回过头来说,对于人工智能人才的培养,为什么我们心里面不太慌,经过了十四五年的实践和培养,反正我们也出了这些书,不敢说水平有多高,但是研究生,本科的教材是有参考的,我自己写的,我也在不断的更新。我们几十本书,应了人才培养教材之需,去年就包括做量子的,光学的,红外的,包括到认知的,稀疏的,一直到高分辨遥感,老先生一定要改成雷达图像,我们一路走过来,今年完成的是量子计算,计算智能,简明人工智能等七八本,大概也有好几十万字。计算智能还有模式识别,反正都是在50、60万字以上,还有自然计算的前沿,就是相当于深度学习的前沿,还有一个大数据智能挖掘的。
从第一代到第二代,一直到现在的第三代神经网络,变化在什么地方,本质在什么地方,做这件事情,我们一定要去。第一个是卷积神经网络,我理解的跟别人理解的卷积神经网络不一样,很简单就是内积。然后在电路里面,在学习信息里面,很简单,怎么走?一卷不就出来了嘛,卷积的概念大家知道是从数字信号处理出来的概念,物理概念和描述很清楚。其实最开始的时候,卷积也不火,不像现在牛哄哄的。
递归神经网络,一定有联想记忆的。其实模式识别,以前叫做联想记忆,联想记忆学习优化。这四件事情,要是在神经网络里实现了,你的功能就比单纯的卷积去做要强大得多。所以递归同样是可以做这件事情。
深度置信网提供的思想一定要记住,我能够通过概率的判断做某件事情。我通过概率的判断和生成,能够使这个神经网络的构造性设计更加合理和有效。这是置信网的贡献。其实现在更热的是贝叶斯网络学习。贝叶斯的分布。
分布完了以后,参数少。接下来就是可学习,这个参数我们可以学出来,学习关键的参数,那么这个分布就找到了,或者优化的分布就找到了。实际上就是做了一个分布的估计。贝叶斯的描述、表征,估计和深度结合起来,这是贝叶斯网络火起来最重要的原因。很自然,大家好不容易抓住一个贝叶斯分布,而且可以去做。深度可以给你学,何乐而不为,大家一定要找到一个结合点!
才能做这件事情。
主办单位:亚新综合体育·(中国)官方网站 网站运营:北京中电创智科技有限公司 国网信通亿力科技有限责任公司 销售热线:400-007-1585
项目合作:400-007-1585 投稿:63413737 传真:010-58689040 投稿邮箱:yaoguisheng@chinapower.com.cn
《 中华人民共和国电信与信息服务业务经营许可证 》编号:京ICP证140522号 京ICP备14013100号 京公安备11010602010147号
2018年11月18日下午,西安电子科技大学计算机科学与技术学部主任、人工智能学院焦李成教授在成都参加了由中国人工智能学会主办的人工智能大讲堂并做特邀报告,焦李成教授在报告中回顾了深度神经网络发展历程,阐述了复杂影像的智能解译与识别问题,并激励大家在人工智能领域勇攀学术高峰,以下为报告记录。
焦李成:很高兴有这个机会跟大家一起交流。今天的演讲是命题作文,人工智能学会今年开始做人工智能大讲堂,学会理事会将其作为重要的品牌在做,以前是到各个学校去做,现在拿到高峰论坛来做是第一次。上午的也是张院长的命题作文,一定要谈人工智能,人才的培养,我觉得很高兴有这个机会,跟大家一起交流。
一个名字,深度神经网络,两句话大家记住了,李院士讲的是深度学习不是万能的,但是离开深度学习是万万不能的。这件事情作为我们内行人来讲,今年讲的也比较多,内行人也很自然能理解,给我们行业内讲是不讲这个事的,但是给一般的听众讲,包括给政府机关、百千万人才、长江杰青大讲堂都讲了这句话,这句话的意思是只要是能够结构化的、只要是能够有规则的、只要你是有数据的,那么这个问题,你不要企图和人工智能去拼。围棋就是这样,象棋也是这样,它们是封闭、完备的,在这些问题上你算不过人工智能,没有它算得快,同时这些规则在短时间内的实施性,人做不到,人有感情,机器没有感情,它下错一步,你说它怎么这么臭,它并不正视你,而是继续下,人工智能一秒钟算三千步,三万步,而人看三十步已经很伟大了。
这两个视频,一个是我学生做的,西安英卓未来公寓,另外一个是旷视做的。英卓未来公寓从房门开启一直到最后的离开都是通过智能完成的。当然你见不着人,但是人通过智能给了你最好的服务。所以他们开了第四家酒店,让大众能够体验到智能家居的生活、享受到智能的品质。旷视在做人脸识别这件事情,最早做这个事是商汤的Mark,我的学生、也是汤晓鸥老师的第一个学生,他做了20年的人脸识别,20年的坚守厚积薄发,去年的7月份到9月份,三个月内机场、高铁、银行全都用了他的技术。
大家都知道,这是波士顿动力狗。大家看,它的三级跳,人都不一定能够做得到,就是这么灵活,整个机器人经过这么几代以后,智能的行为、协调、所有的动作做的很棒,我觉得对我们人类是一种挑战。在反恐、排爆、探险,救险这些领域当中,这些技术是非常有用且必要的。我的学生做了一款为渐冻人服务的眼球控制智能出行及家居生活的轮椅系统,做了三代,正好有一位渐冻人“泰山英雄”,他的腿动不了,手也不能完全控制,但他靠着手登上了泰山、华山,所以公众叫他“泰山英雄”,有媒体联系到了我们,那么我们将赠送一台智能轮椅给他,人工智能确实能够改变我们人在某些情况下的不方便,我个人感觉还是一件非常有意义的事。这套轮椅系统能让渐冻人及其他肌肉或骨骼受损的人不仅在室外能自己走,跟刚才说的智能公寓结合起来,通过眼睛的控制,能完成从开门到开关灯、开关窗帘、洗澡间等所有的智能生活起居。在杭州的一个比赛中,这套系统也很轰动,得到了大家的认可,拿了一个奖项。当然回来了我们认识了“泰山英雄”,能让他有了适合他的轮椅、能切切实实的帮到渐冻人,这是更重要的,我和我的学生都感到非常高兴。
大家可能看不见,这是星载的,就是照相机和雷达装在卫星上然后拍摄地面的视频,船在动、高速上面的车在动、然后机场的飞机在起飞,这是卫星的视频。卫星视频数据量非常大也非常高维,我们同时做到了在卫星视频数据量级上的舰船、飞机、车辆的监测、跟踪和分类,就是你传送多少、运动速度多少、未知的信息全部能够同时的实时识别出来。
将来首先失业的有可能是播音员,为什么呢?现在的语音合成技术完全可以和董卿一样、和李梓萌一样,听上去有感情,但是声音是合成的。(视频)这样的话就可以全天候的进行播音。刚才举的波士顿动力、渐冻人的轮椅和智能工艺的结合、播音员的语音合成等例子都是活生生正在发生的。所以教育部也很重视人工智能,教育部各个专家组+咨询组31个人,整个分布在十几个高校。
其实我国的人工智能发展计划归结为三步走,四大任务,五大智能技术方向。三步走我们怎么跟、四大任务我们怎么去完成,还有五大方向我们在科研人才的培养上怎样去进行匹配,这是我们需要考虑的问题。我认为可以从四个部分考虑,一是基础理论,二是共性技术,第三是基础支撑平台,第四是智能化基础设施,智能基础设施建设怎么和物联网和云计算的基础设施的建设相互协调起来,是我们需要思考的。
工信部的《新一代人工智能产业发展三年行动计划》大家应该去看,目标很清楚,产品要出来,核心技术要突破,实际上是为整个智能社会和2025智能制造做准备,这件事大家一定要去做,要思考互联网、大数据、人工智能三个支撑体系和基础设施怎么样相互协同,相互协调,共同促进,你跟不上,你一定会落后。人工智能对全社会来讲是共性的技术、普适的技术,对教育来讲同样是共性的、普适的课程,这一点我们现在都无法去想象,人工智能对于教育或者是智慧教育带来的挑战,我希望大家一定要去关注。
高校的行动计划,今年教育部连发五文,时间规划涉及到2020年、2025年、2030年,内容涉及创新体系,人才培养体系,成果转化和示范应用的基地,它的目标是想干什么?对于高校教师,写写论文,带带学生已经不够了。人工智能的方向有什么呢?李院士讲了,这是经过多少次争论后列出来的主要方向,6到8个,要根据各个不同的学校、不同的单位,不同的特色去建相应的方向,一定要有特色而不能同质化。
围绕基础理论的研究基金委是有布局的,也经过了专家组充分的论证。人工智能的理论研究从56年到现在,一直在争论也一直在斗争,但不管你是三起三落还是八起八落,搞学术的人都得搞。别人不做的时候我们在做,别人不待见的时候我们也在做,高潮来的时候,该怎么样还怎么样,做学术的人就要初心不改做自己的事。所以人工智能从诞生之初到现在,从需要模拟人的基本智能,推理、知识、规划、学习、交流、感知到移动和操作物体的能力,始终在延伸,始终在往前走,水平在不断的去提高。人工智能不是人的智能,而是希望能够像人那样去思考,像自然演化那样去学习和进化。另外,进化计算和自然计算结合起来有一些挑战和问题,我觉得这两个之间的概括需要有人去做,我已经讲过几回,今天先不讲,未来希望有机会也跟大家聊一聊进化计算和自然计算的结合。
智能的两条道,学习和感知、优化和识别的能力什么时候都需要、什么时候都是智能的主体,怎么样能够把这两个结合起来?我认为这个时代说对了一部分,这部分就是可以用梯度算法去做,另外一部分是,进化计算在结构优化上一定是比BP强的,梯度从哪儿求这件事情我觉得还是值得思考,无法获得梯度怎么办?人工智能从开始的符号、联结、行为、贝叶斯到类推,人怎么认知、自然怎么学习演化、人是怎么想的、怎么看的、怎么听的、怎么说的、怎么走的、怎么动的……神经网络都做到了吗?我想说的是,从专家系统到中间基于特征的,再到声音、语言,文字、图像以及现在的感知行动结合起来,这件事上是值得我们去走的。
我个人认为人工智能四大挑战,无教师的学习何时能来?无监督的学习深度何时能做?机器人能够像人一样去感知和理解这个世界吗?机器的情感在哪里?前面说的这些都是网络范式去做的,而人是在环境、场景中、运动中去感知,首先是感知这个世界,然后理解这个世界,之后去指挥自己的行为,最后再做一系列的事情。所以最终人工智能要对环境、对场景、对情感去感知和理解,形成动力系统。更进一步,人工智能的发展最重要的还是人,这个时候带来的伦理、法律、道德、宗教等等深刻的社会问题我们怎么去思考它、怎么去理解它以及怎么去面对它。
美国白宫成立了人工智能研究中心,这是绝无仅有的,MIT结合AI成立新的计算机学院。这件事情我觉得对我们整个改革学校的教育,改革下一代的教育都有影响,我们要思考这意味着什么。人工智能改造了计算机的教育,斯坦福始终在创新引领的前沿,我们要思考他们做什么事情,我们要做以人为中心的人工智能的教育和改革。这件事情上,我们教育部的官员和教育工作者都要去好好学习,更要去看别人怎么去做。
所以说到对人工智能的战略投资,包括对社会的变革、长期的革命,MIT这件事情拿了10亿美金,CMU创办了世界上第一个人工智能本科专业,我知道在纽约办了一个艺术学院与人工智能的结合,他们用6.4亿美金,专门办了一个艺术学院。我们不能只知道人家做了这件事,更要看这件事的内容是什么,要眼光面向全世界,要看清楚怎么去做,我们要去引领。我就觉得这三件事情都是今年的,都是刚刚发生的事,所以这件事情上,我觉得美国还是清醒的,站在这个制高点,不能说我们人工智能计划已经很完美。当然国内的布局也很快,这件事情应该说叫做“顺势而为,趁势而上”,但我们千万不要说吃了一碗面条,我们脑子就很聪明,好像不是那么回事,要懂得做全局优化。
我想再强调一下,人工智能、机器学习和深度学习我们内行人应该要搞清楚。现在当然说没有比深度学习更有效的机器学习的办法,人工智能当然要去做事,肯定得靠深度学习,因为你面对的是黑箱、不完全的数据,而且宏观上是大数据,微观上对问题来讲又是小样本。所以对于深度学习,我们内行人离不开他但也不要起哄。在传统的体系结构下,机器学习和深度学习是什么?这个对话不在一个频道上。
有监督、无监督、半监督和强化的算法怎么用要看是什么情况,我们自己做这个内行的人,千万不要说你那个能干什么,这个能干什么,用的场合和问题不一样,你可能在不同的场合,不同的任务,不同的问题需要用不同的方法去解决。我现在就害怕大家陷入一个坑,我们再回到神经网络,最早1990年我出的书里神经网络的四个范式,反馈网络就是现在大家通常讲的网络,或者是递归反馈的。还有自组织网,以及没有体现的完全无监督的学习。
大数据就讲一句,我们所有处理的问题、深度学习的方法,机器学习的方法都一定是面向大数据的问题,但是单个问题拿到的又只是小样本,一定得记住这一点,这个意义上来讲,是大数据小样本再加学习,这件事情上我们一定要把它结合起来做。面对大数据,面对海量数据,面对结构和非结构的数据大部分深度神经网络是不可解释的、是黑箱的。大数据处理的很多方法,同样是不可解释的,因为我们现在处理这些数据时只讲大、只讲海,但处理数据其实也是物理过程,应当像人的认知过程那样是有生物意义和物理意义的,这个层面上来讲,你把那两个意义丢掉了,拿一堆数据就玩、算法递归迭代,最后什么都不解释,人的经验、规则哪里去了呢?你没有用上。我经常讲的,过马路的时候,对面有一个大美女,打了一个手机,还接了一个领导的电话,大车也穿过来了,旁边还有一个小偷跟着你,你怎么处理?肯定保命要紧,先过马路再说,人会分轻重缓急,而且是协同去做。回过头来,我认为最初研究神经网络的几个人是要提的。通过学习的概念,通过学习感知的思想,通过学习优化的思想,这个是神经网络的精髓。然后在这个基础上再去做。中间需要把任务完成得好,就要优化去做这件事情。所以说一定是学习、优化、协同、控制和数据结合的。
我的印象应该是在1988年Lippman的文章,所有神经网络做模式识别边界的分析,边界是那个时候划出来的。大家第一次知道,非线性的问题变得如此简单。那个时候才出来三层神经网络,但三层神经网络可以逼近任意函数,是理论上证明的,不是今天才做的。之后结构的设计、算法的构造,使得方法变得更加有效、实用,离问题更近。以前是数据不够、训练方法欠缺,同时人们的要求也没有那么迫切,硬件的运行也没有那么好,而现在这四个条件,大概相对30年前已经有了巨大的改善,我第一次看神经网络大概是83年,那个时候在成都听加州大学伯克利分校的蔡少棠讲了学一个月,讲的非线性和混沌,那时因为客观条件所限,研究发展不像现在那么迅速,而大数据的出现是应景了,这两者是契合了。这个意义上来讲,在具备了有利客观条件的今天,我们要把问题研究得更透彻,你怎么去进行感知、判断、决策,哪一个是决策者、哪一个是训练层、哪一个是推理层、哪一个是优化层得搞清楚了。非线性的嵌套是有结构的。从简单的特征,到特征的表征,到特征的学习,特征的表征与学习,现在演变成特征的表征学习,神经网络的演化进程是有脉络、有逻辑的。
关于神经网络和专家系统,专家系统三个要点要记住:知识的表示,知识的学习,知识的推理。早期推理知识的办法不多、表征的框架不多、手段不多。神经网络给了大家思想和方法,我希望大家记住对神经网络真正有贡献的是这些人,43年Hebb规则和MP模型。1962年Widrow和他的学生提出了LMS。第一台PC机是他发明的,其算法奠定了自适应信号处理和自适应控制技术基础。这个是俄罗斯籍的斯坦福的教授,这个人记住,其貌不扬,我觉得大家都应该记住他Werbos,BP算法是他提出来的,1974年在哈佛大学拿博士学位的时候,就发表了一篇论文就没有论文了,但是博士学位是拿到了,真正的BP算法是他提出来的,使三层神经网络可学习。整个大概十几年的时间很红火,而且是自己也做过世界神经网络学会的主席和先驱,加州工学院Hopfield,三篇文章奠定了他的基础。另外一个记住一个C.Mead,美国的三院院士,世界第一块神经网络的芯片是他做的,这个人在集成电路一直是明星,大家一定要记住这件事情,神经网络不仅是今天。这个是芬兰皇家科学院的院长T.Kohonen教授,他来过很多回,提出了自组织特征映射网。径向基神经网络出自Billing手,因为他是用基函数来做这件事情,做控制的人全部是用的,很高效。支撑向量机,这些都是神经网络模型,而且都是学习机,大家不要认为是完全跟神经网络没有关系,只是说那一阵跟神经网络“划清界限”。浅层到深层的学习,大家要明白,本质性上改变的是什么?你说前面的网络浅,那在哪里深呢?规模深、特征深、还是机理深?还是怎么做的呢?我说理解深度的时候,我们要去做深在什么地方,对数据的匹配在哪些上面是做了本质性的突破和改变,这件事情上我们一定要去做的。
我还是把他们列在一起,你记住所谓深度大咖的时候,别忘了上面这些人,这些人是他们的祖师爷。
中国神经网络的发展也是有一个过程的。
我们一直不说,但是路一直在走。简单的数据到了具体的对象,到了图像,从小波变换到了小波网络,从伸缩平移到了方向,到了图像旋转变换。所以说包括从地上到了天上,到了空中机载的。对象在变,需求在变,神经网络也好,机器学习也好,方法也在不断的往前走。所以我们是把这个结合起来在走。刚才为什么说我希望讲一下这些道理,因为进化计算的第一篇文章,不叫人工智能,是优化和学习在走,包括免疫的学习优化,包括我们用到多目标上面去做,包括做协同的、量子的,而且用到了真正目标的识别上,我们都做了。这个过程我们回过头来说,对于人工智能人才的培养,为什么我们心里面不太慌,经过了十四五年的实践和培养,反正我们也出了这些书,不敢说水平有多高,但是研究生,本科的教材是有参考的,我自己写的,我也在不断的更新。我们几十本书,应了人才培养教材之需,去年就包括做量子的,光学的,红外的,包括到认知的,稀疏的,一直到高分辨遥感,老先生一定要改成雷达图像,我们一路走过来,今年完成的是量子计算,计算智能,简明人工智能等七八本,大概也有好几十万字。计算智能还有模式识别,反正都是在50、60万字以上,还有自然计算的前沿,就是相当于深度学习的前沿,还有一个大数据智能挖掘的。
从第一代到第二代,一直到现在的第三代神经网络,变化在什么地方,本质在什么地方,做这件事情,我们一定要去。第一个是卷积神经网络,我理解的跟别人理解的卷积神经网络不一样,很简单就是内积。然后在电路里面,在学习信息里面,很简单,怎么走?一卷不就出来了嘛,卷积的概念大家知道是从数字信号处理出来的概念,物理概念和描述很清楚。其实最开始的时候,卷积也不火,不像现在牛哄哄的。
递归神经网络,一定有联想记忆的。其实模式识别,以前叫做联想记忆,联想记忆学习优化。这四件事情,要是在神经网络里实现了,你的功能就比单纯的卷积去做要强大得多。所以递归同样是可以做这件事情。
深度置信网提供的思想一定要记住,我能够通过概率的判断做某件事情。我通过概率的判断和生成,能够使这个神经网络的构造性设计更加合理和有效。这是置信网的贡献。其实现在更热的是贝叶斯网络学习。贝叶斯的分布。
分布完了以后,参数少。接下来就是可学习,这个参数我们可以学出来,学习关键的参数,那么这个分布就找到了,或者优化的分布就找到了。实际上就是做了一个分布的估计。贝叶斯的描述、表征,估计和深度结合起来,这是贝叶斯网络火起来最重要的原因。很自然,大家好不容易抓住一个贝叶斯分布,而且可以去做。深度可以给你学,何乐而不为,大家一定要找到一个结合点!
才能做这件事情。