在5月25-28日举办的2017“深度学习与大数据感知”国际研讨会暨第十八届学术周上,包括国家973项目首席科学家、IEEEFellow、国外高校ChairProfessor、DistinguishedLecturer等在内的33位国内外权威专家学者带来了他们在人工智能领域最前沿的研究成果,45场学术报告精彩纷呈,华山论剑,学术争鸣,引爆多个当下的AI热点。本文根据学术周期间的现场速记进行整理归纳,将专家们提出的主要观点及报告内容再次呈现出来,供大家参考。
韩崇昭:基于脑认知机理的条件证据理论及其深度学习方法
在网络化系统对智能感知的需求方面,韩崇昭教授介绍,多平台协同作战战术信息系统,需要在武器协同数据链的支持下,将武器平台、传感器平台和指控单元进行有机地交联,完成目标探测与识别,目标跟踪与定位,目标协同精确打击与评估等功能,我国对网络化协同作战的重大需求是未来要具有“远离国土的三军协同作战能力”,“亟需研究满足远离国土超视距作战环境中武器协同作战战术信息处理的理论与方法”。
在基于脑认知机理的条件证据理论研究进展方面,韩崇昭教授指出:“人和动物的认知机理一直是认知科学和人工智能研究的重点,人类和动物大脑进行信息融合的机理研究仍然是一个广阔的领域,启发我们建立基于生物多模异构信息融合机制的多源异构信息融合方法,从而达到非结构化信息互补集成的目的。”另外,随机集理论是统一人工智能各个分支的一个有效的数学工具,Dempster-Shafer合成公式就是用随机集的观点来看就是随机集的交运算,如此晦涩的证据合成理论变得如此简单,“我们可以合理的期望利用随机集理论得到更为有用的结论。”研究异构信息融合时,韩崇昭教授认为必须具有两个基本观点:1、万能分类器是不存在的;2、对多分类器系统而言,影响分类结果好坏的主要因素在于其中各分类器的性能互补或相异性。韩崇昭教授提出了异构特征空间同化的方法:“异构特征空间的同化必须同化到相同的类集合上来,然后进行处理。”
在条件证据理论的深度学习方法及其应用方面,韩崇昭教授认为:“深度学习方法是一个新的方法,没有现成的东西借鉴,我们的思路是1、以实际问题为背景,建立适合条件证据理论的应用框架;2、以实际数据驱动推理过程,并以真实数据验证推理结果的合理性或正确性;3、修改条件证据理论,达到比较实用的程度。”
张青富:RecentProgressinMOEA/D
孟德宇:如何度量张量的稀疏性
孟德宇教授介绍了度量张量的稀疏性的研究成果,他指出“张量是一个很宝贵的资源”,它有有更丰富的结构,更本质的信息,“我们的期望是仍然保持原来张量的结构,而不是退化为一个向量或一个矩阵,从而尽可能的挖掘其中的信息。”孟教授如是说。目前,张量稀疏性的研究成果还不多,现有的主要研究方法基本思想是将张量各个维度展开后各个矩阵获得的秩加权求和,最基本的加权就是平均,但孟德宇教授指出这个方法有三个问题:一是它没有物理含义,二是这种张量稀疏性的描述和矩阵的低秩性、向量的低秩性是不统一的,没办法在同一个框架、同一个物理意义下去理解,三是操作性问题,即λ怎么选。对张量进行低秩分解中有两种主流的分解方法,一种是Tucker分解,一种是CP分解,孟德宇教授介绍:“Tucker张量对于张量稀疏性的描述优势在于它可以体现出在每一个维度张量展开的矩阵的低秩性,问题在于中间的核张量里面的形态我们一无所知,更不知道里面有什么信息。”“CP张量的优势在于它的稀疏性的表达和矩阵及向量之前的基非常一致,理解起来非常直观,问题是不能体现每一个维度的低秩性。”针对上述张量研究中存在的问题,孟德宇教授经过研究给出了一种张量稀疏性的表达:
这种表达把Tucker分解和CP分解两种方式融合了起来,其物理含义非常清晰,即“要表达一个张量的时候到底需要多少Kronecker基,Kronecker基是对应张量空间里最简单的张量”,“一阶的稀疏性和二阶的稀疏性其实就是Kronecker基的描述”,从而解决了张量和矩阵、向量的描述不统一问题,“在此框架下可以导出一个非常自然的自适应加权方案”则解决了λ怎么选的问题。孟德宇教授在此基础上做了三个应用模型:Tensorrecoverymode、lTensorcompletionmodel和TensorrobustPCAmodel,并将这三个模型分别应用到了高光谱图像去噪、高光谱图像填充以及背景提取的问题中。
潘泉:变分贝叶斯联合优化及应用
潘泉教授基于天波超级雷达的应用及战略预警系统要求的背景下,在信息融合领域做了多年的研究,他指出传统信息融合序贯处理模式的主要问题有三方面:“单一方法只能解决某一类问题,无法处理更复杂的情况”、“采用算法序贯‘拼接’处理复杂问题,会造成误差的累积传播”、“处理结构开环,没有利用信息的闭环反馈”。现代雷达发展趋势是认知化、软件化、网络化,这个趋势提出了信息处理与融合必须考虑具有反馈、联合处理的一体化架构,潘泉教授介绍了已经出现的一系列联合的概念和方法,如TBD、JCE、JAE、JTC,他还进一步提出思考:“我们能不能考虑一个新的信息处理的方法,重新构造一个信息处理的架构,打破过去信号处理点迹、数据、估计、识别这样的一个藩篱,我觉得这个时代应该到来了,未来应该没有信号处理、数据处理之分,它们应该都是软件定义,它们之间应该是高度综合融合的,现在的问题是有没有好的算法能把它们放到一起来考虑,这是一个很大的挑战。”
杜培军:SceneRepresentationandClassificationfromRemoteSensingImagesBasedonDeepLearning
张军:大数据、云计算、物联网:计算智能的研究前沿与应用
刘静:WhatCanEvolutionaryAlgorithmsDoonComplexNetworks
孙涛:大数据与AI时代
孙涛博士首先介绍了大数据及华为在大数据服务方面的进展,他指出:“大数据分为两大类,一类是人产生的数据,另外很大一部分是来自于工业数据,随着物联网的发展,尤其无人驾驶现在一天能产生几十个T的数据,机器产生的数据将会是未来另外一个具有挑战的问题。”华为公司现有图计算,实时服务,DIS服务等,瞄准大数据的4V特征,挖掘数据金矿,孙涛博士介绍,华为拥有多种数据洞察方式,更快的分布式查询服务以及更强的流处理服务。
芯片是AI发展的另外一个重要支撑,训练阶段对芯片的需求是大计算+大存储+大带宽,推理侧的需求是低功耗+有限空间+实时处理。孙涛博士提出未来芯片要解决的一个关键问题是:“怎样构建像人脑一样高效、高能耗的芯片,当前芯片和人脑的消耗差了六个量级,就是10的6次方,现有技术大概能提升3个量级,但还是有3个量级的差距。”
金耀初:数据驱动的进化优化
报告开始金教授就指出他多次在公开场合提出“高维多目标的优化若是利用传统的两三维目标优化算法来做是有很大局限性和问题的”,同时指出现如今有很多学者盲目的使用进化算法,但是这是不对的,一定要根据自己所需要解决的问题来判断进化计算是否适用,金教授认为“进化计算的思想非常适用于多目标优化的问题”,在报告里金教授对在大数据环境下的进化计算方法的设计所面临的挑战提出了自己的观点,那就是“如何减少算法的计算量是在大数据环境下迫切需要解决的问题”。此外,金教授还提出了另一种在小数据环境下的挑战,就是如何在样本数据非常稀少的情况下设计进化算法。
孙富春:面向机器人灵巧操作的认知传感与大数据处理
孙富春教授在报告开始就说“机器人是自动化的最后一公里,灵巧操作是最后的一厘米,那么认知传感就是最后的一毫米”,所以可见认知传感在机器人的灵巧操作上非常重要。孙老师指出“新一代机器人一定是基于认知传感技术的”,比如人手的触觉在脑区究竟如何表达,之后各个脑区怎样合作进行融合,融合的信息怎样去实现已操作目标和环境的认知,最后如何利用人的认知本能再加上经验进行动作的预测和运动的控制。同时提出“如今能为我们进行服务的技术有云技术,大数据处理技术,类脑认知技术,以及先进的分布式的控制技术”。报告最后,孙教授就下一代机器人所面临的挑战进行了说明,其中包括机器人认知的体系结构要像人脑一样并行;而且能够实现对不同形态信息的表征,特别是跨模态的信息表征和处理;另外还要有像人一样的认知本质。
焦李成:深度学习影像感知与解译
报告开始,焦李成教授说道“提及深度学习,大部分人首先想到的是像吴恩达、于凯这样的红人,首要的反应就是深度很火,且无所不能,无所不在,但是越是此时我们越是要清醒,其实神经网络的发展也代表了人工智能发展的一个侧面,也代表了机器学习的一个侧面”。之后焦李成教授介绍了一大批国内外神经网络学科的前辈科学家,并强调“现如今的深度学习在商业领域之所以如此受到推崇,是由于那些前辈科学家的贡献为其奠定了坚实的理论基础”。焦李成教授在报告中指出“和当初的神经网络相比,现在的深度神经网络理论进展并不大,但是由于当前大数据对象的需要,又有计算机硬件软件技术的发展,才促成了现在的神经网络可以加很多层可以做很多事。”报告最后,焦李成教授对我们年轻一代的研究者提出了希望,“这是大数据和深度学时的时代,但也是年轻人的时代,解决智能人机交互,智能自主学习,智能推理以及智能自动驾驶是未来我们需要解决的深度学习难题”
杨少毅:Robot到AI
杨少毅认为:“人工智能的发展趋势是社会进步的必然选择,大数据时代的来临,将加速人工智能的发展。”杨少毅指出:“像人一样,人工智能的发展也需要学习,这些知识和经验是以海量的数据为支撑,这样,人工智能的巨大潜力才可能被逐步释放。如果把人工智能比作火箭,大数据就是燃料。”
张向荣:基于深度学习的遥感影像解译
张向荣教授应用深度学习的方法在路径提取和高光谱感知图像分类方面做了研究工作,全卷积网络FCN拥有杰出的图像分割能力,张向荣教授介绍采用FCN进行路径提取,在FCN4s模型的基础上加入权值-损失函数,解决了样本正反例不平衡的问题。此外,她还基于GAN做了完善改进应用于路径提取。在高光谱感知图像分类中,张向荣教授则使用了RNN、LSTM,都取得了良好的成果。
史玉回:头脑风暴优化算法
史玉回教授在报告开始时指出“现如今的粒子群算法在很大程度上都是基于低等动物的群体智能行为提出的,而人类作为高等动物会很聪明,那么一群人的群体行为是否可以抽象出来形成优化算法?”针对这一疑问,史老师提出了头脑风暴优化算法。并认为“当想要仿真问题拥有者在一群想法中挑选其认为好的想法这类问题时,由于头脑风暴优化算法和维数无关,所以很适用大规模的优化问题”。报告最后,史玉回教授提出“群体智能的主要问题是优化,需要把所有的问题描述成一个优化问题,如何把许多目标优化问题分解成多个多目标优化问题并可以并行化运行,是头脑风暴的挑战”。
杜兰:卷积神经网络及其在SAR图像解译中的应用
杜兰教授在报告中认为“深度学习在近年来的发展非常快,很多人工智能的应用领域都有用到深度学习的方法,另外学术上也有很多关于深度学习的研讨会,甚至一些应用领域的期刊都有发表深度学习的专刊,但是深度神经网络学习却并不是一个新的概念。它的出现和我们计算量的提升以及大数据的背景是分不开的。”
邬刚:基于FPGA的深度学习加速方案
邬总在报告开始就申明“我的报告和别的专家的思路不太一样,是从硬件的角度来看在机器学习上该怎么做,更多的是从工程化的角度来做硬件加速。”邬总指出“FPGA是用异构的计算来提高计算能力,而计算能力决定算法演进的速度。FPGA最大的优势就是通过互连的方法,通过高性能计算网络接口的方法,可以实现更高性能的训练,因此,把学习算法载入到硬件芯片FPGA中,是使算法运行加速从而满足实际应用的必然手段”与此同时,邬总也指出了“BP算法的反向传播是影响硬件最大的瓶颈,这是因为反向传播会造成巨大的串行,此外,算法的训练模型也有待改进”,所以报告最后,邬总呼吁学术界,希望可以改变这种算法的反向传播,尽量用正向计算,以及压缩训练模型找到最佳架构,使得算法和硬件可以更好的匹配。
侯彪:高分辨率SAR图像目标检测
侯彪教授介绍,随着SAR图像分辨率的升高,车辆目标已有明显变化,不再是一个或少数几个点,而是一片区域,SAR图像分辨率的升高带来了更多细节信息,这对处理速度造成了挑战,对这些信息的系数花表示成为了重要的问题。传统CFAR方法在中低分辨率的SAR图像目标检测中效果较好,但在高分辨SAR图像上表现不佳,针对前述种种问题,侯彪教授提出了分层字典学习方法,分层的依据由对高分辨SAR图像进行初分类的结果得到。
姚新:OnlineEnsembleLearningofClassImbalanceData
HisaoIshibuchi:CurrentHotTopicsinMany-ObjectiveOptimization
刘宏:OnlineGrowingNeuralGasforAnomalyDetectioninChangingSurveillanceScenes
刘宏教授开场即表示,他以及他的团队的使命始终是让机器人更加“耳聪目明”,即机器人的视、听、思维,致力于做机器人“脖子以上的工作”。刘宏教授认为做机器人要注重三个结合:第一,注重视觉和听觉的结合,就如人的能力依赖于视觉听觉,机器视觉能力有限、听觉有限,但融合起来能力就能大幅度提高;第二注重感知与运动结合;第三注重技术和产业结合,融合人工智能技术和机器人产业。刘宏教授现在以及未来十年的主要工作是开发北大智能人工头系统,他“坚信人工头是人工智能和机器人结合的最佳载体”。机器视觉方面,刘教授介绍了用在线GNG方法对变化的监控环境中的异常行为进行检测,其中关键的思想是给GNG增加在线更新的能力,让机器适应从少见多怪到习以为常的变化,算法的效率和鲁棒性都得到了提高。听觉方面,刘教授团队目前最重要的是做了听觉定位,机器听觉定位的难点在于不仅仅要定位偏转角,还要定位俯仰角、距离,同时要考虑抗噪。
刘康:基于深度学习的知识问答
王亦洲:生物启发的计算机视觉
王亦洲教授指出,深度学习技术让识别变得越来越简单,在这样的大背景下,他思考“想把模式识别向下一个stage试试。”、“我认为要走到learningtolearn。”王亦洲教授研究多智能体的感知学习,他说:“感兴趣的是多智能体如何在视觉帮助下自主协同的完成各自的任务,这其中各个agent的任务是不一样的。”王亦洲教授认为:“很多视觉和机器人的结合是沙滩上的建筑,是没有根基的,因为我们的图像大多是摆拍的,在真实的环境中,智能体是否也有相同的表现?这才是重要的。”他指出,类真实的虚拟环境能提供可控的数据去训练和评价智能体或者算法,智能体应在和环境的交互中学习,而不是静态的图像。
王琦:复杂场景中人群行为的研究及其应用
钟伟才:华为FusionInsight数据挖掘平台与AI云服务
钟伟才博士从工业界的角度谈了大数据分析和AI云服务,大数据的市场规模17年能达到500亿,发展趋势则从营销转向用户体验,钟伟才博士指出“目前大数据最赚钱在服务器和存储,因为客户还在1.0时代,到大数据2.0,未来趋势就是用户体验”。大数据分析的演变历程是“描述分析到预测分析到指令分析到认知分析”,大数据行业的发展在16年是1.0时代,是简单的存储和报表式的分析,2.0时代将是数据变现问题,大数据分析上云也是行业未来的发展趋势。钟伟才博士曾拥有传统数据分析的行业经验,这也引发了他的思考:“大数据分析怎样跟传统数据分析去PK,市场在哪儿?”在传统数据分析已经占据80%-90%市场的情况下,钟伟才博士认为“不仅要处理大数据,还要处理小数据,通过大数据平台反打传统数据分析市场。”目前大数据分析的瓶颈问题是用户需求多种多样,对每一个用户都进行定制势必不可行,对此,钟伟才博士提出“以统一分析平台为核心,去孵化行业内可复制的分析解决方案”。
杨淑媛:稀疏滤波与张量深度网络
杨淑媛教授认为:“稀疏性对于深度网络的推广能力还没有一个很好的理论结果,但是也许稀疏性能提高推广性能。稀疏滤波单元是一个有效的深度神经网络单元,它计算简单,没有太多参数,可将其作为基本单元建立一个轻量级的深度网络;把滤波的模型扩展到张量的形式,可以处理更多的情况,比如可以处理异构的数据,经过试验,提取出来的特征是具有判别性的。”她指出张量的研究才刚刚开始,还很粗浅,理论研究上还可以再深入。
李军:RemoteSensingandSocialMedia
陈莉:协同过滤关键技术及其稀疏性研究
数据量的爆发加速了科技发展,但同时也带来了信息过载等问题,陈莉教授指出:“信息过载的解决工具之一是推荐系统。”推荐系统有三个基本要素:丰富的数据聚合,其中涉及到数据的采集、解析、预处理;关联的参考结构,建立字典、知识库、本体等;有效的算法。陈莉教授说:“发展到今天有很多挑战性问题,第一是数据稀疏性问题,二是推荐准确度,三是系统扩展性,推荐多样性问题,冷启动问题。”针对这些问题的解决,陈莉教授介绍了六个推荐算法,她还进一步展望:“解决实际问题的算法,多元异质数据的融合非常重要,多元数据融合当中会包含非常多的数据类型和特征,从这个角度入手可能也值得研究。二是利用用户的情景信息,我们已经发现在多样性尤其时序多样性方面有非常好的表现,相信也会有新的应用领域,不止是电子商务领域,比如社交领域、众包等。”
陈欢欢:地下管网探测
随着城市的发展,地下空间的利用日益重要,陈欢欢教授介绍:“地下管道其实也是城市的血管,包括下水管道、燃气管道,通信电缆等,各种管道材质不一样,对它们探测的时候单一的传感器很难探测得很精密,我们就思考有没有一种设备可以现场实施探测出地下管道的情况。”目前,国内对于地下空间的管理存在诸多问题,例如历史管网档案遗失,管网权属部门太多,档案分散,施工中“撞线”,管线位置精度不够,管道故障的快速检测设备缺少等等。陈欢欢教授曾在英国参与了MappingtheUnderworld项目,通过多维传感器来构建地下管网地图,回国后他继续了此方面的研究,从算法研究-快速信号处理与数据融合、软件协同-地理信息系统协同、系统构建-多传感器的系统集成三个方面做了诸多工作,针对国内的具体情况提出了解决方案,在老城区使用多传感器设备:地面穿透雷达、主动电磁场、被动电磁场、用深度学习训练地面及井盖识别视觉传感器、GPS融合地理信息,新城区使用智慧管道RFID标签等。陈欢欢教授的多通道地面穿透雷达系统已经可以实时获取探测图像,算法上,非同态双曲线拟合+概率混合模型+贝叶斯信息准则有很好的实时性,可做到1秒处理100+管道。
张艳宁:高分辨率图像智能处理技术
薛建儒:无人车场景计算与自主运动
高新波:大数据时代模式识别的机遇与挑战
高新波教授开场就说:“想跟大家展望一下模式识别怎样发展”,他指出:“现在的模式识别大致分为三类,一类是统计模式识别;二是句法模式识别,在未来类脑计算领域有可能进一步发展;三是深度神经网络,现在正在火热的阶段,它最大的问题是可解释性太差,但现在逐步能解释了,比如通过可视化等等。”句法模式识别是知识驱动的,深度是数据驱动的,高新波教授认为把句法模式识别和深度神经网络结合起来是未来的方向“既知识驱动也数据驱动,数据就会产生知识,知识反过来提升模式识别的能力。”目前,模式识别在很多领域都获得了成功,但高新波教授认为还有挑战,鲁棒性、自适应性、可泛化性是其进一步发展是三大瓶颈。