11月15-16日,2022年“一带一路”人工智能大会在线上成功举办,众多大咖相聚一堂,围绕“人工智能发展的前沿与挑战”、“人工智能交叉领域学科建设”、“人工智能开源基座与产业应用”主题,对人工智能领域基础研究、核心技术、重大创新应用场景等热点议题进行深入探讨,扬学术风采,展创新思维,引起了线上观众的强烈反响。本文根据论坛期间现场速记进行整理归纳,将专家们提出的主要观点以文字形式再次呈现,以供参考。
11月15日报告内容
徐宗本院士:《如何学习学习方法论?》
中国科学院院士、西安交通大学徐宗本教授通过严格定义学习学习方法论问题,提出SimulateLearningMethodology(SLM)的双层优化模型和“超参数化”求解方法,建立SLM泛化性理论,并应用于几个具体的机器学习自动化问题,为机器学习自动化提供了可行的理论框架,为学习学习方法论的更深入研究提供了模型基础。
徐宗本院士首先介绍了SLM的数学框架,并从学习任务和学习方法的数学描述、学习空间的超参数化以及学习方法论的数学定义等方面展开讨论。徐宗本院士指出学习方法论是指导、管理学习者如何学习/完成学习任务的一般原则和方法学。同时也介绍了SLM的多个应用模型和其他研究(机器学习、MetaLearning、L2L和AutoML)的对比。紧接着,徐宗本院士总结了SLM的统计学习理论,主要包括能够解决的问题、主要定理、解释与评注、以及理论建立目前面临的挑战。徐宗本院士从数据自动化、网络自动化、度量自动化和算法自动化等四个方面介绍了SLM机器学习自动化的应用实例。
最后,徐宗本院士指出人工智能的应用尚处于“选择”阶段,还未达到“设计”的水平。AI的下一步发展必然会以实现机器学习自动化Auto6ML(数据样本自生成/自选择、模型算法自构建/自设计、环境任务自适应/自转换)为目标。实现Auto6ML要求数据、网络、损失、算法、任务等要素做出一体化的设计和调控。并从数学框架、严格定义、数学模型和一般算法展示了机器学习自动化问题如何用SLM模型来解决,说明了SLM能为Auto6ML研究提供形式化/模型化/科学化的研究框架和途径。
黄维院士:《未来产业:柔性电子——厚植根部技术,打造中国碳谷》
龚健雅院士:《智能遥感解译的研究进展与挑战》
中国科学院院士、武汉大学龚健雅教授通过对人工智能背景的梳理,分析了目前遥感智能解译存在的问题,并对团队最新的遥感智能解译研究成果进行了介绍。人工智能是新一轮科技革命和产业变革的重要驱动力,深度学习已成为其中最有影响的关键共性技术,在视觉、语言和自然语言处理等领域取得突破性进展,促进了传统行业的智能转型,同时催生了新的智能产品和产业。随着遥感对地观测技术的发展,每天都产生大量的遥感影像数据,如何快速处理、解译和提取遥感信息面临巨大挑战。龚健雅院士首先介绍了基于深度学习的遥感智能解译的研究问题(样本库的设计与标注、网络结构和模型的设计、深度学习网络架构)及应用领域(目标检索、目标检测、地物分类、变化检测和三维重建等)。紧接着,龚健雅院士介绍了遥感影像样本库LuojiaSET以及遥感专用机器学习框架LuojiaNET的设计和研究进展。LuojiaSET主要包括统一类别体系、元数据规范、样本数据集、在线标注工具和共享服务平台。最后,龚健雅院士对智能遥感的生态进行了总结,指出了未来的改进和发展方向。
杨宗凯教授:《人工智能驱动教育高质量发展》
武汉理工大学校长杨宗凯教授首先介绍了人工智能驱动教育高质量发展所面临的机遇和挑战,从教学场景能理解、教学资源能适配、教学过程能调节三个层面论述了人工智能与教育融合的关键技术和典型实践。针对教学场景的理解,打造数据驱动的教学场景感知方法。针对教学资源的适配,构建资源和教学反馈的精准服务技术体系。针对教学过程的调节,形成人机协同教学过程调节方法。针对教学应用的创新,开展精准化教育教学的应用创新(人机结合教育环境的构建和“人工智能+教育”标杆大学建设等)。杨宗凯教授对人工智能驱动教育高质量发展提出了愿景和建议:人机协同迈向人机共生,实现知识和数据的双驱动;人工智能与教育双向赋能;元宇宙推进教育全面数字化转型。最后,杨宗凯教授指出要推动数字化转型,重构教育新生态,形成情境化、虚拟化、个性化教学环境;实现沉浸式、体验式、交互式学习。
田奇院士:《2022年的计算机视觉:挑战问题&潜在方向》
国际欧亚科学院院士、华为云人工智能领域首席科学家、IEEEFellow田奇教授指出视觉领域面临的核心问题分别是识别和生成。识别包括图像分类、目标检测与分割等。生成包括图像/场景合成、场景重建等。生成是一种更高级别的理解能力。同时,在标准的识别任务中,准确率越来越高;但在小样本、长尾情况下能力有限,缺乏常识,难以在精细场景中工作。田奇院士指出,当前的计算机视觉的主要挑战是(1)图像语义信息高度稀疏;(2)域间差异性大,导致提取语义特征困难和模型迁移性差。图像信息的高度稀疏性可以从模型设计和预训练角度去解决,例如,建立强大的骨干结构和在大规模视觉数据上的预训练模型。对于域间差异问题,可以通过特征域的模型优化和减少微调的数据依赖性这两个角度去解决。
王立军院士:《元宇宙终端-XR头戴式显示技术前沿及产业发展趋势》
石光明教授:《智能时代信息技术从比特到语义》
最后,石光明教授介绍了团队设计的基于语义通信的三维会议系统。借助VR/AR等新型的技术,提高了会议的沉浸感,更适用于品牌产品发布会、研讨会、音乐会、大型会议/会展、大型教育培训等场景。
梅涛院士:《深度时空视觉表征学习方法及应用》
刘宏教授:《机器人视觉:仿生感知与自主学习》
王国胤教授:《多粒度认知计算及其在智慧健康的应用》
辛景民教授:《成为人工智能领域的开拓者和引领者——西安交大AI人才培养探索与实践》
邓成教授:《多模态智能》
最后,邓成教授进行了展望,指出在开放环境下实现多模态人工智能以及实现可解释、可信多模态智能是值得探索的问题。
屈嵘教授:《ModelingofAlgorithmDesignwithinGeneralSearchFramework》
袁进辉研究员:《深度学习系统软件如何最大化释放算法潜力?》
北京一流科技有限公司创始人、董事长袁进辉研究员指出,深度学习框架是人工智能工具链中最核心的软件。从垂直角度看,深度学习框架作为Al时代的底层操作系统,决定了平台技术的性能提升与迭代速度。从AI模型训练和生产的链路来看,深度学习框架一方面可以降低人力成本,提高模型搭建编程效率,另一方面可以使用GPU、分布式来降低算力成本,提升运行效率,编程效率和运行效率都关系到算法潜力释放的问题。大模型的发展非常依赖于分布式深度学习系统。具体来说,大模型的计算量和模型参数量超越了单芯片的能力,而横向扩展(分布式深度学习)成为唯一选择。但分布式深度学习编程复杂度极高,擅长分布式编程的工程师数量非常少并且训练大规模深度学习模型代价高昂。袁进辉研究员对团队所研发开源深度学习框架OneFlow进行了介绍。OneFlow旨在提供给编程者一种全局性视角,让多卡编程像单卡编程一样简单,极致性能优化,极致显存使用规划。接着,袁进辉研究员介绍了OneFlow的一些实现思路、用法和性能,具体包括基于编译器的自动并行方案、静态编译引入Graph机制和OneEmbedding等。OneFlow可以大大降低算法专家编程的复杂度,最大化释放算法潜力。
11月16日报告内容
焦李成院士:《下一代深度学习的思考与若干问题》
宋永端院士:《元宇宙:一个虚幻而又可及的世界》
孙富春教授:《智能化咽拭子采样机器人的感知、交互与操作》
中国人工智能学会副理事长、IEEE/CAAI/CAAFellow、清华大学孙富春教授的报告从新冠疫情中咽拭子采集的高传染性,以及病毒检测过程中的交叉感染风险的背景下出发,系统介绍了团队在咽拭子采样机器人方面的研究与开发历程,重点介绍了团队全自动智能化采样机器人技术,并对咽拭子采样机器人的未来发展进行了展望。
吴飞教授:《端云协同下分布式模型学习与进化》
公茂果教授:《深度神经网络结构优化》
马楠教授:《人车路协同无人驾驶交互认知》
通信员:王丹、赵嘉璇、马梦茹、耿雪莉、陈洁、贾楠、张丹、黄思婧