网络计算创新研究院——新阶段新使命
(孙凝晖2019年3月5日)
2018年一个最重要的事就是计算所作为依托单位获批筹建中科院网络计算创新研究院。这样一个新机构、新平台,可以做哪些跟过去不一样的事情?今天利用这个场合,跟大家汇报一下,研讨一下。
一、2018:中国复兴之路在这里转弯
1、西方的国家命运
2、中国的国家命运
3、国家命运下的计算所
我总结了一下国家命运下的计算所的几个阶段,分为六个台阶,每15年上一个台阶。第一个台阶是初创期,中国计算机事业从这里诞生;第二个台阶是打破封锁,服务“两弹一星”;第三个台阶是冲破垄断,建功中国计算机产业;第四个台阶是自主,保障网络与产业安全;我们现在所在的第五个台阶要引领,发展颠覆性技术。第六个台阶到2049年,做到世界领先。每年我都要看一下中国万亿俱乐部城市的名单,了解中国经济发展的趋势。2018年17个城市进入万亿俱乐部行列,就是说GDP达到1万亿人民币,而头部城市普遍进入了人均2万美元的中等发达阶段。可以看出头部城市GDP的增长还是非常好的,基本在10%以上。邓小平说过发展才是硬道理,这张表给我们带来信心。国家发展有信心,我们科技界才有资金做研究。这也能解释了列表中为什么有这么多城市,纷纷支持计算所办分所,一个城市可以给一个亿支持我们做研发。
二、网络计算创新研究院
1、为什么申请创新研究院
众所周知,信息基础设施关系国家安全和重大利益,关系产业命脉,我国当前的信息基础设施,是跟随上世纪90年代美国“信息高速公路”计划建成的,满足了中国8亿人上网需求,但是中兴事件暴露了我国的缺芯之痛,我国做了很多款CPU,但是市场份额还是百分之零点几,四舍五入之后就没有了,在市场统计上看不见。我国的华为、BAT也都建立在美国的信息高速公路这个技术体系之上,未来依然存在被制约的可能。在智能网联的时代,到2025年,我们有千亿的物端设备,智能会无处不在,无线的网络和卫星的网络会无缝覆盖,所以一定会需要新的核心芯片和新的关键设备。关键是我们能不能把握住这个核心设备,形成中国自己的技术体系、一个有国际竞争力的技术体系,而不是在国外的基础上突破单个设备。这就是联合院内多个研究所、多个关联企业组织成创新研究院要做的事情。
“信息高铁”必然是成体系的,应对的就是三大洪流——物端处理器和超级基站要应对“连接洪流”,虚拟路由器和大数据实时分析引擎要应对“数据洪流”,高通量计算机、智能处理器与智能计算机要应对“服务处理洪流”。在“端”要解决千亿级智能物端,在“网”要解决接入网和骨干网的无缝网络覆盖,在“云”要解决智能算力和服务保障的要求。
2、创新研究院的目标和任务
网络计算创新研究院的总体目标就是针对我国信息基础设施的重大需求,攻克通用CPU、人工智能处理器、物端处理器等三大处理器核心芯片,研制智能超算、高通量云服务器、虚拟路由器、超级基站等四大网络计算关键装备,发展大数据处理系统;短期补全我国处理器芯片上受制于人的短板,长期发展出引领型的芯片与关键装备,培育长板,在2035年实现信息领域的战略平衡。与中科院集成电路创新研究院共同争取集成电路与处理器国家实验室或国家技术创新中心。主要包括八大任务:
任务一:通用处理器
定位:面向现阶段信息高速公路被制约的问题,在急需的核心处理器芯片上补短板。
研究内容:1)研制龙芯处理器(装备与桌面)、海光处理器(服务器);2)研制面向国产处理器的通用操作系统,无缝兼容大部分Windows应用。
任务二:人工智能处理器
定位:信息高铁的核心芯片,是未来泛在智能的物质载体。
研究内容:1)低功耗智能芯片:应用于手机/物端,智能计算的能耗降低到人脑水平);2)高性能智能芯片:用于云端的推理和训练,发展神经网络的新型体系结构);3)寒武纪指令集:构建产业生态体系;4)面向人工智能芯片的智能操作系统。
任务三:物端处理器
定位:信息高铁的核心芯片,是千亿物端设备的处理核心,使万物具备”计算、存储、通信、感知、交互、控制”等功能,真正实现万物互连。
研究内容:1)两大核心IP核:物栖通用处理器IP核、大度控制处理器IP核;2)以开源的RISC-V为核心构建物端生态,不再受西方控制;3)研制物端操作系统和weblet应用平台。
任务四:智能超算
定位:信息高铁的计算能力中枢,为千亿物端应用提供云端智能算力保障,主要实现“算的更快”。
研究内容:1)架构:应用驱动的软硬件一体化结构,海光服务器CPU+寒武纪MLU智能处理器;2)算力:峰值1EFlops+30Eops,每秒可处理一百万亿神经元、五十亿亿突触(成人大脑约为千亿神经元、百万亿突触)。
任务五:高通量云服务器
定位:信息高铁的数据处理中枢,为千亿物端应用提供数据洪流下云端的服务能力保障,主要实现“算的更多、更省”。
研究内容:1)睿芯高通量加速器(算得多);2)标签化冯诺依曼体系结构(算得省,云计算数据中心)。
任务六:虚拟路由器
定位:信息高铁的骨干网核心装备,在千亿连接、服务请求方差巨大的信息洪流中,提供可编程、可定制、服务质量可控的网络传输通道。
研究内容:1)网络断层扫描(NetCT);2)网络指挥测调中心(新CNNIC)。
任务七:超级基站
定位:信息高铁的接入网核心装备,传统蜂窝接入主要覆盖“人”,超级基站要“更好”地覆盖“物”,单台设备接入能力从百提升到十万,并可根据“物”的需求提供多种类的专网。
研究内容:1)终端基带芯片:多模(融合卫星、4G/5G、工业互联网、北斗)终端基带芯片;2)超级基站:多波束、海量用户的集中式基带信号和协议处理,部署灵活、多模融合的地面基站。
任务八:大数据处理系统
定位:信息高铁的通用大数据分析引擎,面对洪水般流量,提供实时数据分析能力。
研究内容:1)大数据处理微内核:轻量级内核架构、新型软硬件协同抽象,延迟可控;2)算法驱动的弹性架构:流批混合、异构资源协同框架;复杂调度、均衡的自主学习与控制;3)低熵序化的的分析引擎:核数据驱动的简约分析框架、面向业务的大数据分析语言。
八大主要任务怎么连成一个新的信息基础设施的技术体系,来体现“信息高铁”的四个特征,任务之间怎么协同,这些还是未知的。需要一种新的机制,把这些设备连在一起,把这些工作串在一起,连成一个系统,能够到一些应用场景里面进行落地。这个就希望通过创新研究院的机制来解决。
3、创新研究院的机制举措
目前已有的一些重大资源的支持,包括中科院项目的智能超算、存储驱动计算、科技委的智能芯片和智能计算机、发改委的地球模拟器等大项目支持,计算所、自动化所、软件所、网络中心、集成电路创新研究院等都在参与。所以通过创新研究院希望把这些研究所,能够形成一个像集团军那样的合力,来承担国家更多的重大任务,解决一些更大的任务级的挑战。
对网络计算创新研究院来说,第一个机制是希望能够跟集成电路创新研究院结盟。网络计算创新研究院擅长API、IP核这一端,集成电路创新研究院正好擅长工艺和EDA。如果双方能够合作起来的话,可以率先形成垂直的整合研发机制,为申请集成电路与处理器国家实验室提供关键机制保障。
第二个机制就是发挥“资本+平台”的模式推动产业整合。发挥资本之手的作用,整合院内在芯片和网络、计算装备方向产业化力量。通过打造基金联盟,投资一些关联企业,影响关联企业往一个技术体系走。另一个是要建一个平台,建十个信息高铁的试验场,成为企业创新产品的首购方和验证方。把这些企业纳到整个创新链的环节里面是实现“信息高铁”不可或缺的。
第三就是计算所内部也进行了一些组织变革来适应科研体制深化改革。改变以研究中心/实验室为核心的“步兵团/坦克营”式科研组织模式,建立一个“集团军”、两个“混成旅”。创新研究院相当于是一个集团军,是一个重大任务单元,混成旅分别是科教融合和科学发现单元的混成旅。
计算所是在改革中成长起来的,每一次改革,都能让计算所再上一台阶,改革是触发计算所科技事业上台阶的发动机。通过四项紧急措施,计算所建立了学科;通过归属国防部计算所作出了109丙功勋机;联想代管让我们PC做到世界第一;知识创新工程让我们HPC产业在国际上领先了;现在的创新研究院,把解决芯片之痛和创建信息高铁这个技术体系,作为我们未来的目标。
三、几项重要的工作
1、李院士之问
第一个就是要回答李院士在去年年底考评会上提出的问题:计算所有没有在做一些全世界都觉得难的事。我想了想,有以下几个。
一个是Z级计算机,肯定是全世界都觉得难的,不知道该怎么做的。性能怎么再提高1000倍呢?超导处理器,光子计算、访存与互联,存算一体与分层计算等这些研究大致是奔这个目标的。
第三个是芯片即App,就是说芯片是不是能像开发App那么简单,从3年缩减到3个月,从Fabless到Designless。xPU时代最重要的是功能,而不是里面的结构和设计,开源芯片不仅仅是指令的开源,还要有开源IPs、开源EDA、DesignHouse云等。
第四个是卫星互联网,建成覆盖一带一路40亿人口的一张全世界最大的网,做到可控可管,千倍提高。如果这个实现了,也是全世界觉得非常难的事情。
2、凝聚大事
计算所现在还没有跨研究部、跨学科,来做一些重大任务和重大项目,最近规划的这几件大事希望能够达到跨学科整合的目的。信息高铁这个事就是把系统和网络整合在一起,智能计算机是把系统和智能整合在一起,重大专项任务是大数据和智能整合在一起。计算所的三个研究部如果两两能够耦合在一起的话,那计算所的竞争力就会得到极大的提升。
3、计算所的四个体系
计算所运转的主要四个体系分别是源头体系、领头体系、龙头体系和影响力体系。源头体系是包括前沿研究和技术转移,领头体系包括学术和教育,龙头体系包括专用和安全,影响力体系包括传播和公益。
其中最困难的是建立计算所特色的专用体系,由专项部、专项中心、科研型分所、企业等新机制组合而成。计算所特色的专用体系是什么,怎么区分于声学所、电子所这些专用大所,这是值得思考的地方。还有就是如何扩大计算所的影响力,一个一流的组织,一定是有非常强的社会影响力。计算所去年成立了科协,就是要把计算所对公众的影响力组织化、常态化。我多次提出要支持“人人编程”这个运动,是基于信息社会对中小学的孩子们教些什么的思考。纪监审大数据能帮助将权力关进笼子里,计算所用技术手段做到这一点,就体现了我们在国家治理方面的影响力。还有残疾人信息化,国家在6000万人脱贫后再干点什么,让每个人都进入信息社会,这个工作也是发挥计算所影响力的工作。
4、计算所模式
计算所的发展模式是三头并进、相互转化。计算所的100年是:过去以“龙头”为主(1958-2005),价值是科技力量要能服务保障国家安全,实现手段是靠集中力量办大事,驱动方式是任务驱动。现在以“源头”为主(2006-2035),价值是科技力量要能发展成为有国际竞争力的产业,赋能各行各业,转化为产业的力量,更全面地支撑国家的发展,实现手段是从学术前瞻到创办公司,驱动方式是应用驱动和市场驱动。未来以“领头”为主(2036-2058),价值是为世界信息科技的人类知识宝库做出自己的贡献,实现方式是写进教科书,学习Patterson、Hinton引领全球产业,驱动方式是学科驱动。
“源头”模式有没有什么措施?我把它叫做“九字真经”,有三句话:第一句叫“养源头”,源头决定着大江大河的流淌方向。源头养好了,才能做大事,尤其IT这个产业,没有学术引领,很难产生有影响的产业。其实计算所一直到2006年的时候,都没有形成自己的基础研究体系,这十几年形成了自己的三大学科——系统、网络和智能的基础研究体系,围绕这三大学科,建立了四个重点实验室,作为学术基地。做好学术引领,是发展产业做大事的核心保障。
第二句叫“抬起点”。举个例子,唐古拉山、祁连山脉最高峰和京西东灵山,绝对海拔基本都是2000多米。唐古拉山之所以能有6000多米的海拔是因为它在青藏高原上,而祁连山脉是在黄土高坡上,京西东灵山是在河北平原上,它们的区别在于起点不一样。斯坦福大学就像青藏高原,成就了众多“高峰”企业。要让科研成果达到更高的高度,就应该建立更高的平台,这才能可持续更长久地发展。计算所这些年一直在打造“人人是才、人人幸福”的创新文化产品,营造从优秀到卓越的文化氛围。通过“人人是才”产品,将人才结构从“拔尖长尾型”转变成“冒尖短尾型”。我们去MIT访问,有一个感受是,教授之间的水平没有太大的差别,都是相对比较高的级别,所以容易成就这样一个高峰。通过“人人幸福”产品,要将员工结构从“一枝独秀型”转变成“高台多元型”。不光鼓励做科研的,还鼓励做产业的、做管理的、做科普的、做教育的、做国际学术交流的等,每一个类型的人才都要有,他们组合搭配在一起,才是好的员工结构,才能有高台。
第三句叫“造生态”。还是拿高原举例子,高原的良好发展更加依赖生态建设,青藏高原、黄土高原的生态都很脆弱。越往高处走,生态越重要。计算所的生态就是不唯帽子,宽容为本,人人幸福。举个例子,有两个有代表性的年轻研究员,都是团队负责人,一个是陈云霁,是帽子最多的代表之一,头上有很多人才帽子,另一个是包云岗,他自称自己只有一顶草帽,就是中科院青促会优秀会员,但他的工作也做得很好,做了很多原创性的工作,在国际上很有影响。他们两个在计算所都同样被重视。
贺思敏研究员举的例子我觉得很能代表计算所模式。他说自己在游泳池里学游泳,游得很好了,到了北戴河,不敢游了。我想杰青等人才,就像是一个奥运冠军。孙杨在游泳池里可以拿冠军,但是如果让他去水泊梁山打仗,可能就不如阮小二、阮小七了。计算所的科研人员应该能够做“浪里白条”。但也不是说不要做杰青,首先得学会在游泳池里游才行。在计算所做什么样的工作,什么样的人,能体现计算所学派,体现计算所的价值?每个人都想想,你的人生目标是当孙杨,还是当阮小二。
5、几个思考
最后谈几点思考。一个是我一直在想创新的本质是什么。元旦看罗振宇跨年演讲,他说:创新就是非共识,创新的模式从过去的抽象,现在走到了还原。我在想通用处理器是不是就是抽象,现在做领域专用处理器,是不是就是还原,还原到应用负载的本质部分。现在的创新主要用还原法做非共识的工作。他还举了从拓碑印字到活字印刷花了一千年的例子,创新好像很容易,其实很难。
那什么是一个伟大的创新?他说:是“异端邪说、伟大革命、稀松平常”三部曲。英国科幻作家道格拉斯·亚当斯,也就是《银河系漫游指南》的作者,他有个说法,叫“科技三定律”:“任何在我出生时已经有的科技,都是稀松平常的世界本来秩序的一部分。任何在我15-35岁之间诞生的科技,都是将会改变世界的革命性产物。任何在我35岁之后诞生的科技,都是违反自然规律,要遭天谴的。”这段话描述了很多人对科技创新的心态。任何创新在它诞生的那一刻,先会被当作“异端邪说”,然后成为“伟大革命”,最后为“稀松平常”。这是一个神奇的循环,不走完这个循环,就不是伟大的创新。
(根据孙凝晖所长在2019年计算所春季战略规划会上的讲话整理而成)