ChatGPT是由OpenAI研发的一种语言AI模型,使用上亿参数的大模型和海量语料库来生成语句,目前可以实现写诗、撰文、编码的功能。ChatGPT广受用户欢迎,短短五天注册用户数量便超过100万,60日月活破亿。产业界如微软、谷歌、百度也对于openAI及其竞品加大投入。
2ChatGPT引发人工智能投资热潮
2.1ChatGPT是什么?
2.2ChatGPT技术和传统的AI有什么区别?
2.3ChatGPT将给行业带来哪些机会?
1)语音识别与自然语言处理行业快速发展:人工智能,也即解决像人一样看、听、思考的问题。因此,按照此维度来划分,划分为计算机视觉、语音识别与自然语言处理及数据科学。早先,2020年数据显示,计算机视觉占比约56.6%;语音识别与自然语言处理占比约35.6%。也即,在机器视觉领域的应用,相比自然语言处理,更为成熟,市场规模更大。但随着ChatGPT带来的投资热潮,与应用领域的不断丰富,音频与自然语言处理的整体行业规模,有望迅速增长。
3数据要素资源基础,满足大模型训练需求
3.1政策引导数据要素确权使用,扫清人工智能发展障碍
数字经济快速发展,数据要素成为重要战略资源。《“十四五”数字经济发展规划》中指出,数字经济是继农业经济、工业经济之后的主要经济形态。《规划》设定了到2025年实现数字经济核心产业增加值占GDP比重达到10%的目标,涵盖数据要素市场、产业数字化、数字产业化、数字化公共服务、数字经济治理体系五个方面。从2015年至今,数字经济平均增速持续高于GDP增速,2021年数字经济占GDP比重已经由2015年的27%提升至40%。
3.2大数据管理能力需求提升
联网设备高增之下,流量增长不可避免。根据思科的《年度互联网报告》,到2023年,地球上的连网设备数量将是全球人口的大约三倍,从2017年的人均2.4台提升至3.6台。由于IP地址即网络地址+主机地址,网络站点所连接的IP数量也处于爆发的阶段。根据IDC的《中国物联网连接规模预测,2020-2025》,仅我国物联网IP连接量已在2020年达45.3亿,有望在2025年达到102.7亿,CAGR为17.8%。由于IP地址联网后即产生数据流量,IP地址的数量增长即代表全网数据也将继续大增,对于现有的网络企业的承载能力提出了考验。根据思科的《年度互联网报告》,2022年全球网络数据流量将达799EB(1EB=十亿GB),同比增长21%。我们认为,数据流量的增长,有望直接带动大数据产业的发展,而其中稳定优质响应快的数据库性价比更高。
全球大数据市场存量巨大,软件市场占比较高且增速快。根据Wikibon及沙利文研究数据,全球大数据市场规模有望在2022年达718亿美元,同比增速11%;而其中全球大数据软件伟286亿美元,同比增速18%,约占大数据市场规模的40%。可以认为,软件市场在大数据市场中,占据较大地位,而由于其增速高于大数据市场的整体增速,其占比还将进一步提升。
3.3数据标注,是AI模型的基础
人工智能基础数据服务助力AI训练与调优,数据采集、数据标注和数据质检是较为重要的三个环节。从自然数据源简单收集取得的原料数据并不能直接用于有效监督的深度学习算法训练,经过专业化采集、加工形成的训练数据集才能供深度学习算法等训练使用,从某种程度上讲,数据决定了AI的落地程度,因此,基础数据服务应运而生。具体来看,基础数据的服务流程围绕着客户的展开,为AI模型训练提供可靠、可用的数据,其包含五个环节,分别是1)数据库设计:训练数据集结构设计;2)数据采集:获取原料数据;3)数据清洗:清洗残缺、重复或者错误的数据;4)数据标注:帮助机器认识数据的特征;5)质检:各环节质量检测和控制。
市场标注行业市场规模不断扩大,图像类和语音类需求占比超八成。从市场规模来看,根据观研天下统计,2021年我国数据标注行业市场规模为43亿元,2017至2029年的CAGR为23%;根据IDC《2021年中国人工智能基础数据服务市场研究报告》,预计中国AI基础数据服务市场规模将在2025年突破120亿元,近五年的CAGR达47%。从市场收入结构来看,按数据类型划分,基础数据服务行业是市场需求可以分为图像类、语音类和自然语言处理类数据需求。根据观研天下统计,2021年我国数据标注行业下游以图像类和语音类需求为主,二者合计占比达86%,其中,图像类业务以智能驾驶与安防为主,语音类以中英大大语种、中国本土方言以及外国小语种为主。
1)星环科技:平台、数据库集一身的数据要素稀缺标的
专注于分布式数据库,技术水平全球领先。星环科技2013年成立于上海,是国内大数据管理软件领导者,已累计有超过1,000家终端用户,且产品已落地以下知名机构或其主要分支机构,金融行业包括中国银行、浦发银行、浙江农村商业联合银行等,政府领域包括上海市大数据中心等,能源行业包括中国石油、南方电网等,交通行业包括中国邮政集团、郑州地铁等,制造业包括湖南中烟等。公司在发展中经历了多个重要节点:1)公司2013年成立,随即发布了大数据基础平台TDH2.0版本,并于次年推出Inceptor关系型分析引擎、Slipstream实时计算引擎,实现数据湖、实时计算两大热点功能;2)2014年公司被Gartner列入Hadoop的主流发行版列表;3)2017年起,公司陆续发布新品,包括分析工具Sophon、云产品TDC、分布式分析数据库ArgoDB和分布式交易数据库KunDB。2022年,公司已被Gartner评为图数据库管理的全球代表厂商。
股权结构稳定,创始人保持控制权。发行人的控股股东、实际控制人为创始人孙元浩,主要理由如下:(1)截至本招股说明书签署日,孙元浩直接持有星环科技12.3%的股份,为公司第一大股东,且在报告期内持续为发行人第一大股东。(2)孙元浩与范磊、吕程、佘晖及赞星投资中心签署了《一致行动协议》,确认自2019年1月1日起,范磊、吕程、佘晖及赞星投资中心与孙元浩在发行人有关重大事项中保持一致行动,并约定上述各方在无法达成一致意见时,为提高公司决策效率,在不损害孙元浩合法权益及保障公司整体利益的前提下,应以孙元浩的意见作为各方的最终共同意见。孙元浩担任执行事务合伙人的赞星投资中心持有公司8.3%的股份,孙元浩之一致行动人范磊、吕程、佘晖分别持有公司6.7%、1.7%、1.0%的股份。因此,孙元浩本人及通过《一致行动协议》合计控制公司30.0%的股份。(3)报告期内,孙元浩一直担任发行人(及其前身星环有限)的董事长及总经理,在发行人的董事会和日常管理决策中均能够产生重大影响。(4)根据除孙元浩、范磊、吕程、佘晖及赞星投资中心以外的发行人其他股东的书面确认,各方均认可孙元浩于报告期内作为发行人的实际控制人。
2)海天瑞声:人工智能基础数据服务提供商,产品矩阵不断丰富
公司产品应用领域不断拓宽,下游客户丰富。从应用场景来看,公司产品的应用场景覆盖了个人助手、语音输入、智能家居、智能客服、机器人、语音导航、智能播报、语音翻译、移动社交、虚拟人、智能驾驶、智慧金融、智慧交通、智慧城市、机器翻译、智能问答、信息提取、情感分析、OCR识别等多种应用场景。从下游客户来看,公司的客户为AI产业链上的各类机构,主要系:1)大型科技公司,阿里巴巴、腾讯、百度、微软等;2)人工智能企业,科大讯飞、商汤科技、海康威视等;3)科研机构,如中国科学院、清华大学等。目前,公司的产品和服务已经获得了阿里巴巴、腾讯百度、科大讯飞、微软、清华大学等国内外客户的认可。
4ChatGPT带来的变革——大模型算法
4.1大模型时代的引言:DoubleDescent(双下降)现象
随着深度神经网络的兴起,人工智能进入统计分类深度模型时代,这种模型比以往的模型更加泛化,可以通过提取不同特征值应用于不同场景。但在2018年-2019年,双下降现象的发现打破了原有的人工智能发展格局。简而言之,以往的数学理论表明,随着参数增多、模型增大,过拟合导致模型的误差会先下降后上升,这使得找到精度最高误差最小的点成为模型调整的目标。而随着人工智能算法算力的不断发展,研究者发现如果继续不设上限的增大模型,模型误差会在升高后第二次降低,并且误差下降会随着模型的不断增大而降低,通俗而言模型越大,准确率越高。因此人工智能发展进入了大模型时代。
相比传统AI模型,大模型的优势体现在:1)解决AI过于碎片化和多样化的问题,极大提高模型的泛用性。应对不同场景时,AI模型往往需要进行针对化的开发、调参、优化、迭代,需要耗费大量的人力成本,导致了AI手工作坊化。大模型采用“预训练+下游任务微调”的方式,首先从大量标记或者未标记的数据中捕获信息,将信息存储到大量的参数中,再进行微调,极大提高模型的泛用性。2)具备自监督学习功能,降低训练研发成本。我们可以将自监督学习功能表观理解为降低对数据标注的依赖,大量无标记数据能够被直接应用。这样一来,一方面降低人工成本,另一方面,使得小样本训练成为可能。3)摆脱结构变革桎梏,打开模型精度上限。过去想要提升模型精度,主要依赖网络在结构上的变革。随着神经网络结构设计技术逐渐成熟并开始趋同,想要通过优化神经网络结构从而打破精度局限变得困难。而研究证明,更大的数据规模确实提高了模型的精度上限。
4.2首要关键技术:Transformer模型GPT模型利用
4.3GPT快速迭代,从GPT1.0迅速步入3.5时代
GPT:大型无监督语言模型,能够生产连贯的文本段落。GPT-1采用无监督预训练和有监督微调,证明了transformer对学习词向量的强大能力,在GPT-1得到的词向量基础上进行下游任务的学习,能够让下游任务取得更好的泛化能力。与此同时,不足也较为明显,该模型在未经微调的任务上虽然有一定效果,但是其泛化能力远远低于经过微调的有监督任务,说明了GPT-1只是一个简单的领域专家,而非通用的语言学家。
4.4国内外AI大模型项目百舸争流
SwitchTransformers:Google推出的首个万亿级语言模型。相比1750亿参数的GPT-3,谷歌SwitchTransformers则直接将该数值拉升至1.6万亿,且相比于OpenAI在GPT-3里所使用的SparseAttention,需要用到稀疏算子而很难发挥GPU、TPU硬件性能的问题。SwitchTransformer不需要稀疏算子,可以更好的适应GPU、TPU等硬件。
文心一言:百度集成NLP和CV,多级体系覆盖诸多领域。2022年11月30日,百度集团在WAVESUMMIT+2022深度学习开发者峰会带来了文心大模型的最新升级,包括新增11个大模型,大模型总量增至36个,构建起国内业界规模最大的产业大模型体系。在模型层,文心大模型涵盖基础大模型、任务大模型、行业大模型的三级体系;在工具与平台层升级了大模型开发套件、文心API和提供全流程开箱即用大模型能力的EasyDL和BML开发平台,有效降低应用门槛;新增产品与社区层,包括AI创作平台“文心一格”、搜索系统“文心百中”和样谷社区,让更多人感受到AI大模型技术带来的新体验。截至目前,文心已累计发布11个行业大模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域,加速推动行业的智能化转型升级。
除行业大模型外,百度目前新增了5个基础大模型和1个任务大模型,包括:知识增强轻量级大模型、跨模态理解大模型、跨模态生成大模型、文档智能大模型、单序列蛋白质结构预测大模型和代码大模型。其中,知识增强轻量级大模型ERNIE3.0Tiny具备优秀的泛化能力,同时相对于超大参数模型,推理速度提升数十倍到百倍,能够显著降低超大参数模型落地的成本。百度计划在3月完成文心一言的内部测试,然后向公众正式开放使用。
阿里M6:出色的低碳低能耗属性。阿里巴巴达摩院在2021年开发出了超大规模中文多模态预训练模型M6。目前,其参数已从万亿跃迁至10万亿,规模远超谷歌、微软此前发布的万亿级模型,成为全球最大的AI预训练模型。同时,M6做到了业内极致的低碳高效,使用512块GPU在10天内即训练出具有可用水平的10万亿模型。相比去年发布的大模型GPT-3,M6实现同等参数规模,能耗为其1%。M6的优势在于将大模型所需算力压缩到极致,通过一系列技术突破,达摩院和阿里云只用了480块GPU就训练出了M6,相比英伟达用3072块GPU训练万亿模型、谷歌用2048块TPU训练1.6万亿模型(1TPU约等于2~3GPU),M6省了超过八成算力,还将效率提升了近11倍。
1)商汤科技
2)科大讯飞
AI应用快速发展,构建人工智能产业生态。公司自创业以来持续聚焦智能语音、自然语言理解、机器学习推理及自主学习等人工智能核心技术研究并始终保持国际前沿技术水平。目前公司已经从语音AI逐渐拓展至到教育、医疗、智慧城市、消费、智能汽车等多领域布局。同时,随着ChatGPT掀起热潮,公司的类ChatGPT技术也将于5月落地,率先用于AI学习机。智慧教育业务:智慧教育业务是公司的第一大业务,在收入中占比30%左右。公司构建了面向G/B/C三类客户的业务体系:G端业务主要以市县区等区域建设为主体;B端业务主要以学校建设为主体;C端业务主要以家长用户群自主购买为主。目前讯飞智慧教育产品已在全国32个省级行政单位以及日本、新加坡等海外市场应用。
3)云从科技
4)依图科技
以人工智能芯片技术和算法技术为核心,持续深耕智能公共服务及智能商业领域。公司以人工智能算法和芯片等核心技术为基础,在城市管理、医疗健康、安全生产、交通出行和互联网服务等场景实现规模化商业落地和与产业的深度融合。目前公司已为国内30余省、自治区、直辖市及境外10多个国家和地区的800余家政府及企业终端客户提供产品及解决方案:
智能公共服务,公司智能公共服务主要包括智能城市和智能医疗:1)智能城市,公司主要着力于三方面:高性能算法赋能城市复杂场景。公司在计算机视觉的多个细分领域、声纹识别、中文语音识别及自然语言理解技术均已达到世界领先水平,可对城市实体在复杂多样场景下产生的非结构化数据进行解析、识别和关联,构建出完整的城市实体关联关系。高效能算力硬件产品降低城市智能化门槛。公司的原石系列智能服务器和前沿系列边缘计算设备,在显著提高城市视频智能解析吞吐效率的同时,大幅降低了算力功耗,从而降低了投资和运营成本。“利旧”方案降低建设成本。公司将大量已建设的非智能摄像机采集的原始数据在云端进行解析,与智能摄像机的解析结果在云端实现汇聚、融合分析,大大降低智能化建设的投资成本。2)智能医疗方面,公司是业内少数具有以多模态人工智能技术解析多源异构医疗大数据能力,并具有自研医疗知识图谱的企业之一。公司在上海儿童医学中心建设的智慧儿童医院解决方案能够为患者单次就诊至少节约90分钟,落地一年来,该解决方案仅智能导诊应用就已累计为超过27万名患儿提供服务,诊前检验访问量突破6万人次。
5)旷视科技
聚焦物联网场景,推动人工智能的商业化落地。公司以物联网作为人工智能技术落地的载体,通过构建完整的AIoT产品体系,面向消费物联网、城市物联网、供应链物联网三大核心场景提供经验证的行业解决方案。公司的AIoT软硬一体化解决方案包括以Brain++为核心的AI算法体系,由AIoT操作系统和行业应用构成的软件,以及由传感器模组、传感器终端与边缘设备、机器人及自动化装备组成的硬件。消费物联网:2012年,旷视进入消费物联网领域,以SaaS产品的形式服务全球开发者及企业用户,为其提供数十种AI能力。随着智能设备的普及,公司与多家头部智能手机厂商等消费电子领域客户开展合作,累计为数亿台智能手机提供设备安全和计算摄影解决方案。
5算力与网络是大模型运行的必要条件
5.1大模型发展,算力需求激增
5.2GPU/GPGPU/FPGA多路线支持算力
人工智能深度学习模型需要处理两大任务,即训练和推理。1)训练就是学习过程,通过大数据训练出复杂的神经网络模型,使得整个系统可以适应特定的功能。因此,训练需要庞大的算力来处理数据并搭建网络模型,所需的芯片需要具有高算力和通用性。2)而推理在训练之后,主要是在已有的训练完善的模型基础上,输入新数据进行推断,能耗、时延、效率等因素都是影响推理能力的因素。但同时,推理环节不需要在庞大的神经网络之中反复调整参数,因此对算力的要求相对于训练要低很多。
5.3高带宽网络是对人工智能算力的重要支撑
大模型训练和推理使用了AI计算集群。AI大模型通常需要部署在AI计算集群以实现训练和推理加速并实现最佳能效比。以目前独家开放了ChatGPT调用能力的微软Azure为例,其AI基础设施由互联的英伟达AmpereA100TensorCoreGPU组成,并由QuantuminfiniBand交换机提供强大的横向扩展能力。根据微软宣布,为OpenAI开发的超级计算机超过了28.5万个CPU核心、1万个GPU,每台GPU服务器网络连接能力为400Gbps,位列全球超级计算机前五。目前,英伟达的AI计算集群整体解决方案(如DGXA100系列)是AI集群投资的主流选择,除此之外部分云和互联网大厂选择了CPU+FPGA+GPU+AIDSA异构算力自己搭建AI计算中心。根据YOLE预测,全球AI加速服务器渗透率将在2027年达到17.9%,AI/GPU加速服务器出货量复合增速高达39.8%/20.3%。
后者是在设备转发层面尽量优化网络时延,实现高性能无损网络,目前主要手段是无带宽收敛(1:1)的网络架构设计以及基于PFC和ECN功能的优先队列管理和拥塞管理。无带宽收敛比设计意味着交换机下行和上行流量一致,将增加上行端口数量或端口带宽,而优化流控技术需要可编程的三层网络交换机,以上将导致交换机端口数量增加以及价值量提升。
在数据中心集群网络方面,北美Top4云厂商已经全面进入400G部署阶段。以微软数据中心为例,其在2016年开始批量部署100G,由于AI算力的快速增长,2021年开启400G部署,并预计2024完成400G的全面部署,加速向800G迈进。而对于400G部署更早的亚马逊和谷歌,预计在2023年开启小规模800G部署,更大的端口带宽将带来更高的端口密度,节约空间的同时每Gbps成本下降。根据LightCounting预测,全球数据中心以太网光模块市场将在2027年突破100亿美金,5年CAGR11.5%,其中800GCAGR达72%。
单机网卡数增加和网络收敛比降低增加了交换机和光模块用量。根据数据中心光模块需求量计算公式(流量法):1)服务器到TOR交换机光模块:服务器网卡端口数*22)TOR到LEAF交换机光模块:服务器流量/一级收敛比/TOR上联端口速率*23)LEAF到SPINE光模块:LEAF流量/二级收敛比./LEAF上联端口速率*2假设普通Hyperscale数据中心和AI数据中心分别有X台服务器,每台服务器网卡速率为100Gbps,数量分别为2/10,网络收敛比分别为2:1、1:1,交换机上联端口速率为400G,计算得到普通Hyperscale数据中心光模块(包括AOC/DAC)用量为4.75X,而AI数据中心光模块用量为23.75x,光模块用量大幅提升。
CPO探讨:一系列技术问题的解决和产业链结构的重塑。CPO(光电共封装)的主要形态为交换芯片与光引擎封装在一块基板上,交换芯片与光引擎通过XSRSerDes直联。我们认为CPO可能是数据中心交换机端口发展到1.6Tbps以上一种可能的光模块形态,虽然AI算力将加速数据中心交换机带宽的增长,但CPO的渗透仍将是个缓慢的过程。CPO主要解决的是高速SerDes信号衰减和功耗问题(1.6T光模块可能使用200GSerDes)、1.6T光模块多通道设计和良率难题以及相应带来的成本高企,但目前也有一些问题需要解决,比如光源设计问题(如设计在交换机内光引擎附近容易出现热失效,一种可能的思路为外置光源ELS但相应也会带来功耗的增加和布线的成本大幅提升)、与交换机芯片的联调问题、以及将来的替换维护问题(需拆机维护)。我们认为,CPO或将重塑数通产业链结构,话语权可能会向交换芯片厂商、交换机厂商倾斜,同时光引擎封装、硅光芯片、保偏光纤、CW激光器、封装基板等环节也将成为新增投资机会。
5.4量子计算有望成为AI算力突破的“神助攻”
量子计算产业蓬勃发展。量子计算机基于量子力学原理构建,量子态叠加原理使得量子计算机的每个量子比特(qubit)能够同时表示二进制中的0和1,相较经典计算机算力呈指数级爆发式增长。目前量子计算机已被证明在特定计算任务上具备指数加速能力,即实现所谓的“量子霸权”,目前量子计算产业化需要解决的三大目标一是开发大规模可容错的量子计算机以尽快实现可编程计算;二是开发精妙的量子计算算法以实现在特定场景的商业化价值;三是解决量子计算资源稀缺性难题,通过云平台提升综合性普惠服务能力。根据HyperionResearch最新展望,全球量子计算市场2022年市场规模6.14亿美元,预计到2025年达到12.08亿美元,CAGR25%,其中机器学习市场占比25%,被认为是最有潜力的应用市场之一。
量子计算在AI的应用处于探索初期,发现部分算法可能有优势,但还没实现量子霸权。神经网络和机器人学习系统的发展依赖于算力的进步以及庞大的训练数据量积累,随着摩尔定律演进的放缓以及“内存墙”等经典计算机架构原因,算力增长正在放缓,而隐私问题&数据标注成本也阻碍大数据的无限度获取。目前,产业界认为量子计算可能会成为机器学习发展的“神助攻”或开辟崭新的量子机器学习领域。一是量子计算机本身的工作架构可被看做一个神经网络(N个Qubit可代表2的N次方个神经元),麻省理工大学物理学家Lloyd估计,60个Qubit量子计算机可以编码的数据量就相当于人类一年生成的所有数据,而神经网络运算相当于同时对这些“神经元”对矩阵运算。二是传统神经网络初始层导入输入的样本将被中间层生成不同组合形式的输入,而采用量子比特编码的数据集数量和多样性都有可能扩大和丰富从而可能更好地训练模型。目前学术界探讨的可能展现出优势的人工智能算法包括决策问题、搜索问题、博弈理论、自然语言处理、贝叶斯网络、模式识别等,但由于目前还无法成功解决模型的初始参数输入以及准确的结果测量手段等问题,量子计算机在以上人工智能算法上还未展现出“量子霸权”优势。
1)海光信息:国产CPU与GPGPU重要参与者
海光信息是一家以CPU和DCU产品为主的芯片设计厂商,公司多款产品性能达到了国际同类型主流高端处理器的水平。CPU类产品兼容国际主流x86处理器架构和技术路线以及国际上主流操作系统和应用软件,软硬件生态完善,可靠性和安全性较高,得到终端客户的认可,已经广泛应用于运营商、金融、互联网、教育等重要行业及领域。海光DCU系列产品以GPGPU架构为基础,兼容通用的“类CUDA”环境以及国际主流商业计算软件和人工智能软件,软硬件生态丰富,可广泛应用于大数据处理、人工智能、商业计算等应用领域。在ChatGPT等应用场景下的所指的GPU即为GPGPU,去掉GPU为了图形处理而设计的加速硬件单元,保留了GPU的SIMT架构和通用计算单元。所以对于ChatGPT场景下的AI训练、矩阵运算等通用计算类型的任务仍然保留了GPU的优势,即高效搬运,运算,重复性的有海量数据的任务。
2)复旦微电:FPGA受益算力增长
FPGA在人工智能加速卡领域应用广泛。FPGA通过与CPU搭配,CPU的部分数据运算转移给FPGA,最终FPGA起到加速作用。无论是赛灵思还是英特尔,其FPGA在数据中心运算方面的产品形态均为加速卡,在服务器中与CPU进行配合。人工智能领域属于加速计算的一个分支,如阿里云、腾讯云之类的数据中心均对加速卡存在大量需求.根据人工智能的不同应用领域,可将各种算力需求和控制逻辑用最合适的资源组合实现,在这一过程中,FPGA在其中起到了关键作用。总体而言,FPGA具备快速、低功耗、灵活和高效的优点。硬件可编程的特性使得FPGA在AI训练中既能提供充足的算力,又具有灵活性,可以重新编程以适应不同任务的需要。
3)中际旭创:全球光模块龙头迎来800G时代
中际旭创是全球高速数通光模块龙头,在Top5云计算公司光模块供应商中占据最大份额,根据LightCounting统计,公司在2021全球光模块市场位列第一。全球云巨头数据中心网络部署正处于400G批量部署、800G小批量上量阶段,公司800G全系列产品已实现供货,800G时代有望维持龙头地位,并将享受400G、800G高端产品收入占比增加带来的综合毛利率提升。此外,公司布局硅光、CPO等前沿技术,硅光/EML两种平台400G光模块均通过客户验证,未来有望把持产业链上游核心环节,实现供应链稳定。在电信市场,公司战略进军相干高端光模块,已在国内主要设备商实现供货,有望开启第二增长曲线。
4)联特科技:欧美中低速WDM主流供应商,数通光模块“黑马”
联特科技在海外市场主打差异化竞争优势,经历10年积累,在WDM细分市场占据了优势地位,主要客户包括爱立信、诺基亚、Prolabs、Adtran等。随着欧美疫后通信新基建投资增加,原有城域网持续速率升级,公司在客户份额有望继续提升。此外,海外发达国家RAN市场,爱立信、诺基亚两家占据主导地位,公司作为爱立信前传光模块主要供应商之一收入持续增长。数通方面,近几年营收快速增长,2021年营收达3.3亿元,同比增长33%,在整体收入中占比近半。公司已成为思科、Arista等海外主流设备商合格供应商,100G/400G高速光模块产品持续上量,并有望在2023突破北美Top4云厂商客户。公司前瞻布局800G和CPO产品,目前已推出基于EML、SiP、TFLN全系列800G产品,EML预计2023年在客户端完成全面认证。
5)天孚通信:光通信精益制造代表,光引擎、激光雷达成长速度快
天孚通信定位于光器件整体解决方案提供商OMS,目前拥有十三大产品线、八大解决方案,几乎涵盖光模块生产所需的所有无源光器件、各种有源封装形态等。公司2022年业绩快报预计实现收入12.06亿元,同比增长16.8%,五年CAGR29.1%,归母业绩29.2%。公司将持续优化无源产品线结构,拓展新客户的同时提供一站式解决方案增加单客户价值量,未来无源产品有望保持高于行业的平均增速和毛利率;有源方面,公司战略聚焦高速数通领域,与大客户合作的硅光引擎快速上量,将受益于800G、1.6T硅光、CPO等新技术渗透率提升。此外,公司在激光雷达领域秉持精益制造理念,提供滤波片、透镜、棱镜等无源光器件以及模组化解决方案代工,目前在国内主流新势力车型已取得定点,未来两年将持续放量。
6)国盾量子:量子计算机已实现原型机搭建
7)浪潮信息:国内领先AI服务器厂商
公司是全球领先的新型IT基础架构产品、方案及服务提供商,以“智慧计算”为战略,通过“硬件重构+软件定义”的算力产品和解决方案、构建开放融合的计算生态,为客户构建满足多样化场景的智慧计算平台,全面推动人工智能、大数据、云计算、物联网的广泛应用和对传统产业的数字化变革与重塑。当前业务包括传统服务器、AI服务器及存储产品。根据IDC最新数据,浪潮信息的服务器产品2021年全年位居全球前二,持续以30%+的市占率领跑中国市场;AI服务器方面,根据IDC数据,2021年全年,中国AI服务器市场规模达350.3亿元,同比增长68.6%。从厂商维度看,浪潮信息、宁畅、新华三、华为、安擎位居前五,占据了82.6%的市场份额。其中,浪潮AI服务器市场占有率达52.4%。2021年,公司发布首款智算中心调度系统AIStation,拥有性能最强的液冷AI服务器NF5488LA5,发布2457亿参数的AI巨量模型“源1.0”。
6从元宇宙到大制造,大模型应用领域不断丰富
6.1“生成式AI”在互联网及元宇宙应用
“生成式AI(generativeAI)”在互联网及元宇宙领域市场化空间较为广阔。基于现行的NLP算法发展程度及数据集规模,在不久的将来,生成式AI有较大可能在“智能客服”和“搜索引擎”进行增值,并有希望以“插件”的形式赋能现有的“生产力工具链(工程软件/音视频制作工具等)”。在为客服领域增值的过程中,有希望在人工客服的全链路中(包括问题识别、潜在解决方案交付、反馈优化、和风险识别等)实现对人工客服的替代。可实现替代的领域包括电商零售、医疗健康、金融服务、和电信等领域的客服环节。
1)“生成式AI”在智能客服领域的潜在应用
“可对话AI(ConversationalAI)”是“生成式AI”在智能客服领域的直接应用。根据GrandViewResearch,全球“可对话AI(ConversationalAI)”2021年市场空间为62亿美元,其中,BFSI(银行保险等金融服务),医疗,零售和电商,和电信领域的市场空间为42.5亿美元左右,占68.5%左右;根据GrandViewResearch预测,2030年“可对话AI”的市场空间将达到约413.9亿美元,对应2022至2030年复合增长率(CAGR)为23.6%。该领域的核心竞争者包括:谷歌,微软,亚马逊,IBM,甲骨文,和SAP等。市场增长的主要驱动因素包括各领域对于应用AI技术替代人力这一需求的提升,和持续下降的AI对话程序的研发成本。
2)“生成式AI”在搜索引擎领域的潜在应用
2023年2月初,谷歌也发布了谷歌巴德(GoogleBard)生成式可对话AI。使用了谷歌的LaMDA(LanguageModelforDialogueApplications)模型。但是谷歌巴德发布之后,并没有达到用户的期待。之后,谷歌母公司Alphabet主席JohnHennessy称,谷歌之前在犹豫是否要将Bard应用于产品中,因为Bard还没有真的准备好。同时,百度也与同一时期官宣了“文心一言(ERNIEBot)”即将于2023年3月完成内测,届时将向公众开放。之后,上海报业集团,36氪,广州日报,爱奇艺,度小满,携程等媒体及互联网产品和平台均宣布接入文心一言。文心一言采用文心大模型,文心大模型的API包括ERNIE3.0文本理解与创作,ERNIE-ViLG文生图和PLATO开放域对话服务。
6.2AI赋能制造业转型升级,智能制造浪潮兴起
物联网、大数据、云计算等技术日益成熟,人工智能已成为新时代的风口浪尖,“人工智能+”也代表一种新的社会形态。智能制造是实现制造强国的主攻方向,更是提升制造业竞争力的核心技术。随着智能制造的浪潮兴起,人工智能技术已贯穿于制造业设计、生产、管理等诸多环节。从必要性看,在劳动力及土地成本双升的背景下,制造业面临着利润低、市场变化迅速等压力,而人工智能的应用不仅可以帮助企业提升智能化运营水平,实现降本增效,还可以通过与其他新兴技术的融合,推动制造业模式升级及价值链重构。从实际应用来看,人工智能在制造业的应用可分为三方面:1)智能装备:指具有感知、分析、推理、决策、控制功能的制造装备,典型代表有工业机器人、协作机器人、数控机床等;2)智能工厂:利用各种现代化的技术,实现工厂的办公、管理及生产自动化,典型的代表场景有协作机器人、智能仓储物流系统等;3)智能服务:指个性化定制、远程运维及预测性维护等,典型代表有工业互联网等。
1)智能装备产业百花齐放,工业机器人与高端数控机床空间广阔
工业机器人
工业机器人种类众多,贯穿工业生产的诸多工艺过程。工业机器人是广泛用于工业领域的多关节机械手或多自由度的机器装置,具有一定的自动性,可依靠自身的动力能源和控制能力实现各种工业加工制造功能。从构成来看,其主要分为三大模块:传感模块、控制模块和机械模块。其中传感模块负责感知内部和外部的信息,控制模块控制机器人完成各种活动,机械模块接受控制指令实现各种动作。从种类来看,工业机器人可分为搬运作业/上下料机器人、焊接机器人、喷涂机器人、加工机器人、装备机器人、洁净机器人及其他,贯穿于工业生产过程中从材料和零部件入库到生产再到最终产品出库的诸多环节。根据亿欧智库整理数据,2021年搬运机器人和焊接机器人占比最高,分别达55%和25%。从功能上看,较人工和传统机器而言,不论哪一类工业机器人,在实际生产中都具备成本、效率、安全等众多优势。因此,我们认为,随着核心零部件和核心技术的快速发展,工业机器人市场有望迎来快速发展。
高端数控机床
数控机床是一种装有程序控制系统的自动化机床,具备柔性和高效能的特点。近年来国内数控机床技术在高速化、复合化、精密化、多轴化等方面取得了重要突破,高端数控机床产业发展迅速。从组成来看,高端数控机床包括加工程序载体、数控装置、伺服系统、机床主体和其他辅助装置。具体来看:1)加工程序载体。即以一定的格式和代码存储零件加工程序,从而对数控机床进行控制。2)数控装置。属于数控机床的核心,多采用CNC系统,通过计算机系统程序的合理组织,整个系统协调的进行工作。3)伺服与测量反馈系统。主要用于实现数控机床的伺服控制,包括驱动装置和执行机构两大部分。4)机床主机。指在数控机床上自动地完成各种切削加工的机械部分,包括床身、底座、立柱、滑座、主轴箱、刀架等机械部件。5)其他辅助装置。证充分发挥数控机床功能所必需的配套装置,常用的辅助装置包括:气动、液压装置,排屑装置,冷却、润滑装置等。
2)智能工厂是实现智能制造的载体,协作机器人与智能仓储物流是工厂新星
协作机器人
协作机器人是一种新型的工业机器人,扫除了人机协作的障碍,机器人与人可以在生产线上协同作战,充分发挥机器人的效率及人类的智能,给未来工厂的工业生产和制造带来了根本性的变革。与传统工业机器人有所区别,协作机器人优势特点明显。与传统工业机器人相比,其不同之处在于:1)目标市场不同,协作机器人偏向于应用在中小企业及适应柔性化生产要求的企业,而传统工业机器人适用于大规模生产企业。2)模式不同,传统工业机器人是作为整个生产线的组成部分,如果某个环节机器人坏了,整条产线可能会面临停工的风险,而协作机器人更具备柔性特点,代替的是人,使得整个生产流程更为灵活。优势方面,协作机器人具备轻量化、友好性、人机协作、编程方便及感知能力五大特点。
智能仓储物流
智能仓储物流系统是通过信息化、物联网和机电一体化共同实现的智慧物流解决方案,通过将物料出入库、存储、输送、生产、分拣等物流过程自动化、信息化和智能化,来实现降本增效的目的。从构成来看,智能仓储物流系统包括硬件装备和软件系统。其中,硬件装备可按环节分为仓储装备、分拣装备和搬运与输送装备,具体的产品包括立体仓库、堆垛机、穿梭车、输送机、AGV、码垛机器人和分拣机等,主要执行具体的仓储物流操作任务;软件系统是智能仓储物流系统的控制中心,主要包括仓储管理系统WMS和仓储控制系统WCS,负责具体的仓储物流信息控制。从环节划分,仓储装备与软件系统的结合即智能仓储;分拣与输送、搬运装备与软件系统的结合称为狭义的智能物流;若智能仓储物流系统与生产线对接,增加物料管理、产线对接等产线功能模块,即构成智能产线仓储物流系统,也就是常说的智能产线,也是智能工厂的基础版。
市场空间前景广阔,黄金赛道有望开启高增。从智能仓储市场规模来看,根据头豹研究院统计的数据来看,受益于物流行业规模的迅速增长和仓储环节降本增效的需求不断攀升,市场规模从2017年的712.5亿元增至2021年的1145.5亿元,CAGR达12.6%。但从设备渗透率中,也反映出智能仓储物流在很多领域的融合程度不足,因此向未来看,随着智能仓储物流与更多应用场景融合和5G、物联网、人工智能等技术在仓储行业的进一步升级,智能仓储行业有望加速发展,预计2021-2026年CAGR达18.4%,2022年智能仓储物流市场规模约1357亿,2026年达2665亿元。
6.3AI赋能工业互联网,打造高效率设备管理和生产流程
智能服务是智能制造的必然延伸,工业互联网是制造业智能化的重要发展方向。工业互联网是数字化转型的关键力量,更是推动制造业转型发展的重要支撑。工业互联网是全球工业系统与高级计算、分析、感应技术以及互联网连接融合的一种结果。其本质是通过开放的、全球化的工业级网络平台把设备、生产线、工厂、供应商、产品和客户紧密地连接和融合起来,高效共享工业经济中的各种要素资源,从而通过自动化、智能化的生产方式降低成本、增加效率,帮助制造业延长产业链,进而推动制造业转型发展。换言之,工业互联网是实现智能制造的发展模式和现实路径。其产生背景也是国内人口红利的消失,劳动力成本上升。工业互联网则通过信息技术与工业系统的深度融合,保证对制造成本控制,因此,工业互联网已成为主要工业国家抢占国际制造业竞争的制高点。
AI算法的加入将有效提升设备运行稳定度和流程控制效率。以流程工业PHM智能监测系统为例,传统监测方式需要大量人工进行实时排障,随着AI算法的加入,PHM有望快速实现智能化、无人化,减少紧急维修事件发生的概率,降低其带来的停机、排障、维修损失,同时降低不必要的检修次数和对应成本。对于化工、冶金、煤炭等流程行业来说,每一个泵、反应釜、管路、温控设备出现故障都会对产线造成重大影响,甚至酿成生产事故。AI带来的能力提升将意义匪浅。
6.4人工智能助力汽车智能化
1)智能驾驶:从驾驶辅助到自动驾驶
自动驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,它是一个集环境感知、规划决策、多等级辅助驾驶等功能于一体的综合系统,它集中运用了计算机、现代传感、信息融合、通讯、人工智能及自动控制等技术,是典型的高新技术综合体。这种汽车拥有和人一样的“思考”、“判断”以及“行走”能力,使得电脑可以在没有任何人主动的操作下,能够自动安全地操作机动车辆。按照《汽车驾驶自动化分级》,驾驶自动化共分为:应急辅助、部分驾驶辅助、组合驾驶辅助、有条件自动驾驶、高度自动驾驶以及完全自动驾驶六个层级。
智能驾驶的感知、处理和执行都离不开人工智能技术的基础。首先,感知:让车辆配对相应的感测器来收集车辆的行驶状况和道路环境状况等信息。不同的系统需要由不同类型的车用感测器,包含毫米波雷达、超声波雷达、红外雷达、雷射雷达、CCD\CMOS影像感测器及轮速感测器等来收集整车的工作状态及其参数变化情形;其次,处理:将感测器所搜集的信息进行分析处理,再向智能控制中心传达控制讯息;最后,执行。根据控制中心下达的命令,完成对汽车的驾驶。
2)智能座舱:从出行工具到出行管家
智能座舱实质是汽车驾驶舱中的人机交互场景,主要目的是将驾驶信息与娱乐信息两个模块进行集成,利用自身处理海量信息数据的强大能力,把握用户在不同场景下的行为习惯,并以此优化智能座舱的空间结构,进而提升用户的驾乘体验。据《2022中国智能汽车发展趋势洞察报告》,未来随着智能化技术的不断普及,汽车不再仅仅是交通工具,将扩展成为日常生活的第三空间,用户对乘坐体验要求更高,智能座舱将加速普及。根据ICVTank数据,2022年全球智能座舱行业市场规模有望达461亿美元,中国作为全球最具发展潜力的汽车市场,2019年中国智能座舱市场规模达441亿人民币,预计2025年市场规模将达1030亿人民币,2017-2025年的复合增长率为13%,发展潜力巨大。
智能座舱是由不同的座舱电子组成的完整体系,其关键技术主要由四部分组成。第一部分是机械技术,包括可变化车体技术和内饰机构技术。未来汽车可根据不同模式进行伸缩折叠是一种趋势,座舱需要可以根据乘客对于不同场景的使用需求,实现内饰空间的不断调整变化。第二部分是电子硬件技术,包含芯片技术、显示屏技术、专用电器总成以及传感器技术四大技术。第三部分是软件技术,主要有操作系统和各种应用软件。汽车智能化发展必然会趋向于一机多屏,通过操作系统实现一个车机芯片控制各屏的软件。第四部分是两大支撑技术,分别是人工智能技术和云计算技术。未来智能算法的准确性决定了不同品牌智能座舱的差异化,是影响车内体验的关键。