大数据AI公司Databricks于2024年3月27日开源了一款拥有1320亿参数、使用MoE(专家混合模型)架构的Decoder-Only大模型DBRX。DBRX模型正式开源后,Databricks官网发布了DBRX模型与其他大模型的功能对比与评价。综合来看,DBRX模型的多项性能均优于马斯克开源的Grok-1,DBRX是目前在所有的开源大语言模型LLM中性能处于领先位置。Databricks官网之后同时也发布了DBRX模型与其他大模型的仔训练和推理方面效率的评价对比,DBRX在使用新的MoE架构与更好的预训练数据后,DBRX在模型质量与效率之间可以达到了一个更好的平衡。
二、AI板块介绍
(1)产业链情况
根据Wind,人工智能产业链主要由基础层、技术层和应用端三大板块构成。基础层包含AI处理器、传感器、服务器、云计算和数据等领域,为人工智能提供硬件基础;技术层包括计算机视觉、语义识别、智能语音、机器学习等,基础的生成算法模型是驱动AI的关键;应用层包括无人驾驶等众多领域,是人工智能作用于生产生活的具体体现。
图1人工智能产业链
(2)市场规模
随着人工智能技术的不断发展,其应用场景日益丰富,各行各业所汇聚的庞大数据资源为技术的实际应用和持续完善提供了坚实基础。根据第三方咨询机构格物致胜的统计数据,2022年中国人工智能市场规模达到2058亿元,预计2023-2027年市场规模将保持28.2%的复合增长率,2027年中国人工智能市场规模将达到7119亿元。根据statista的统计数据,2023年全球人工智能市场规模达2079亿美元,预计2030年将增至18475亿美元。
图2中国人工智能市场规模及预测(单位:亿元人民币)
图3全球人工智能市场规模及预测(单位:亿美元)
(3)发展历程
基础的生成算法模型是驱动AI的关键:2014年,伊恩·古德费洛(lanGoodfellow)提出的生成对抗网络(GenerativeAdversarialNetwork,GAN)成为早期最为著名的生成模型。GAN使用合作的零和博弈框架来学习,被广泛用于生成图像、视频、语音和三维物体模型。随后,Transformer、基于流的生成模型(Flow-basedmodels)、扩散模型(DiffusionModel)等深度学习的生成算法相继涌现。Transformer模型是一种采用自注意力机制的深度学习模型,这一机制可按输入数据各部分的重要性分配权重,可用于自然语言处理(NLP)、计算机视觉(CV)领域应用,后来出现的BERT、GPT-3、laMDA等预训练模型都是基于Transformer模型建立的。
图4主流生成模型一览表
预训练模型引发了AI技术能力的质变:预训练模型是为了完成特定任务基于大型数据集训练的深度学习模型,让AI模型的开发从手工作坊走向工厂模式,加速AI技术落地。2017年,Google颠覆性地提出了基于自注意力机制的神经网络结构——Transformer架构,奠定了大模型预训练算法架构的基础。2018年,OpenAI和Google分别发布了GPT-1与BERT大模型,意味着预训练大模型成为自然语言处理领域的主流。
图5预训练相当于“通识教育”
三、近期行业变化
多模理解和生成的统一是通往AGI的必经之路:模型的演化必然会经历单模到多模到世界模型三个阶段。当下理解模型和生成模型是分开发展的,未来随着理解和生成实现统一,就可以进一步结合具身智能,形成世界模型。再进一步,加入复杂任务的规划能力和抽象概念的归纳能力,就真正演化到了AGI的阶段。
多模态技术成为大模型主战场:多模态较单一模态更进一步,已经成为大模型主战场。人类通过图片、文字、语言等多种途径来学习和理解,多模态技术也是通过整合多种模态、对齐不同模态之间的关系,使信息在模态之间传递。2023年以来,OpenAI发布的GPT-4V、Google发布的Gemini、Anthropic发布的Claude3均为多模态模型,展现出了出色的多模态理解及生成能力。未来,多模态有望实现anytoany模态的输入和输出,包括文本、图像、音频、视频、3D模型等多种模态。
智能涌现从虚拟世界走向物理世界:当大模型迁移到机器人身上,大模型的智能和泛化能力有望点亮通用机器人的曙光。2023年7月,谷歌推出机器人模型RoboticsTransformer2(RT-2),这是一个全新的视觉-语言-动作(VLA)模型,从网络和机器人数据中学习,并将这些知识转化为机器人控制的通用指令。2024年3月,机器人初创企业Figure展示了基于OpenAI模型的全尺寸人形机器人Figure01,机器人动作流畅,所有行为都是学到的(不是远程操作),并以正常速度(1.0x)运行。
AI算力应用持续深化,大模型赛道日益更新:英伟达GTC2024大会上公布了关于NVIDIABlackwell、NIM微服务、OmniverseCloudAPI等一系列AI引领各领域变革的显著成就。同时,全球AI大模型市场迭代进程加快,3月4日,美国初创公司Anthropic推出Claude3模型系列;3月17日,马斯克旗下的初创企业xAI宣布对Grok-1的基本模型权重及网络架构进行开源。
四、投资展望
(1)量子计算机
量子计算有望成为解决AI算力瓶颈的颠覆性力量:与传统计算相比,量子计算能够带来更强的并行计算能力和更低的能耗,同时量子计算的运算能力根据量子比特数量指数级增长,在AI领域具有较大潜力。海外科技巨头带动量子计算产业发展,IBM、微软、谷歌等公司先后发布量子计算路线图,与此同时,国内量子计算产业与海外科技巨头差距不断缩小,2024年1月16日我国第三代自主超导量子计算机“本源悟空”上线运行可以一次性下发、执行200个量子线路的计算任务,比国际同类量子计算机具有更大的速度优势。
量子计算有望赋能千行百业,开启8000亿美元蓝海市场。据ICV数据,2023年全球量子计算市场规模约47亿美元,预计2035年有望超过8000亿美元;其中,金融、化工、生命科学领域有望更加受益量子计算产业发展。
(2)AI服务器
(3)机器人
AI时代快速发展,机器人赛道或将迎来放量空间。人工智能技术加速多行业领域升级发展,机器人作为主要的下游应用场景,在AI变革及大模型发展的阶段将不断赋能制造业等行业向自动化、智能化转型。除英伟达、特斯拉之外,AgilityRobotics、波士顿动力公司以及谷歌DeepMind等公司也纷纷入局机器人赛道。据华尔街见闻,英伟达、OpenAI、亚马逊等科技巨头纷纷入局投资了机器人初创科技企业FigureAI,其中该公司在新一轮融资中募集约6.75亿美元,投前公司估值已有约20亿美元。华夏基金认为,机器人作为具身智能的载体,英伟达对具身智能的正式入局,将稳步推动机器人智能化的提升;同时伴随龙头企业持续加码AI及机器人领域投资,并积极进行多行业资源调配及整合,未来机器人行业将进入加速发展阶段。
人工智能AIETF(515070)及其联接基金(008585/008586):中证人工智能主题指数(指数代码:930713.CSI,指数简称:CS人工智)选取为人工智能提供基础资源、技术以及应用支持的公司中选取代表性公司作为样本股,反映人工智能主题公司的整体表现。该指数已纳入截至2018年9月30日的IOSCO金融基准原则鉴证报告范围。