ChatGPT商业化意义AIGC产业生态体系架构分析人工智能

01AIGC技术和产业生态迎来发展快车道

一是基础的生成算法模型不断突破创新;二是预训练模型引发了AIGC技术能力的质变;三是多模态技术推动了AIGC的内容多边形,让AIGC具有了更通用的能力。

2、AIGC产业生态加速形成和发展,走向模型及服务(MaaS)的未来

目前,AIGC产业生态体系的雏形已现,呈现为上中下三层架构:

第一层为上游基础层,也就是由预训练模型为基础搭建的AIGC技术基础设施层。由于预训练模型的高成本和技术投入,因此具有较高的进入门槛。

第三层为应用层,即面向C端用户的文字、图片、音视频等内容生成服务。在应用侧,侧重满足用户的需求,将AIGC模型和用户的需求无缝衔接起来实现产业落地。

随着数字技术与实体经济融合程度不断加深,以及互联网平台的数字化场景向元宇宙转型,人类对数字内容总量和丰富程度的整体需求不断提高。AIGC作为当前新型的内容生产方式,已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展,市场潜力逐渐显现。与此同时,在推进数实融合、加快产业升级的进程中,金融、医疗、工业等各行各业的AIGC应用也都在快速发展。

02消费端:AIGC牵引数字内容领域全新变革

1、AIGC有望塑造数字内容生产与交互新范式,成为互联网的内容生产基础设施

2、AIGC的应用生态和内容消费市场逐渐繁荣

3、AIGC将日益成为未来3D互联网的基础支撑

互联网向下一代技术升级和演进的重要方向是从“在线”走向“在场”,迈向3D互联网时代,AIGC将成为打造虚实集成世界的基石。AIGC为3D互联网带来的价值,既包括3D模型、场景、角色制作能效的提升,也能像AI作画那样,为创作者激发新的灵感。

4、聊天机器人和数字人成为新的、更包容性的用户交互界面,不断拓展应用领域

(2)数字人:首先AIGC大大提升了数字人的制作效能。用户可以上传图片/视频,通过AIGC生成写实类型的数字人,具有生成过程较短、成本低、可定制等特点。其次,AIGC支撑了AI驱动数字人多模态交互中的识别感知和分析决策功能,使其更神似人。

5、AIGC将作为生产力工具来推动元宇宙发展

03产业端:合成数据牵引人工智能的未来

1、合成数据为AI模型训练开发提供强大助推器,推动实现AI2.0

人工智能的发展应用离不开数据,但真实世界数据面临着难以获取、质量差、标准不统一等诸多问题。为此,计算机模型技术或算法生成的合成数据,作为真实数据的廉价替代品,日益被用于创造精准的AI模型。

2、合成数据助力破解AI“深水区”的数据难题,持续拓展产业互联网应用空间

合成数据背后的生成式AI被Gartner评为2022年银行和投资服务领域越来越受欢迎的三项技术之一。原因是能够通过合成数据以成本更低、易规模化、隐私保护合规的方式提供接近真实世界的数据。

3、合成数据产业加快成为数据要素市场新赛道,科技大厂和创新企业抢先布局

合成数据对人工智能未来发展的巨大价值使其加速成为AI领域的一个新产业赛道。一方面,国外的主流科技公司纷纷瞄准合成数据领域加大投入与布局。

4、合成数据加速构建AI赋能、数实融合的大型虚拟世界

展望未来,可以从三个方面来理解大型虚拟世界为什么成为AI数实融合的关键场景。

第一,大型虚拟世界可以提供人工智能开发所需的数据和场景,为AI应用开发提供“加速度”。第二,大型虚拟世界为各行各业训练开发AI提供了试验田。第三,在大型虚拟世界中通过AI连通虚拟与现实,实现AI数实融合。

ChatGPT商业化意义

(报告出品方:中信证券)

1.ChatGPT通过大模型突破AI瓶颈,GPT-4多模态应用带动商业化加速

概述:ChatGPT为NLP下的AI大模型,性能和使用体验超预期

概述:OpenAI倾力打造ChatGPT,获得微软有力加持

演变:GPT-1—无监督预训练+有监督微调

GPT-1使用了BooksCorpus数据集来训练语言模型,其中有7000余本未出版的书籍。具体表现上,在有监督学习的12项任务中,GPT-1在其中9项上的表现优于专门训练的受监督模型。

演变:GPT-2—无监督预训练+多任务学习

GPT-2发布于2019年2月,参数量达15亿,预训练数据量约40GB。GPT-1使用的概率条件模型为p(output|input),GPT-2使用相同的无监督模型学习多个任务,将概率条件模型修改为p(output|input,task),期望模型对不同任务的相同输入产生不同的输出。此外,GPT-2采取Zero-shot设定,不需要下游任务的标注信息,而是根据给定的指令理解任务。因此GPT-2的核心思想在于多任务学习。

展望:GPT-4—此前外界预期参数量变化不大、使用门槛有望降低

GPT-4备受业界期待,训练成本控制有望带动商业潜力的极大增强。ChatGPT的突出表现使得外界对GPT-4十分期待,自2021年以来便有报道称GPT-4“即将推出”,OpenAI公司CEOSamAltman今年受StrictlyVC采访时表示GPT-4将在“有信心可以安全且负责任地运行时”推出。外界此前也曾预期,GPT-4的推出或分阶段进行,例如GPT-3也是先开放给合作伙伴、付费用户和学术机构,才在2022年底开放给公众。

GPT-4对多模态的支持使得外界对模型潜力的预期进一步强化,原因在于多模态感知是建立人工通用智能(AGI)的重要一步,基于此能够执行人类水平的一般任务。

ChatGPT迅速走红,以订阅制服务B端、C端客户,成本控制下将有效加速商业化落地。ChatGPT自年初以来,持续出圈,截至2023年1月末月活突破1亿,成为史上增长最快的消费者应用。考虑到计算资源所牵涉的庞大训练成本、运行成本,ChatGPT的商业化路径已正在探索、明确中。

2.Transformer架构支撑GPT走向多模态,构筑AIGC领域核心基石

GPT采用的Transformer架构在NLP领域已跻身主流

Transformer也可用于CV领域,相较于CNN实现性能巨大提升

Transformer支撑下GPT有望走向多模态,构筑AIGC领域核心基石

GPT有望基于Transformer延伸至多模态,构筑AIGC核心基石,GPT-4或实现领跑。当前,基于Transformer的多模态学习成为AI领域的研究热点,研究者们提出了大量的Transformer变体。鉴于Transformer具有较少的特定于模态的架构假设,以及生成式预训练、大模型&大数据路线的成功,Transformer能够联动CV与NLP,通过联合建模完成,打破CV与NLP领域之间的壁垒。微软亚洲研究院2022年推出BEiT-3预训练模型,在目标检测、实例分割、语义分割、视觉推理、图片描述生成等任务上取得了SOTA的迁移性能。我们认为,基于Transformer架构,GPT未来有望延伸至多模态,助力内容创作由UGC、PGC全面走向AIGC,赋能通用领域以及金融、教育、医疗、传媒等垂直行业。

3.通用与垂直场景多点开花,GPT变革内容生成与交互方式

通用场景:办公软件—GPT+文本&图像打造效率型生产力工具

垂直场景:教育—GPT+文本&对话&翻译催化启发式、个性化教学

GPT有望催化“启发式”教学模式,加快教育领域的个性化、多样化变革探索。ChatGPT可以理解为一名“全能教师”,即便是小众、冷门的领域,也能够给出相对有逻辑的回答。我们认为,GPT技术将催化“启发式”教学模式,引导学生更加积极主动地进行思考、发问,并与“全能教师”进行对话探讨,这有别于传统的应试教学模式。

垂直场景:金融—GPT+文本&对话赋能客户服务、投研支持

GPT有望对金融行业的经营、管理、产品营销及客户服务等方面产生巨大影响。近年来,金融机构在合规趋严、人力成本上升等因素的影响下,对于数字化建设的意愿强烈。考虑到ChatGPT在内容生成等方面的突出表现,我们认为,GPT有望率先落地对外的客户服务与对内的投研支持。以银行业为例,电子客服仍处于AB判断阶段,引入GPT将更好地服务于客户需求;在证券、基金业,个人投资者存在的大量疑惑将可通过GPT解决,机构投资者在投研中也将获得来自GPT的协作。GPT有望重构金融行业客户服务端,也有望进一步增强机构内部的投研能力,助力经营效率提升与成本优化。

互联网医疗平台卡位线上问诊,GPT有望助力问诊效率大幅提升。2020年疫情爆发以来,互联网医院凭借着突破时空限制、免接触等优势,迎来快速发展。平安好医生、阿里健康、京东健康等平台搭建了轻问诊模式,主要通过自有医生、外部签约医生提供问诊服务。我们认为,GPT可以用于在线问诊支持,为用户提供基本的、常规化的问诊服务。这将助力互联网医疗平台实现问诊效率的大幅提升,问诊服务的供给能力将不再受制于链接的医生数量。

垂直场景:图像视频—GPT+图像&视频强化内容智能化生产与处理

GPT有望改变图像视频领域内容生产模式,多模态提高信息输出丰富度。图像视频行业新老业态交织,构成相对多元,以生产和传播文字、图像、艺术、影像、声音等形式存在,包括报纸、图书、广播、电影、电视、动漫等诸多细分领域。从产业链条来看,图像视频行业主要涉及信息采集、制作、分发、传播等,我们认为GPT将主要影响产业链前端的采集、制作。结合中国信通院《AIGC白皮书》,我们预计在GPT赋能之下,特别是对多模态的延伸,图像视频行业有望进一步提高写稿机器人、采访助手、视频智能剪辑、合成主播等新兴应用的供给能力,既改变内容生产模式,也满足信息接收者对丰富内容的需求。

ChatGPT在传媒行业的应用场景示例

(报告出品方/作者:浙商证券,姚天航)

ChatGPT火爆的背后算法革新+算力支持+数据共振

ChatGPT火爆全球,成为现象级互联网产品

ChatGPT是一个由OpenAI开发的大型语言模型,它使用自然语言处理和深度学习技术,可以理解语言内容和语境,能够承认错误、挑战不正确的前提、拒绝不适当的请求,通过生成自然语言文本的形式与用户交互,从而能够应用于各种语言任务和应用。

从AlphaGo到ChatGPT,AI技术发展叩响AGI之门

AlphaGo唤起AGI畅想。AlphaGo的成功使市场对AI技术产生空前期待,预想AI将由专用人工智能(ANI)走向通用人工智能(AGI),实现人类同等能力的任务执行。AGI遇技术难关,发展相对停滞。随后几年间面向AGI的应用和底层技术的发展不尽如人意,遇数据、能耗、语义理解、可解释性等瓶颈,技术未出现明显突破。

ChatGPT文本交互能力更上一个台阶。ChatGPT在文字创作与语言交互等方面的能力令人惊喜,一定程度上实现了人类同等能力,提升读写效率,逐渐向AIGC靠近。或为AGI实现带来曙光。虽然在大量用户体验下ChatGPT仍暴露出部分反馈偏差问题,但验证了基于大型语言模型(LLM)实现AGI具有可能性,重塑AI发展前景。

OpenAI商业化探索,B端流量收费与C端订阅收费并行

B端:提供API接口实施流量收费。OpenAI向用户提供语言、图像、音频等不同类型模型的API接口,通过用户使用模型的流量收费。其中ChatGPT对应API由其背后的AI模型gpt-3.5-turbo提供支持。此外,OpenAI还向用户提供嵌入模型和微调模型,支持用户根据自定义需求进行模型定制。

C端:提供产品订阅服务收取费用。OpenAI于2023年2月新推出ChatGPTPlus版本,对该版本的使用者收取20美元/月的订阅费用。ChatGPTPlus版本较免费公开使用的ChatGPT模型具有更快的响应速度,在应用高峰期能更顺畅的使用模型,且订阅者能够优先使用新功能,以向ChatGPT模型的深度用户提供更快捷的服务。

数字内容生产新方式AIGC

AIGC:产业链逐步形成,玩家百花齐放,商业模式持续探索

文本生成:NLP重要任务标之一,神经网络生成法为主流趋势

文本生成:Transformer架构实现并行处理,提升模型训练效率

Transformer架构引入Self-attention自注意力机制可取代RNN。2017年,Google发布《AttentionisAllYouNeed》Transformer模型通过采用Self-Attention自注意力机制,完全抛弃了传统RNN在水平方向的传播,只在垂直方向上传播,只需要不断叠加Self-Attention层即可。这样,每一层的计算都可以并行进行,可以使用GPU进行加速。

音频生成:TTS应用发展成熟,AI乐曲创作未来可期

音频生成主要应用于流行歌曲、乐曲、有声书的内容创作,以及视频、游戏、影视等领域的配乐创作,目前在众多场景已获初步发展,在部分场景已广泛应用、趋于成熟。常见音频生成中,TTS文字转语音是最普遍使用的落地应用,而创意性音频生成有助于激发创作者灵感,促进乐曲二创、辅助编曲。

图像生成:从GAN到Diffusion,技术持续迭代,能力更进一竿

生成式对抗网络(GAN)的提出标志着AIGC图像生成可实现,进入快速发展阶段。GAN由生成器和判别器两部分组成,生成器将抓取数据、产生新的生成数据,并将其混入原始数据中送交判别器区分。这一过程将反复进行,直到判别器无法以超50%的准确度分辨出真实样本。

DiffusionModel简化模型训练过程中数据处理的难度,解决了GAN稳定性问题,提高生成图片的质量。Diffusion模型的工作原理是通过逐渐添加高斯噪声来破坏训练数据。通过一张神经网络“生成器”来进行逆转破坏过程(去噪),从纯噪声中合成数据,直到产生干净的样本。GAN模型在训练过程中需要两张神经网络“生成器”与“判别器”,稳定性很难平衡,而DiffusionModel只有一张神经网络,解决了稳定性问题,同时简化了数据处理过程,且更加灵活。

图像生成:图像属性编辑普遍应用,创意图像生成应用落地较少

图像生成可简要划分为图像属性编辑、图像局部生成及更改、以及端到端的图像生成。其中,前两者的落地场景为图像编辑工具,而端到端的图像生成则对应创意图像及功能性图像生成两大落地场景。图像属性编辑大量应用落地,图像局部生成及更高目前有部分应用落地,端到端图像生成底层原理明确,未来有望规模化应用。

由于图像的生成复杂度远高于文字,在整体生成上,目前仍然难以达到稳定可靠的生成高质量图像。但随着GAN、DiffusionModel等模型的不断迭代,图像生成发展将非常快速。

视频生成:分帧生成图像连接成视频,视频属性编辑已普遍应用

视频生成强调将视频切割成帧,再对每一帧的图像进行处理,与图像生成原理类似。视频生成难度远高于图像生成,生成视频的质量与流畅度取决于很多因素,包括数据集规模、训练模型复杂度、特征提取准确性以及合成视频算法有效性;由于模型训练量要求过大,目前模型只能实现几秒钟的短视频生成,未来有望随着模型的迭代实现中视频和长视频的生成。视频生成应用场景主要包括视频属性编辑、视频自动剪辑、视频部分编辑,前者已大量应用,后两者还处于技术尝试阶段。

跨模态生成:目前未大规模落地,文字生成图像取得突破

策略生成:主要应用展望在游戏行业,其余场景发展较缓

策略生成是指生成一个可以在给定环境下执行任务的算法。普遍采用深度强化学习技术(早期曾采用决策树及监督学习),其本质原理是让AI感知环境、自身状态并基于特定目标决定当下需要执行的动作,然后基于下一个状态给到系统的反馈进行奖励或惩罚,最终使系统在不断的“强化”过程中优化“策略”。策略生成可应用于游戏智能(GameAI)、虚拟人交互、机器人控制、智慧交通等领域。游戏智能是决策生成目前应用最为广泛和明确的场景。由于游戏本身存在于计算机虚拟环境,并产生大量数据,因此游戏本身为AI提供了极佳的研发场景;而在其他业务场景中,还需先搭建能够充分还原现实因素的虚拟环境,并合理设置Reward等关键因素,目前距离现实应用较远。国内多家AI企业已在尝试这一方向,但如何精准完成环境学习仍然具有关键意义。

新时代生产力工具,AIGC赋能内容生产

AIGC+游戏:高效辅助游戏测试,保证质量并降低成本

游戏测试通常是游戏开发周期中的一大关键环节,其目的是保证游戏质量,减少发布后的风险,并为玩家提供更好的游戏体验。在游戏测试中,测试人员将会对不同的测试目标使用不同的测试技术,就游戏玩法、游戏流程内容、游戏系统、机型适配等进行测试,记录游戏中发现的问题,并通过管理工具报告Bug,向开发人员反馈问题。

伴随游戏生产量的增长以及游戏复杂度的提高,游戏测试的需求爆发,而AI可以在游戏测试中执行一些自动化任务,如执行基本的功能测试、性能测试、兼容性测试等,以实现更高效地测试。但AI目前还无法像人类测试人员那样进行用户体验、情感反馈等测试。

AIGC+互联网:AIGC激活内容平台,互为供给加速发展

AIGC将成为平台重要的内容形式。AI技术将显著降低内容制作门槛,提高内容制作效率,增加内容供给,如今已有不少内容创作者利用AI辅助生成图文,视频及音频内容,同时也有AI直接生成的内容,未来AIGC有望成为内容平台供给的重要形式。

AIGC+娱乐:开启元宇宙之匙,基础设施拔地而起

AIGC在元宇宙内容生产方面发挥了重要作用:元宇宙旨在构建用户的第二空间,为了让用户获得沉浸式的体验,内容生产者需要提供各种类型的虚拟内容。与第一空间不同的是,元宇宙内的内容是原生的,能够刺激用户的全感官。在这样的背景下,仅靠PGC和UGC产生的内容数量远远不足以支撑一个完整的第二空间。因此,AI协助内容生产成为必然趋势。大量个性化、多元化的数字内容将显著提升用户体验。

AIGC是元宇宙中用户交互界面的重要组成部分:在元宇宙中,智能NPC可以由AIGC生成并驱动,而ChatGPT则可以作为语言模型集成到智能体中,使它们成为元宇宙中逼真的虚拟助手或伙伴,能够执行“智能”动作和复杂任务。

AI基础数据服务

(报告出品方:国金证券)

1.AI基础数据服务脱胎于专业数据标注需求,2025年国内百亿规模可期

1.1产业图谱:AI基础数据服务脱胎于专业数据采标分工需求

国内AI基础数据服务产业主要包括上游数据产生及产能资源、中游训练数据生产、下游AI算法研发三大产业环节。其中,部分产业环节重合度较高,AI基础数据服务商主要脱胎于专业数据采标分工需求。

上游主要包括数据生产者和数据生产组织者,主要提供原料数据的采集服务。

下游包括科技公司、行业企业、AI公司和科研单位等,主要负责算法研发。部分下游AI公司拥有自主的标注工具,也可通过AI中台获取一些通用标注工具,少数数据需求大的企业还孵化了自主的数据服务团队。

1.2发展历程:站在人工标注市场出清与机器标注迭代的十字路口

理论层面:数据工程系AI工程基础环节,核心在于高效的数据标注。AI工程=数据工程+模型工程。其中,数据工程主要包括数据采集与数据标注,约占AI工程时长的80%;模型工程主要包括模型训练与模型部署,约占AI工程时长的20%。数据工程是AI工程的前置且基础环节,直接影响到模型的质量与精度。数据工程的核心在于高效的数据标注,Garbageingarbageout效应显著。

实践层面:AI模型训练数据需求规模大,训练数据质量不佳、效率低下情况普遍。据DimensionalResearch全球调研报告,72%的受访者认为至少使用超过10万条训练数据进行模型训练,才能保证模型有效性和可靠性,96%的受访者在训练模型的过程中遇到训练数据质量不佳、数量不足、数据标注人员不足等难题。为应对训练数据所带来的多方面挑战,AI企业开始从第三方购买原料数据收集、训练数据生产和数据专家咨询等服务。

AI数据工程发轫于AI产业落地元年,系AI下游应用的基础且必备环节。目前行业处于市场格局渐趋清晰,新老技术面临迭代,下游需求加速释放的关键节点。

产生成长期(2016~2022):近五年来,供给侧高烈度的业内竞争加速市场出清,需求侧对产业落地以及垂直场景的定制化数据采标需求逐渐凸显。最终引致行业头部企业浮出水面,行业格局逐渐清晰。

1.3市场规模:AI快速落地叠加数据量指数级跃升,2025年国内百亿规模可期

全球数据量呈指数式增长,中国数据量增速跑赢全球。据IDC,全球每年生产的数据量将从2018年的33ZB猛增至2025年的175ZB,其中结构化数据仅占到全部数据量的20%,其余80%都是以文件形式存在的非结构化和半结构化数据,日志文件、机器数据等占非结构化数据的90%,产生了源源不断的数据清洗与标注需求。相比之下,中国的数据量增速领跑全球,平均每年增速比全球快3%。2018年,中国的数据量为7.6ZB,占全球总量的23.4%,预计到2025年将增至48.6ZB,占全球总量的27.8%,CAGR高达30.4%。

中国AI基础数据服务行业市场规模2025年有望突破百亿。一方面,随着算法模型、技术理论和应用场景的优化和创新,AI产业对训练数据的拓展性需求和前瞻性需求均快速增长;另一方面,随着业内对训练数据需求类型的增加以及对服务标准要求的提高,产业链的专业化分工将愈加清晰,专业化的训练数据服务提供商将扮演更加重要的角色。据艾瑞咨询,2019年中国AI基础数据服务行业市场规模达30.9亿元,其中图像类、语音类、NLP类数据需求规模占比分别为49.7%、39.1%和11.2%。预计2025年国内AI基础数据服务行业市场规模将突破100亿元,年复合增长率高达21.8%。

1.4政策支持:近五年国家政策加持国内AI产业发展

近五年国家系列政策推动国内AI产业蓬勃发展。《“十四五”规划》指出要加快数字化发展,建设数字中国,同时打造数字经济新优势,充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合,赋能传统产业转型升,催生新产业新业态新模式,壮大经济发展新引擎。在国家顶层设计的支持下,我国AI基础数据服务行业稳步发展,行业训练资源库等细分应用领域的产业价值逐步凸显。

2.AI大模型催生高要求新需求,专业化数据集及AI训练师需求利好优质专业数据提供厂商

2.1场景特质:AI大模型时代无监督/半监督训练成为主流,RLHF催生新兴需求

大模型时代无监督/半监督训练成为主流。AI模型的训练方法主要包括监督学习和无监督学习两种典型方式,后随模型训练数据量的增加衍生出半监督学习方法。AI训练方法的发展历经“监督-无监督-监督-无监督/半监督”4个阶段,在目前的大模型阶段,无监督/半监督训练再次成为主流。监督学习与无监督学习的主要区别在于是否使用带有人工标注的数据集训练数据,半监督学习则是使用大量未标注数据+少量标注数据进行训练。

第一步,预训练阶段。模型首先需要在标注完备的大数据集上进行预训练,得到监督学习模型。

第二步,交互奖励阶段。模型与专业的人工智能训练师进行交互,专业标注人员会对ChatGPT生成的回答进行标注、评估和反馈,给出一个针对回答的分数或者标签。这些标注数据可以作为强化学习过程中的“奖励函数”来指导ChatGPT的参数调整,得到奖励模型。

第三步,迭代优化阶段。基于奖励模型的奖励函数以PPO(一种使用两个神经网络的强化学习算法)的方式微调监督学习训练出来的生成模型,基于强化学习loss持续迭代生成模型,最终帮助模型进行强化学习和不断优化。

2.2场景需求:预训练阶段高质量专业数据集+交互奖励阶段人工智能训练师

伴随业界大模型市场竞争的白热化,RLHF系统也将得到进一步的推广及迭代使用,从而带来两大类新兴数据标注需求。一是预训练阶段催生AI厂商对于标注完善、清洗完备的各类专业化场景数据集的需求;二是交互奖励阶段催生AI厂商对于具备专业的事实判断与规范的价值判断的人工智能训练师的需求。目前,上述两类新兴需求尚未得到充分有效的市场供给,利好海天瑞声这类优质专业数据解决方案提供商。针对RLHF预训练阶段需求,由于传统数据采标厂商的主流商业模式以销售工具系统和标注服务为主,所以普遍缺少自有数据,较少经营出售精准数据集的服务。针对RLHF交互奖励阶段需求,聚焦专业垂类的模型训练师则更为稀缺,市场蓝海亟待业务开拓。

2.3场景价值:超大规模预训练模型推动训练数据数级跃升,市场需求持续延展

超大规模预训练模型推动训练数据指数级跃升。自OpenAI于2020年推出GPT-3以来,谷歌、华为、智源研究院、中科院、阿里巴巴等企业和研究机构相继推出超大规模预训练模型,包括SwitchTransformer、DALL·EMT-NLG、盘古、悟道2.0、紫东太初和M6等。目前,预训练模型参数数量、训练数据规模按照300倍/年的趋势增长,继续通过增大模型和增加训练数据仍是短期内主流演进方向,RLHF技术的推广使用或将推动训练数据市场需求持续延展。

3.自动驾驶领域训练数据需求方兴未艾,海天瑞声发力布局

3.1场景特质:自动驾驶客户需求全栈式闭环数据解决方案

自动驾驶领域对于基础数据服务商提出更高要求,业内客户需要全栈式闭环数据解决方案。数据获取和处理能力是自动驾驶企业的核心竞争要素之一,自动驾驶能力取决于高效的数据闭环和数据的利用效率,并能利用大量有效数据训练智能驾驶算法。因此,自动驾驶客户要求数据服务商能够提供闭环数据解决方案,以满足智能驾驶业务数据处理量大、数据处理需求迭代频次高等特点,专业知识、服务经验及准入资质将成为衡量的重要标准。

3.2场景需求:自动驾驶领域数据标注分为2D图像标注与3D点云标注

自动驾驶领域的数据可分为车载摄像头采集的2D图像数据和激光雷达采集的3D点云数据。一般而言,低level的自动驾驶技术以2D图像数据为主,3D点云标注数据是中高level自动驾驶技术的基础训练数据,在自动驾驶领域中发挥着愈发重要的作用。3D点云标注数据在自动驾驶领域的应用可以分为两个方面,一是基于场景理解和目标检测的实时环境感和处理,二是SLAM(即时定位与地图构建)加强定位。

2D标注:通过精确理解来自可见光摄像头的信息,寻找能够创建用于目标物体的可扩展边界框。

3D点云标注:通过识别和跟踪场景中的对象,了解汽车前方和周围的场景。将点云数据和视频流合并到要标注的场景中。

3.3场景价值:自动驾驶训练数据市场方兴未艾,2025年国内市场规模或达25亿元

自动驾驶约占我国AI基础数据服务市场规模的35%,2025年市场规模或达25亿元。自动驾驶的视觉技术主要应用于有监督的深度学习,需要大量的标注数据对模型进行训练和调优。目前该领域的数据采集和标注需求已成为AI基础数据服务的主要下游之一。据IDC,2020年我国自动驾驶领域占AI基础数据服务市场规模的35%,系第一大下游场景。另据艾瑞咨询,2025年我国自动驾驶AI基础数据服务市场规模或达24.9亿元,预计18~25年CAGR高达23.2%,跑赢AI基础数据服务整体增速21.8%。

4.国内市场集中度趋势性收敛,海天瑞声具备领先优势

品牌数据服务商未来将替代中小型供应商成为市场主要供应力量。我国AI基础数据服务行业主要市场主体包括需求方自建基础数据团队与基础数据服务商(品牌数据服务商、中小数据服务商)。截至2019年,中小数据供应商是主要供应力量,占比高达47%。其中百度众包、海天瑞声分居top2,占比分别为11.0%、8.0%,2019年行业CR5仅为26.2%。结合本文1.2部分分析可知,近年间需求端垂直场景及专业化需求凸显,业务门槛提高;供给端竞争加剧挤压中低端业务利润空间,加速市场出清。预计当前我国AI基础数据服务行业市场主要以品牌数据供应商与需求方自建团队为主,行业龙头逐渐浮出水面,中小供应商份额显著下降。

业内品牌数据商包括海外巨头Appen、国内领军厂商海天瑞声、慧听数据、标贝科技等:

慧听科技:成立于2011年,业务包括语音识别、语音合成、语音评测、语言文本类、多媒体类等多领域数据制作,以及语音合成、语音识别、输入法系统的研发等。公司提供服务涵盖语音训练数据制作、音乐数据制作标注、语音质量评测等,经营模式包括定制开发和自有训练数据产品销售。

4.2竞争格局:业内主要玩家发展各有侧重,Appen及海天瑞声具备领先优势

据IDC,2021年海天瑞声在国内AI基础数据服务行业市占率高达12.9%,位居第一。其技术实力、语种/方言覆盖能力、专利及软著数量、成品训练集数量均位居行业前列。相比之下,Appen在覆盖区域、语种/方言覆盖能力等方面更具优势。慧听科技与标贝科技则在音乐领域具备差异化业务覆盖能力。

在语音类数据产品中,海天瑞声在结构方面的差异主要体现在覆盖的噪声类型、录音通道数量、录音文本内容类型等方面。相比之下,海天瑞声的训练数据产品结构整体而言可覆盖更丰富的录音文本内容类型、噪音环境类型、录音通道数量,Appen则在稀有语言覆盖数量上更胜一筹。

4.3他山之石:Appen发展复盘,全球AI基础数据服务巨头的崛起之路

Appen系AI基础数据服务行业全球巨头,经历爆发式成长后收入利润短期双双回落。Appen成立于1996年,面向机器学习和人工智能开发的高质量人工标注数据集,于2015年于澳大利亚证券交易所上市。2015~2019年,公司经历了爆发式成长期,营收增速一度冲高至100%以上,同期净利率接近10%。2020~2022年,受到全球疫情及公司内生发展阶段调整影响,2022年公司营收规模相较2021年回落13.1%,净利率由9.1%回落至5.9%。

Appen位居同业员工量能及数据标注技术前列。全球范围来看,Appen位居全球AI基础数据服务行业收入体量首位。其员工量能(数量及质量)与数据标注技术领先程度均位居行业头部,紧随之后的是Telus和Lionbrigde。以数据堂、海天瑞声为代表的国内头部厂商距离Appen等海外大厂仍存在一定差距。

THE END
1.CHATGPT品牌介绍CHATGPTAIGC工具软件CHATGPT 品牌网址 美国OpenAI公司 1个行业上榜十大品牌 2个行业品牌金凤冠 专业测评A+++ 成立时间2022年 新兴品牌 行业领军 3星品牌形象 品牌点赞1920+ 关注度8582+ 品牌得票8806+ 美国 8.3 1977人评分 给品牌评分 给品牌点赞 赞1920 所属行业 品牌榜 得票指数 人气票 得票排名 参与https://m.maigoo.com/brand/4125664.html
2.chatgpt哪个公司做的最近有关chatgpt的话题在网上也是超级火的,而且chatgpt目前已经在国外受到很多民众的关注,大家对这个软件都十分感兴趣。chatgpt哪个公司做的呢?很多网友对这个最新出现的软件好奇,下面跟小编一起来看下关于chatgpt的相关介绍。 chatgpt哪个公司做的 chatgpt是OpenAI公司开发的。 1、chatgpt是人工智能公司OpenAI,在2022年https://edu.iask.sina.com.cn/jy/lyvLwIBSw7.html
3.ChatGPT是哪家公司开发mapstarChatGPT是OpenAI 公司开发,ChatGPT 是一个原型人工智能聊天机器人,专注于可用性和对话。由 OpenAI 开发,采用基于 GPT-3.5 架构的大型语言模型。 我们找到了官方对于这个模型优势解释的paper: 使语言模型更大并不能从本质上使它们更好地遵循用户的意图。 例如,大型语言https://www.cnblogs.com/mapstar/p/17471285.html
4.天品互联北京APP开发公司小程序开发制作软件开发APP开发公司-小程序开发公司-北京天品互联,9年APP软件开发制作公司,提供安卓、IOS手机APP制作、微信小程序开发、chatgpt接入开发服务,一站式软件开发外包服务,30天快速完成APP制作并上架应用商店,20人手机软件开发APP公司,支持定制小程序APP,免费报价,可接后期运营http://www.tianpinkeji.com/
5.ChetGPT是谁研发的?chatGPT是由开发人工智能技术的OpenAI公司研发的。 OpenAI是一家成立于2015年的非营利性人工智能研究公司,总部位于美国加州旧金山。 其目的是推进人工智能领域的研究与开发,并确保人工智能技术的安全和可控性。 OpenAI致力于实现人工智能技术的可持续发展,以提升人类生活和整体社会福利为目标。 公司的创始人包括伊隆·https://www.meipian.cn/4zlfadyh
6.中国版chatGPT软件开发解决方案快速上线美国“机器人智能研究中心”研发的聊天机器人程序chatgpt在2022年1月30日成功发布,并为大型的国有企业提供功专业的解决方案开发与项目研发服务, 公司目前已经为大中小型企业提供了一站式的APP开发服务, 专注行业APP软件开发,主要经营业务包括APP定制开发、网站定制开发、一经发布就引起了全世界的关注。chatgpt是人工智能https://zhengzhou035769.11467.com/news/3274335.asp
7.ChatGPT支持独立部署、自有软件嵌入式开发 什么是ChatGPT ChatGPT是由OpenAI公司开发的一种基于Generative Pre-training Transformer(以下简称GPT)模型的聊天机器人。 它使用深度学习技术来模拟人类的对话,通过在海量的文本数据集上进行预训练,从而学习生成自然、流畅的语言回应。 http://www.figo.cn/chatgpt/
8.ChatGPT是新一轮科技革命吗?中国虽然没有,但中国用户赚钱了ChatGPT就是“聊天机器人+搜索工具+文本创造工具” 无论是个人还是企业 很多人都开始担心被ChatGPT替代 ChatGPT是OpenAI开发的产品 这让全球其他科技巨头吓到了 特别是美国科技巨头谷歌公司 谷歌迅速推出竞争产品AI机器人Bard 可见科技巨头们有多慌 ChatGPT的爆火背后 http://healthnews.sohu.com/a/638046136_121473291
9.chatgpt提示词徐同保的技术博客chatgpt免费入口 担任雅思写作考官 “我希望你假定自己是雅思写作考官,根据雅思评判标准,按我给你的雅思考题和对应答案给我评分,并且按照雅思写作评分细则给出打分依据。此外,请给我详细的修改意见并写出满分范文。第一个问题是:It is sometimes argued that too many students go to university, while others claim https://blog.51cto.com/xutongbao/6278052
10.2023年ChatGPT上市公司ChatGPT概念股一览侃股网摘要: 2023年ChatGPT上市公司 ChatGPT概念股一览:乐鑫科技(688018)在互动平台表示,公司注意到目前已有开发者开始使用ChatGPT来协助开发使用乐鑫产品,比如在B站和Youtube上已有相关案例视频。公司也在评估如何将此类技术 什么是ChatGPT ChatGPT是美国人工智能实验室OpenAI推出的人机对话模型。自12月推出后,就在在大http://www.eweb.net.cn/article-174480-1.html
11.ChatGPT将改变所有人的工作流—新闻—科学网第一个是OpenAI和各大公司的合作。为什么OpenAI可以跟他们合作,以及这种合作代表了一种什么样的未来? 第二个我想再强调一遍,ChatGPT到底是什么?它是不是只是一个聊天机器人? 第三个更发散一点,未来到来了,我们还有哪些新的商业机会? OpenAI和各大公司的合作 https://news.sciencenet.cn/htmlnews/2023/4/499551.shtm
12.5分钟扫盲chatGPT与OpenAI编程(for开发者)ChatGPT 是 OpenAI 公司的一个技术产品,chatGPT使用了 GPT(Generative Pre-trained Transformer)技术,是一个用于对话生成的预训练语言模型,OpenAI还有很多其他模型。 (来自:chatGPT的解释) OpenAI是一家人工智能研究公司,它开发并提供了一系列人工智能技术和产品,包括SDK开发包。 https://www.jianshu.com/p/b57d484738f0
13.爆红的chatgpt是如何诞生的?chatgpt是怎么产生的ChatGPT是一款由 OpenAI开发的人工智能系统,它用来模拟自然语言处理任务的深度学习模型,能够理解自然语言,并根据输入文本内容。 ChatGPT系统在文本生成过程中采用了基于Transformer架构的预训练语言模型,该模型以 Transformer架构为基础,使用双向 Transformer模型,训练从输入文本到输出文本的语言模型,将输入文本表示成语义相似的https://blog.csdn.net/qq_42751978/article/details/129172965
14.CHATGPT是哪个国家的软件CHATGPT是哪个国家的软件 CHATGPT是一款基于人工智能技术的聊天机器人软件,开发地点位于印度。CHATGPT是由印度AI初创公司GPT Labs开发的,由GPT Labs的创始人兼CEO Shivendra Mishra领导团队开发。 GPT Labs(Generative Pre-trained Transformer Labs)是一家印度初创公司,主要致力于人工智能技术和自然语言处理技术的研发和http://www.henanfood.net/lenglianwuliu/news/chatgpt/313277/