思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.ChatGPT+AI项目实战,打造多端智能虚拟数字人超清ChatGPT+AI项目实战,打造多端智能虚拟数字人 <<<下栽科>>>:白du网pan 在科技日新月异的今天,人工智能(AI)已不再是遥不可及的科幻概念,而是深刻影响着我们的日常生活与工作方式。其中,ChatGPT作为AI领域的璀璨新星,正以其卓越的自然语言处理能力和广泛的应用潜力,引领着一场前所未有的技术革命。本文旨在探讨Chhttps://blog.csdn.net/2401_86430380/article/details/140595292
2.gpt创作自己的ai数字人随着科技的飞速发展人工智能已经渗透到咱们生活的方方面面。作为一种前沿技术生成式(Generative )在虚拟数字人的打造上展现出了巨大的潜力。本文将深入探讨怎么样通过GPT 项目实战打造出一款跨平台、高度智能化的虚拟数字人,并分析虚拟数字人与生成式结合的必不可少性。 https://www.yanggu.tv/webgov/aixuexi/415367.html
3.本地离线chatGPT+数字人(1080ti环境下演示)GPT+数字人+直播伴侣就是一台印钞机 metahuman超低口型动画延迟/语音直驱——源文件(高手进阶版) 我的虚拟人诞生了/ChatGLM+Azure+Unity+Daz AI 数字人训练GeneFace++ 有手就能做数字人:GeneFace++界面版本使用教程,无需本地部署,无脑训练,精通个人AI数字人,制作个人可用可控可调的数字人,视频数字人,图片数https://xbeibeix.com/video/BV1bp4y177Ue
4.ChatGPT+数字人流量如何变“留量”ChatGPT+数字人 流量如何变“留量”_北京时间 敬请关注BRTV财经 敬请关注BRTV财经 敬请关注BRTV财经 敬请关注BRTV财经 自动播放接下来播放 01:02 ChatGPT+数字人 “流量”如何变“留量” 2024-05-22 01:03 ChatGPT、Sora带火人工智能,高职院校相关专业起薪水平也不低! 2024-03-17 00:49 ChatGPT-5已出?https://item.btime.com/47m9a9injf48ucaqmji6fq3u6hv
5.如何使用ChatGPT制作免费的数字人5. 调试和优化:在数字人的制作过程中,你可能会遇到各种问题和挑战。要花时间调试和优化你的数字人,确保它能够按照预期工作,并具备良好的性能。 ChatGPT制作数字人的过程 但是,有了chatgpt,复杂的事情变的简单了起来,我们一起来看看,怎么制作属于自己的免费的数字人。 https://developer.aliyun.com/article/1458706
6.ChatGPT+AI项目实战,打造多端智能虚拟数字人实战课程课程以项目实战的方式,基于ChatGPT完成多端全栈式开发,实现AI绘画、智能语音、数字虚拟人等,从0到1手把手带你打造一个专属对话虚拟人。通过语音唤醒、识别及合成、安卓开发、前后端快速搭建等技术,使你具备将AI技术真实落地工作中,高效快速提高自身核心竞争力。 https://coding.imooc.com/class/695.html
7.ChatGPT+AI技术项目实战,打造多端智能虚拟数字人分享课程——ChatGPT+AI技术项目实战,打造多端智能虚拟数字人,附源码。 ChatGPT全称为Chat Generative Pre-trained Transformer,一个基于深度学习的大型语言模型,其模型结构使用了Transformer网络 。这个网络可以从输入的文本中学习语言的规律和模式,并用这些规律和模式来预测下一个单词或字符。 https://www.douban.com/group/topic/298500592/
8.ChatGPT+AI项目实战,打造多端智能虚拟数字人12章完结││[10.2]--10-2数字人制作平台演示_1_ev.mp4 ││[10.3]--10-3使用avatarSDK图片生成3D模型_ev.mp4 ││[10.5]--10-5本章小结及作业_ev.mp4 ││ │├─{11}--第11章综合实战:UE5+ChatGPT实现3DAI虚拟人 ││[11.1]--11-1UE5数字人插件及语音插件安装_ev.mp4 https://www.meipian.cn/52lx3446
9.ChatGPT+AI项目实战,打造多端智能虚拟数字人随着人工智能技术的飞速发展,虚拟数字人已经逐渐成为我们日常生活的一部分。ChatGPT作为一种强大的自然语言https://www.souho.net/forum.php?mod=viewthread&tid=1087106
10.课件ChatGPT+AI项目实战,打造多端智能虚拟数字人分享课程——ChatGPT+AI 技术项目实战,打造多端智能虚拟数字人,附源码 ChatGPT 全称为 Chat Generative Pre-trained Transformer,一个基于深度学习的大型语言模型,其模型结构使用了 Transformer 网络 。这个网络可以从输入的文本中学习语言的规律和模式,并用这些规律和模式来预测下一个单词或字符。 在 chatGPT 的训练https://www.cnblogs.com/branchTree/p/18104381
11.基于ChatGPT+AI项目实战打造多端智能虚拟数字人(更新完毕)52随着人工智能技术的飞速发展,虚拟数字人已成为新的热点。结合ChatGPT等先进技术,我们可以打造出多端智能的虚拟数字人,为人们提供更智能、更人性化的服务。 随着互联网的普及和用户需求的多样化,传统的客服和交互方式已无法满足用户的需求。多端智能虚拟数字人项目旨在通过先进的AI技术,为用户提供24小时全天候、个性化、http://www.52download.cn/wpcourse/?p=34762
12.ChatGPT+AI项目实战,打造多端智能虚拟数字人经内容介绍:(9)--第9章 安卓AI虚拟数字人整合开发 (8)--第8章 智能语音-ChatGPT智能回复功能开发https://bbs.pinggu.org/forum.php?mod=viewthread&tid=11981581
13.全面接入:ChatGPT杀进15个商业应用,让AI替你打工微软联合创始人比尔·盖茨称GPT是“40多年来最革命性的技术进步”,英伟达创始人黄仁勋高呼:“我们正处于AI的iPhone时刻”,阿里董事会主席兼CEO张勇也说:“所有行业都值得用大模型重做一遍。”从一个风靡全球的AI玩具到独具潜力的赚钱法宝,对话机器人ChatGPT仅仅用了不到半年。 https://36kr.com/p/2250498723737224
14.云翼港数字跨境营销联盟数字人ChatGPTTikTok直播ChatGPT客户端 速度快 稳定 应用场景 免费使用 tiktok 运 营 国内前置仓 海外仓 印尼合作海外仓4000平米 马来西亚合作海外仓2000平米 工厂 样品铺货 您铺货我们卖! 达人1000+ 直播间300+ 月均出单100万单 合作咨询 云 翼 港 直 播 手 机 数字人 http://www.cloudeport.com/
15.数字人直播,AI虚拟数字人短视频,数字人世界,AI绘画欢迎来到数字人世界!探索数字人直播与AI虚拟数字人短视频,感受前所未有的数字人体验。加入我们,一起了解最新的AI技术与虚拟现实趋势。立即点击,开启您的数字人之旅!https://www.shuzireng.com/
16.超写实数字虚拟人与ChatGPT实时交互训练营,带你从小白到行家本实操课程旨在让学员亲手动手实现虚拟数字人与Chat GPT平台的接入。学员将学习如何使用流行的虚拟数字人开发工具,创建自己的虚拟数字人,并将其与Chat GPT平台集成,以实现智能对话的功能。通过本实操课程,学生将具备实际开发和集成虚拟数字人与Chat GPT平台的能力。 https://zrt9.com/20224.html
17.60条视频ChatGPT+数字人3小时做完,2023年AIGC有望商业大爆发作为国内领先的AI视频制作工具研发商,闪剪智能的领导层都蠢蠢欲动了,好家伙,这不是我们的专业领域嘛。领导突发奇想,居然让我们运营小组来测试AI生产视频的效率极限,“不许人工写文案,不许自己剪视频,每人使用ChatGPT和数字人一天做出60条视频,否则明天就别来公司了!” http://www.360doc.com/content/23/0303/09/41531465_1070233822.shtml
18.私域ChatGPT的8个拷问那么未来一旦ChatGPT开始全面赋能,用户和机器人聊得很开心,但最后却不买你的产品,或者根本没有办法实现商品交易功能,这就是捡了芝麻,丢了西瓜。如果要说门槛,那么企业基本的数字基建必须是跑通的,必须是完整的。 拷问6:AIGC对品牌私域最直接的影响有哪些? https://maimai.cn/article/detail?fid=1775113431&efid=u7Vd-RNP5aY_KjFk0OswCg
19.ChatGPT火爆出圈,“虚拟数字人”能搭上这趟快车吗?赋能虚拟数字人 虚拟数字人(Virtual Digital Assistant)是一种使用人工智能技术开发,通过计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等技术手段,将人物形象、语音生成、动画生成、音视频合成显示、交互这几个模块进行融合后实现的一种外显的虚拟人形象。 https://www.elecfans.com/d/2026537.html