关于AI你最关心什么?技术专家团亲自答(含往期真人纯享版)

2022年底,OpenAI的大模型ChatGPT正式问世,并在2023年引领全球“大模型热。

2024年是端侧智能的爆发元年吗?模型训练和推理又有什么新的技术进展?

为了帮助大家更好了解AI技术发展动态,为用户提供解决实际问题的思路和方法,阿里云特别推出的首档AI领域问答栏目——【AI问爱答】。每期栏目都由阿里云的AI专家答疑团针对网友提出的各类关于AI的问题做解答,任何关于AI产品使用,大模型应用落地等问题,均可以向他们提问。

截至目前已有5位AI专家做客栏目,累计回答了40个问题,涵盖了从大模型商业化落地挑战,端侧智能的现状,模型训练和模型推理的技术路线,快速上手智能编码等多个方面。

接下来,如果你对开源大模型的最新技术进展、视频生成上的具体问题、数字人技术落地、GPU算力等有问题,我们邀请了…

周文猛——阿里巴巴通义实验室研发总监

ModelScope魔搭开源社区和DashScope灵积模型服务平台模型技术负责人,意在打造简单易用的sdk和api接口,方便开发者进行大模型定制部署、应用搭建。曾负责阿里云机器学习平台PAI上算法框架,支持搜索推荐等核心业务,服务多个BU核心业务,在多个比赛榜单取得前三的成绩,在EMNLP、CVPR、IJCAI多篇论文。

更有神秘嘉宾届时揭晓,您有什么问题希望专家团解答?欢迎来提问!

如何参与?

我们将通过邮件联系提问者送出好礼,同时被栏目组选中回答的问题提出者还将获得额外惊喜!

前期内容节选

Q:传统企业和新入局的企业,如何选择大模型赛道?

A:怎么样在一个水涨船高的阶段,做好那艘船,而不是要做好那座山,因为水涨高了之后可能山会被淹没,所以怎么样用好模型可能是最重要的事情,这是企业和新入局的玩家要重点思考的。一是做好业务的梳理,做好知识的封装,用Agent去体现。还需要清楚业务的应用场景到底是实时链路还是离线链路,这会影响到模型的选择和Agent的搭建。

Q:如何保持AIGC内容的原创性、个性化,避免千篇一律的产出

Q:AI生成视频有哪些技术难点呢?有哪些商业化可能性?

A:视频生成我觉得可以分成两种,一种是类似于文生视频,基于语义去生成视频,还有一种是对视频内容做编辑。我们观察到今天对于视频编辑的需求特别大,尤其是以人的身体面部表情的编辑为最主要的一种尝试方向。基于人的肢体的动作驱动一张图片,还有一个是针对人脸,驱动他的整个面部表情,甚至包括上半身的手势,我觉得第二条技术路线对于视频编辑控制方向有非常大的商业化可能性。所以这块我们会做的多一些,我相信可以跟文生视频结合在一起。

Q:目前大模型落地到端上最大的挑战是哪些?

A:目前端上的模型落地,面临的一个非常大的挑战点是在于面临着像性能,资源、功耗多方面的一个平衡。不管手机也好,PC也好,甚至车也好,算力受限,内存有限,对精度的要求不比云上要低,场景也复杂,选用大尺寸的模型,内存和推理速度没办法满足,选用小尺寸模型,整个效果会变得比较差。现在所谓的小尺寸模型,本质上来讲还是一个很大的一个模型。它的资源占用、推理性能都面临非常大的瓶颈。

Q:目前模型推理,最新的技术方向是怎样的,有哪些突破点?

Q:模型训练需要昂贵的成本支撑,那么在训练或微调过程中,如何提升训练性能,以节约训练成本?

token/s具体到硬件上,其实就是对硬件资源的有效的利用率,也就是我们常说的指标MFU。计算量确定了,怎么样去做这个优化呢?要根据各个硬件单元的吞吐来理论预估模型训练的瓶颈,以及性能优化的空间,具体可以从计算、通信和显存三个大方向进行入手。

在显存上,要根据模型的结构以及它中间的activation大小,来理论预估这个模型所占用的显存大小,并且要结合所使用的分布式策略、offloading策略以及其他显存优化策略。

有了这些瓶颈点定位、优化空间,以及评估数据后,我们就可以从具体的瓶颈点入手。

Q:AI程序员是什么样的产品形态?跟通义灵码的关系是什么?

A:人机交互的模式分为三个阶段,第一个阶段是人机配合,以人为主,机器为辅,我们把它叫做Copilot模式;接下来会进入到Agent模式,由单个Agent自主完成一个小任务,比如写一个测试用例;最后是多Agent协同模式,可以完成非常复杂的一件事。

AI程序员是基于多Agent协同架构下产生的产品,人机交互模式已经发生了质变,变成了机器为主,人为辅。人在这个过程中更多是提出需求,及时对AI程序的运行做纠偏,以及去校验它最终生成的结果,编程的生产力会有大幅度的提升,发生质变。通义灵码更多是第一个阶段,就是Copilot的模式,真正到了Multi-Agent或者机器为主时,产品形态一定是AI程序员。

Q:市面上智能编码工具非常多,开发者选择时有什么标准吗?

A:从我们观察来看,程序员首先对代码助手IDE插件的第一要求就是准,采纳率一定得高;第二个是代码生成要足够的快,不能太卡顿;三是能否跟企业内部的规范或个人开发习惯进行结合;最后还需考虑安全性。

Q:代码的RAG知识库是什么功能?应该怎么管理才能提升代码编写的准确性?

A:检索增强是我们最近针对企业版推出的重要功能。这里面包括两种,第一个是代码补全的RAG,主要是在代码续写时进行辅助,它可以模仿我们原来写好的业务逻辑去生成,或者说按照原来的自研组件库或者资源框架的方式去进行服务生成,或者按照原来的API调用范式去生成。

在编写代码的时候,它自动去企业的知识库召回了相似的代码。第二种是企业的知识问答,可以将企业里面研发文档,或者API定义的文档上传,只需要通过#teamdocs,就可以让大模型去针对问题去实时到企业知识库去进行查找,联合生成。

Q:如何通过智能编码助手辅助开发人员进行代码走读,快速了解代码?

A:大量开发者是通过代码解释功能,快速了解整个代码的含义。除了简单的代码解释,圈选代码就可以完成。另外还可以通过@workspace功能,让大模型对整个库进行走读,然后给出相应的解释,我们可以让它定位到某个文件,甚至某个类或者是某个目录,让它去进行走读,来帮助我们快速了解。

THE END
1.谷歌人工智能算法RankBrain运行原理解析51CTO博客AI与机器学习有什么不同呢?就RankBrain而言,给我们的感觉好像是它们是等同的。你可能会听到它们交替使用,或是听到使用机器学习来描述人工智能方法的使用。 那么RankBrain是谷歌Ranks搜索结果的新方式吗? 不,RankBrain只是谷歌众多搜索算法的一部分,它是一套计算机程序,能把知识库中上十亿个页面进行排序,然后找到与特定查https://blog.51cto.com/shanglianlm/5554463
2.《her》:AI时代,那自以为是又无处安放的爱情…(她)影评这是一部面向未来的科幻电影,说是科幻,但并不遥远,它所描述的情节,或许仅仅就是五年后、三年后就会发生的事,甚至就在你跟Siri对话的此时此刻,你已经在实践着影片中描述的未来;这是一个发生在人工智能AI和智人(本文全篇以“智人”表示人类物种)之间的爱情故事,这样的爱情看似荒唐,却又那么真实,真实到当影片结束时https://movie.douban.com/review/9202843
3.谷歌研究员称AI已具备人格,这是真的吗?—新闻—科学网虽然国外人工智能业界对此事已有结论,AI具备人格真的是想多了,就是比较会聊而已,但是这并没有浇灭大家对此事的激烈议论。按照人工智能的飞速发展,AI未来会不会真的具备人类意识,那又将是一个怎样的世界呢?科幻电影情节成真的“戏码”,是“毛骨悚然”还是“刺激带感”? https://news.sciencenet.cn/htmlnews/2022/6/481009.shtm
4.人工智能是如何架起无人驾驶车的技术桥梁的?近日,在美国IHS公司发布的关于「人工智能」的调研报告中,分析师预期到2025年,车内AI人工智能系统的数量将从2015年的700万台增加至1亿2200万台;同时基于AI技术打造的相关系统(绝大部分以语音识别功能为主)的新车配售率会从2015年的8%增加至2025年的109%;此外,IHS指出,未来很多汽车上都会安装具有不同功用的人工智http://www.cheyun.com/content/11726
5.我玩《王者荣耀》斗地主打麻将,但我是正经搞AI的北大教授游戏AI,是真的人工智能 一位导师下载好了《王者荣耀》,还鼓励她的博士生们去玩一玩。 真的很难想象,这种“名场面”就真真儿的发生在了国内顶级学府——北京大学。 这位导师叫李文新,是北大信息科学技术学院的一名教授。 李文新教授 但她和学生们打《王者荣耀》可是真的正儿八经的,因为李文新的研究方向,正https://36kr.com/p/1421966094286469
6.想知道你的工作离被AI取代还有多远,这几篇文章可以给我们一些启示AI是一个大趋势,或许总有一天我们会被全部淘汰,但我们虽然无法逆势而行,至少可以改变我们自己,让我们被历史的长河冲走前能多站那么一会。 雷峰网原创文章,未经授权禁止转载。详情见转载须知。 今年8月,雷锋网将在深圳举办一场盛况空前有全球影响力的人工智能与机器人创新大会。届时雷锋网(搜索“雷锋网”公众号关注)https://www.leiphone.com/news/201606/kug3dcHcOw0bRDGK.html
7.AI成为教学工具的未来,真的已经来了吗?当人工智能、物联网、大数据处理、算法、开源硬件项目设计等科技课程正式被划入新课标,AI真的会成为一门普识通用的学科吗?在 PingWest 品玩 HAY!18 “未来教育猜想局”的活动现场,优必选教育产品副总经理、美国纽约州立大学社会学博士董进认为:未来,AI 才不是一门学科,而是一种教学工具。https://www.pingwest.com/a/177719
8.人工智能是什么,你真的了解人工智能吗?人工智能的应用领域 今天,AI能力更倾向于应用到人类或其他动物智能的某一或某几方面,并用自动化替代,有时候也用于对其进行模拟。这些在高性能计算机调度之下的智能行为远远比人类的行为更为强大。 1. 路径查找和路径规划 在最小代价路径规划和路径查找系统中,可以使用专门的技术,它们中有一些非常灵巧微妙,另一些则仅https://mse.xauat.edu.cn/info/1038/2191.htm
9.百度发布“秒哒”,AI真的可以取代程序员吗?“秒哒”具备无码编程、多智能体协作和多工具调用三大特性。 “秒哒”由大模型和智能体组成,主要面向非程序员群体,用于降低普通用户开发智能体的门槛。 因为具体产品还没有正式公布,所以无法体验其具体能力如何。但是大家可以切实感受到AI的发展。 “秒哒”的核心特点:“不用写代码,就能实现任意想法”,这句话给广大https://blog.csdn.net/u011942813/article/details/143737146
10.ai人工智能仿生系统ai3.0人工智能仿生系统?30ai人工智能系统是真的。 因为30ai人工智能系统是搭载了最先进的人工智能系统,是可以迅速的对外界做出反应的,所以是真的。 十、田螺ai人工智能剪辑系统是真的吗? 田螺AI人工智能剪辑系统是田螺公司推出的一款面向影视、媒体、广告等行业的智能化剪辑系统。该系统基于人工智能技术,具有一定的自动化和智能化水平,可以https://tool.a5.cn/article/show/71373.html
11.发展如火如荼人工智能会比人类聪明吗?新闻频道日前,在深圳举办的CITE2017人工智能产业发展高峰论坛上,工业和信息化部副部长刘利华表示,我国目前在人工智能(AI)技术研究方面已经走在世界前列,该领域的科研工作者和企业家“立于全球潮头”,未来我国在这个领域有非常宝贵的机遇和前景。 最近,人工智能话题热度不减,IT领域甚至言必称之。目前人工智能发展到哪个阶段,它https://news.cctv.com/2017/04/14/ARTIUZ41B5DM5BrbO6BQTWCv170414.shtml