ScalingLaw遇瓶颈后下一个突破点在哪?多模态大模型会带来哪些革命性变革?从模型训练到推理部署的全流程技术挑战,都能在2024全球机器学习技术大会得到解答。
作者|《新程序员》编辑部
出品|CSDN(ID:CSDNnews)
大会现场气氛热烈,围绕12大专题深入探讨大模型技术创新、多模态突破、AI基础设施建设等热点议题,共同探索人工智能的发展前沿。同时,「云会员」们也通过线上平台共享这场技术盛宴,为未来大模型技术及应用的创新实践注入了灵感。
ScalingLaw遇瓶颈、AI幻觉仍未解决,全球机器学习技术大会破解大模型迷思!
从算法到应用,从技术突破到场景落地,大模型在这一年中取得了哪些具有里程碑意义的进展?11月14日上午的主会场上,CSDN高级副总裁、Boolan首席技术专家李建忠,新加坡工程院院士、IEEEFellow、昆仑万维荣誉顾问颜水成,传神语联创始人何恩培,新浪微博首席科学家、新技术研发负责人张俊林等重量级嘉宾,共同探讨了当前大模型技术面临的关键挑战与未来方向。
与此同时,产业界也面临着严峻的现实挑战:大模型的“幻觉”问题始终悬而未决,如何确保推理的可靠性?在实际应用中,如何平衡通用能力与专业深度?欢迎回顾首日视频,寻找这些问题的答案:
基础模型的根基
基于双网络架构的数推分离大模型探索与实践
OpenAIo1技术原理解析
圆桌论坛:大模型未来之道
在本次主会压轴的圆桌对话环节中,CSDN高级副总裁李建忠、Codeplay技术副总裁MichaelWong、传神语联副总裁蔺伟、新浪微博首席科学家和新技术研发负责人张俊林在CSDN&《新程序员》执行总编唐小引的主持下,围绕“大模型的未来之道”展开深入探讨,共同探索大模型技术的发展方向与挑战。
详细报道:
12大技术专题,深入大模型技术及应用实践!
本次大会汇聚了来自学术界和工业界的顶尖专家,围绕12大核心技术专题,深入探讨了大模型技术的前沿突破与未来方向。通过深度交流,与会者不仅领略了技术创新的无限可能,更获得了宝贵的实践经验与落地方案。
大语言模型技术演进
“GPT-4以后,大模型还能继续遵循ScalingLaw扩展吗?”这个问题在学术界和工业界引发了广泛讨论。从预训练模式的改进到架构设计的突破,从通用能力的提升到领域知识的深度融合,新的技术路径正在展现出令人期待的前景。本专题汇聚了来自百川智能、智源研究院、中国人民大学、中国石油大学、RWKV元始智能、北京交通大学等机构的顶尖专家,深入探讨了从理论突破到工程实践的全链路技术方案,为整个行业的发展提供了新的思路和方向。
Transformer效率优化
InfinityInstruct:合成指令技术的探索
大模型机理分析
大语言模型内涵知识边界的度量与油气行业知识的嵌入
挑战Transformer:RWKV架构的探索与实践
从3D到4D,快速且时空一致的4D内容生成探索
圆桌论坛:大模型系统技术实践
智源基础数据研究组负责人刘广、快手科技快意大模型知识增强研发负责人毛航宇、智谱AICodeGeeX高级算法工程师张少博、Dify首席架构师姜勇在Boolan首席咨询师李沫南的主持下,就大模型系统技术实践展开了深入探讨。
多模态大模型前沿
腾讯混元多模态技术实践
多模态大模型的实践与思考
多模态大模型LMM与细粒度开放世界目标检测
多模态具身智能操作技能学习、交互探索与应用
OPEN-SORA高效低成本视频生成模型
AIAgent
从强化学习(多)智能体到大语言模型(多)智能体
小米在AIAgent上的思考和探索
策略性推理与AI多智能体系统
代码大模型与软件变革
AI研发产品进化论:从AI编码助手到AI程序员
基于CodeGeeX的AICoding实践与探索
豆包MarsCode,智能编程的探索实践
大模型到智能体,软件研发流程变化了什么?
提升代码生成质量:代码大模型实践经验
大模型应用落地实践
“大模型技术已进入深水区,谁能做出杀手级应用?”当这个问题在业界引发热议,一批企业已交出了令人瞩目的答卷。从企业级服务到消费者应用,从研发效能提升到业务流程重构,AI的力量无处不在。本专题汇聚了来自腾讯、360、澜舟科技、小红书、eBay、京东、金山办公、商汤科技等企业的技术专家,他们分别从不同维度展现了大模型的实践之道:在企业服务领域,展示了从数据分析、知识管理到风险控制的全新解决方案;在研发效能方面,深入探讨了如何将大模型能力融入开发流程;在消费互联网领域,展现了从搜索引擎到生产力工具的突破性实践。
大语言模型在大数据研效场景中的智能化探索与实践
文档理解及知识图谱增强大模型应用实践
构建企业高价值场景的AI应用:RAG、数值计算与推理的技术实践
大模型在小红书搜索的应用
LLM在eBay风控RCA中的应用实践
大模型应用落地的产品方案及最佳实践
WPSAI的技术探索与办公自动化
有用到好用:AI生产力工具如何放大AI能力
圆桌论坛:大模型应用创新实践
360人工智能研究院知识图谱及文档理解算法方向负责人刘焕勇、通义实验室高级搜索算法专家丁瑞雪、中国石油大学(北京)副教授和人工智能学院计算机系系主任吕仲琪在AthenalabsCTO王兴明的主持下,深入探讨了大模型应用创新实践。
大模型应用框架与工具
从构建一个企业级大模型应用,到实现一个可用的智能助手,我们究竟需要什么?这个问题困扰着每一位开发者。一站式开发平台、知识增强系统、分布式训练框架……技术工具的演进正在加速大模型落地的步伐。本专题邀请到了来自腾讯、JinaAI、Dify、通义实验室、蚂蚁集团、Percena、智源研究院等机构的专家,共同探讨从底层框架到上层应用的全栈实践。专家们不仅深入剖析了RAG、知识图谱等关键技术的最新进展,更展示了大规模工程实践中的经验与思考,为开发者构建大模型应用提供了系统性的技术方案。
腾讯Angel大模型一站式平台工程实践
检索增强生成RAG的实践、挑战与发展
RAG关键技术及未来趋势发展
通义百炼RAG应用落地实践与挑战
Graph+AI:立足DB-GPT社区探索GraphRAG未来架构
RAG2.0:记忆驱动的下一代检索增强系统
大模型架构与算力优化
「训练一个大模型动辄需要6500万美元。」这是14日主会上颜水成给出的数字。在模型规模持续增长的今天,算力效率已成为制约发展的瓶颈,训练提速20-50%就可能带来巨大的经济和环境效益。如何突破性能极限?如何实现更高效的部署?来自CodePlay、昇腾、字节跳动、LeptonAI、得物、中科加禾、趋境科技等机构的专家,带来了从量化压缩到分布式推理的系统解决方案,展示了大模型优化的创新路径。
释放AI的潜能:应对变幻莫测的AI硬件和软件
大模型推理加速的优化实践
AIGC模型的量化和稀疏优化
生成式AI落地对架构带来的挑战与机遇
大模型推理性能提升实践
Ktransformers:单卡完成千亿参数大模型推理任务
传神者大会:探索AI与文化传承的跨界融合
本届传神者大会以“大语言模型与文化传承”为主题,邀请到人工智能学会副秘书长余有成、国际智库型咨询公司Nimdzilnsights董事长RenatoBeninatto、CSDN高级副总裁李建忠、中国信通院人工智能研究所安全治理部主任石霖、东方国信公司副总裁兼CTO查礼、传神语联创始人何恩培、中国国际图书贸易集团有限公司副总经理高晓强、北京语言大学副教授韩林涛等重量级嘉宾,共同探讨AI时代跨语言文化传播的创新与变革。
抓住机遇,守正创新:为国际传播技术赋能
大模型新纪元:全球视野下文化交融的璀璨新篇
从生成到行动:大模型趋势与发展
向AI要产能向数据要安全
人工智能算力基础设施协同创新,助力AI原生开发能力构建
以根原创大模型传文化之神韵
从语言服务到国际传播,技术赋能下的价值聚合
人工智能时代如何培养对外文化传播“守门人”
圆桌论坛:《跨语言文化传播通往AI数智时代:硬币的两面性》
开发者云集,现场人头攒动
2024全球机器学习技术大会的成功举办既离不开所有行业专家们的干货输出和AI开发者们的热情参与,同样也离不开合作伙伴们的鼎力相助。特别感谢传神语联、昇腾、快递100、人民邮电出版社异步社区、电子工业出版社博文视点、清华大学出版社、机械工业出版社、人民邮电出版社图灵文化的大力支持。
专家们的真知灼见为开发者们指明了技术创新的方向:大模型技术正在经历从简单的尺度扩展到架构创新的关键转折,多模态能力的提升正在为AI应用开启新的可能,而工程化实践的深度探索则为技术落地提供了切实可行的方案。这些洞察对于每一位致力于AI技术创新的开发者都具有重要的指导意义。
年末盛典:2024全球C++及系统软件技术大会
至此,2024全球机器学习技术大会圆满落幕。随着大模型技术不断突破、算力需求持续攀升,底层系统软件的支撑作用也愈发重要。为了进一步探讨现代系统软件的创新路径,2024全球C++及系统软件技术大会将于12月6-7日在上海隆重召开。C++之父、ACM和IEEE院士BjarneStroustrup等重量级嘉宾将发表演讲,会上更将围绕现代C++最佳实践、AI算力优化、高性能计算等九大主题展开深入探讨。从AI应用到底层技术,从机器学习到系统软件,CSDN正带领开发者们在技术创新的道路上不断前行。诚挚邀请各位开发者莅临现场,与全球顶级专家共同探讨技术革新,谱写软件技术发展新篇章。