李开复发布零一万物首款340亿参数大模型Yi,号称全球最强支持开源|钛媒体焦点

创新工场董事长兼CEO、零一万物CEO李开复博士

钛媒体App获悉,11月5日上午,知名投资人、创新工场董事长兼CEO李开复博士带队创办AI2.0大模型公司“零一万物”(01.AI),正式发布首款研发的最强开源人工智能(AI)大模型系列,名为“Yi”。

此次Yi系列基础模型的首个公开版本包括两款:Yi-6B(数据参数量为60亿)、Yi-34B(340亿),均是双语(英文/中文)、支持开源。其中,Yi-34B模型在多项评测基准中全球领跑,基于超强Infra下模型训练成本实测下降40%,模拟千亿规模训练成本可下降多达50%,并以更小模型尺寸的基准结果超过LLaMA2-34B/70B、Falcon-180B等大尺寸开源模型,以及百川智能(王小川创立)的Baichuan2-13B。

创新工场董事长兼CEO、零一万物CEO李开复表示,“零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为‘World'sNo.1’的初衷和决心。我们组成了一支有潜力对标OpenAI、Google等一线大厂的团队,经历了近半年的厚积薄发,以稳定的节奏和全球齐平的研究工程能力,交出了第一张极具全球竞争力的耀眼成绩单。Yi-34B可以说不负众望,一鸣惊人。”

“随着团队到位,今年6、7月份开始写第一行代码,短短四个月做了非常自豪的产品。我们是‘不鸣则已,一鸣惊人’。所以‘一鸣惊人’之后,如果我们过半年甚至过一年回头看,今天对我们来说只是刚刚开始,我们还会不断的去开发、推动、宣布更多令人惊艳的成果。”李开复表示。

钛媒体App还了解到,后续,Yi系列也将推出专长代码和数学的训练模型。此外,目前零一万物已惊启动100B(1000亿)参数的训练,有望近几个月内发布,未来还有望推出基于AI2.0的超级应用等技术产品。

据悉,早在今年3月19日,李开复发文宣布入局AI大模型领域,亲自筹办新ProjectAI2.0公司,称是一个致力于打造AI2.0全新平台与AI-first生产力应用的全球化公司。“这是一家由技术愿景驱动、拥有卓越中国工程底蕴的创新企业,在全球范围号召世界级人才加入。”他表示。

随后在7月初,李开复创办;额最新AI大模型创业公司“零一万物”,同时这也是创新工场“塔尖孵化”的第7家公司,总部位于北京,零一万物由李开复博士亲自挂帅、任CEO。该公司主要围绕精进模型、预训练框架技术等七个方向进行研究,致力打造全新的AI2.0,理念就是AI-first,驱动力是技术愿景,技术专家拥有多家中外科技大厂、博士学位等背景。

李开复当时表示,零一即01,代表的是数字世界,从零到一,乃至宇宙万物,寓意“零一智能,万物赋能”的雄心,并称这是李开复“撸起袖子”亲自带队,“塔尖孵化”了一家AI2.0公司,历经了三个月的筹办期。零一万物称,其认为AI应当以人为本,Human(人类)+AI将合作创造巨大的经济价值及社会价值。

此前在2023年中关村论坛上,李开复就对钛媒体App等表示,以GPT-4等大模型为代表的生成式AI热度在全球蔓延,意味着AI2.0时代已经到来,它将带来比移动互联网时代大十倍的机会,穿透各行各业极大地提振生产力。“我们预测,全新的AI2.0平台将能有效帮助提升人类生产力,创造巨大的经济价值及社会价值。”

“大模型的技术门槛很高,非常需要整合一个兼具科研能力和开发实力的高效团队,制定贯彻公司的技术和产品战略,从上到下一致执行。”李开复认为,零一万物将专注打造AI2.0时代的平台及生产力应用生态,创新工场愿景是把零一万物打造为一家向全球展现其研发及工程能力的世界级公司。

团队方面,此次零一万物公布了零一万物技术副总裁及AIInfra负责人戴宗宏,零一万物技术副总裁及Pretrained负责人黄文灏两位专家。其中,公开信息显示,戴宗宏曾任职于阿里、华为,担任华为云AI领域CTO;黄文灏则毕业于北京大学博士学位,曾在微软研究院担任高级研究员,并曾任职于北京智源AI研究院。

据介绍,此次发布的60亿、340亿参数量的Yi-6B、Yi-34B,两者都以4K序列长度进行训练,并且在推理期间可以扩展到32K(3.2万)量级,且支持开源,模型对学术研究完全开放,同步开放免费商用申请。

同时,开源Yi系列大型模型还有两个主要特点:一用更少的参数击败了具有上百亿参数的模型;二支持全球最长的上下文窗口,可达40万字符。

超长上下文窗口是体现大模型实力的一个重要维度,拥有更长的上下文窗口则能处理更丰富的知识库信息,生成更连贯、准确的文本,也能支持大模型更好处理文档摘要/问答等任务。要知道,目前大模型的诸多垂直行业应用中(如金融、法律、财务等),文档处理能力是刚需。如GPT-4可支持32K、约2.5万汉字,Claude2可支持100K、约20万字。

而Yi-34B还将大模型上下文窗口长度刷新到了200K,可处理约40万汉字超长文本输入。这相当于能一次处理两本《三体》小说、理解超过1000页的PDF文档等场景。所以,零一万物不仅刷新了业界纪录,同时也成为首家将超长上下文窗口在开源社区开放的大模型公司。

在HuggingFace开放单预训练模型排名中,Yi-34B以70.72分的成绩全球排名第一,超越了参数量是其两倍的LLaMA-70B和五倍的Falcon-180B。它不仅以较小的参数量登顶榜单,而且实现了跨数量级的逆袭,用百亿级别的参数量击败了千亿级别的大模型。特别是在MMLU(大规模多任务语言理解)和TruthfulQA(真实性基准测试)两个指标上,Yi-34B都大幅领先于其他大模型。

目前,Yi系列模型已在HuggingFace、ModelScope、GitHub三大全球开源社区平台正式上线,同时开放商用申请,给开发者在使用LLM的过程中提供更多、更优质的选择。

而Yi-6B、Yi-34B的主要区分点在于,Yi-6B适合个人及研究用途,Yi-34B已经具备大模型涌现能力,适合发挥于多元场景,满足开源社区的刚性需求。

在交流中,谈及算力,李开复表示,零一万物很早就意识到了GPU(图形处理器)芯片的重要性,已经租赁了大量算力,而且与国内很多云厂商、GPU云等方向上合作。

李开复曾公开表示,以基座大模型为突破的AI2.0时代,将掀起技术、平台到应用多个层面的革命。如同Windows带动了PC普及,Android催生了移动互联网的生态,AI2.0将诞生比移动互联网大十倍的平台机会,将把既有的软件、使用界面和应用重写一次,也将诞生新一批AI-first的应用,并催生由AI主导的商业模式。

李开复还在今天透露,在完成Yi-34B预训练的同时,目前,零一万物已经启动下一个千亿参数模型的训练。

“零一万物的数据处理管线、算法研究、实验平台、GPU资源和AIInfra都已经准备好,我们的动作会越来越快”。李开复表示,零一万物希望有更多的开发者使用Yi系列模型,打造自己场景中的“ChatGPT”,引领下一代前沿创新和商业模型,探索走向通用AI时代。

(作者|林志佳)

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

THE END
1.在线八字易经宝宝取名源码带源码数据(网页+APP+小程序)起名源码八字宝宝起名源码是指用于开发能够根据生辰八字为宝宝起名的网站或应用程序的源代码。这种源码通常集成了八字命理学、大数据分析、人工智能算法以及用户友好的界面设计,旨在为用户提供个性化的起名服务。文章手把手带大家开发一款基于PHP的周易八字宝宝起名源码,这是一个复杂且涉及多个领域知识的任务。 https://blog.csdn.net/rongtinghua/article/details/144259476
2.春哥技术团队倾力打造:春哥起名算命塔罗星座八字测算大全系统源码在科技与传统文化交融的创新浪潮中,春哥技术团队凭借其深厚的技术底蕴和对中华传统命理文化的深度理解,倾力打造出一款集起名、算命、塔罗、星座、八字测算于一体的全方位命理服务系统——“春哥起名算命塔罗星座八字测算大全系统”。近日,该系统源码已由春哥技术团队重磅发布,标志着这一融合现代科技与古老智慧的独特平台正https://web.2205buxiugangban.com/zixun/2829.html
3.开发一款基于PHP的周易八字宝宝起名源码八字宝宝起名源码是指用于开发能够根据生辰八字为宝宝起名的网站或应用程序的源代码。这种源码通常集成了八字命理学、大数据分析、人工智能算法以及用户友好的界面设计,旨在为用户提供个性化的起名服务。文章手把手带大家开发一款基于PHP的周易八字宝宝起名源码,这是一个复杂且涉及多个领域知识的任务。 https://blog.51cto.com/u_17182741/12789781
4.开源Ideal库Excel帮助类,ExcelHelper实现(五)而根据表格填充工作簿Sheet实现也非常简单,只需遍历表格中每个单元格,把其值填充至对应工作簿Sheet中相同的位置即可,当然其中表格列名是否要作为数据,需要单独处理,具体代码如下: //根据表格填充工作簿SheetprivatestaticvoidFillSheetByDataTable(IWorkbookworkbook,DataTabledataTable,boolisColumnNameAsData){varsheet=strinhttps://zhuanlan.zhihu.com/p/11008183543
5.免费生产八字算命软件零代码企业数字化知识站免费生产八字算命软件可以通过开源代码、在线生成工具、定制开发、社区支持等方式获得。开源代码是一个特别值得深入探讨的方式。开源代码不仅可以节省开发成本,还可以通过社区的力量不断改进和优化软件。许多编程爱好者和专业开发人员会在GitHub等平台上分享他们的代码,这些代码可以自由下载和修改,以适应个人或商业需求。通过https://www.jiandaoyun.com/blog/article/387274/
6.运势算命小程序源码v1.2.0完整版下载地址完整前端+后端全开源获取小程序源码运势运程小程序微信小程序游戏源码微信小程序源码1000套微信小程序源码大全点餐小程序源码安卓小程序源代码小程序游戏源码小程序免费源码微信小程序模板源码免费商城小程序源码小程序源码怎么用拼团小程序源码微信小程序源代码大全小程序模版源码下载小程序模板源码微信小程序源码免费外卖小程序源码算命小程序算命https://86sucai.cgtblog.com/32317.html
7.程序源代码可运行python开源智能音箱项目系统?wukong-robot 是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,还可能是首个支持脑机交互的开源智能音箱项。 01 — 【基础环境】 02 — 【启动说明】 启动说明: 代码语言:javascript 复制 docker pull wzpan/wukong-robot:latest 03 https://cloud.tencent.com/developer/article/1653526
8.老黄历算命接口实现及代码示例sesen老黄历算命接口实现及代码示例 老黄历算命接口提供老黄历查询,黄历每日吉凶宜忌查询。 接口名称:老黄历算命接口 接口平台:聚合数据(http://www.juhe.cn) 接口地址:http://v.juhe.cn/laohuangli/d 支持格式:JSON/XML 请求方式:HTTP GET/POST 请求示例:http://v.juhe.cn/laohuangli/d?date=2014-09-11&key=您https://www.cnblogs.com/jimmiy/p/14611941.html
9.android宝宝起名源码是用来实现算取名能的代码。算命是一种古老的传统文化活动,通过一些方法和工具,预测人们的命运、财运、婚姻、健康等方面的情况。宝宝起名源码可以通过一些算法和模型,根据输入的信息和条件,计算出相应的预测结果。这个源码可以用来开发算命的应用程序或者网站,让用户可以输入自己的信息,然后获取相应的算命结果。https://segmentfault.com/a/1190000044671890
10.稀疏尺代码稀疏尺代码 #include <bits/stdc++.h> using namespace std; #define L 22 int points[L+2]; void ju(){ int lens[L+2] = {}; for(int i=1; i<L; i++){ if(points[i]){ lens[i] = true; lens[L-i] = true; for(int j=1; j<i; j++){https://www.bilibili.com/read/cv40046639
11.ISO31662:CN中国地区代码数据库文件vc源代码合集0951.rarvc源代码合集0951.rar 2012-06-12 11:54 80,235 (MSDN oct 2001)VC6 适用的最后一个版本[ISO].rar 2012-06-13 09:53 0 1.txt 2012-06-12 11:56 17,755 2011年北航计算机考研复试上机题.rar 2012-06-12 07:14 11,172,336 91算命软件.zip 2012-06-12 11:53 334,303 advhttps://www.iteye.com/resource/yjgithub-13723053
12.BulkCrapUninstallerv5.4PC软件卸载神器分享一款PC端,非常厉害的卸载神器BCUninstaller,最重要的是,大佬的代码已在GitHub开源,有兴趣可以看看点击源码去看看项目详情。下载链接在文章末尾。 主要功能: 显示安装路径、日期、大小等一些详细信息 静默卸载,支持清理注册表,大部分软件可以一键删除,非常全面的卸载一些比较流氓的软件 http://www.sh-youth.cn/news/2070.html
13.不信命的年轻人,却靠占卜求未来就是这项占卜服务,解牌最少要收18.8元,获取完整解析则需支付38.8元,即便按照18.8元的*价格计算,该服务也已经收获了2000多万元的流水。而其背后不过是运用一串串代码设计出的多份固定内容,由不同答案排列组合生成的“人生解答”,毫无意义可言。 最重要的是,算命占卜通常要提供一些个人信息,包括但不限于姓名、出生https://news.pedaily.cn/202311/525016.shtml
14.不信命的年轻人,却靠占卜求未来:无处不在的“玄学”,背后全是生意加上互联网算命具有即时性、快捷性等优势,如果说过去大师看相还需要现场观摩交流,现在屏幕另一端的大师,只要看一张照片,就能把一个人的一生给看完了。 何况,年轻人的选择也不局限于生辰八字,还拓展到本命星盘、塔罗占卜、周公解梦、紫微斗数等诸多项目。大到社会事件,小到日常服色都可以请“大师”测算,可以说是无https://view.inews.qq.com/k/20231109A02T3300?no-redirect=1&web_channel=wap&openApp=false
15.更新版PHP神算网八字算命星座解梦周易占卜程序源码/PC+H5移动端3、修复了首页及算命、属相、星座404页面; 4、匹配了手机版H5模板; 5、修复了算命模块年份设置错误导致的死循环问题; 6、进行了PC和H5移动端整站适配; 7、删除了部分冗长代码。 测试环境:Linux + PHP 5.6 + Nginx 1.8 + MySQL 5.6 + 伪静态。 https://blog.yyzq.team/post/299457.html
16.让GPT给自己算一卦!(开源+免费)发现创造link (且玩且珍惜,没多少额度了):https://liu-yao.streamlit.app 源代码:https://github.com/Realhttps://www.chongbuluo.com/thread-17566-1-1.html
17.苹果app官电影新人不仅需要创作指导、拍摄支持,还需要平台来展示作品,被更多业界人士和观众看到。6年间,金鸡国产电影展已推选展映近百部优秀电影新作,每年均有不少电影新人的作品入选,为电影新人提供展示的舞台。而金鸡华语影展和金鸡电影市场则实现了内地与港澳台地区电影人的深度沟通,同时推动了更多国际合作,为包括电影新人在内http://wap.910ip.com/404879.html
18.算命整站源码下载算命网站程序下载YzmCMS生辰八字算命运势测算门户网站 美观大气开源在线精准算命平台 基于YzmCMS开发的一款生辰八字算命运势测算门户网站,是一款提供生辰八字算命,八字算命婚姻,免费姓名测试,宝宝起名打分,星座运势,周易算命,在线抽签等数十项测算的在线精准算命查运势网。 信息/分类/资讯 https://www.sucainiu.com/tag/3256.html