国内推出全新语音对话大模型:李开复领衔,零一万物参与,支持中英双语和多模态,开源并可商用人工智能

首个中英双语的语音对话开源大模型来了!

这几天,一篇关于语音-文本多模态大模型的论文出现在arXiv上,署名公司中出现了李开复旗下大模型公司01.ai——零一万物的名字。

这篇论文介绍了一个名为LLaSM的中英双语可商用对话模型。该模型不仅支持录音和文本输入,而且能够实现“混合双打”的功能

研究指出,“语音聊天”是AI与人之间更方便自然的交互方式,不仅仅是通过文本输入

用上大模型,有网友已经在想象“躺着说话就能写代码”的场景了。

这项研究是由LinkSoul.AI、北京大学和零一万物共同完成的,目前已经开源,并且可以直接在抱抱脸中进行试玩

让我们一起来看看它的效果如何吧

据研究人员表示,LLaSM是第一个支持中英文双语语音-文本多模态对话的开源可商用对话模型。

那么,就来看看它的语音文本输入和中英双语能力如何。

首先,让我们进行一次中英文化碰撞,用英文来评价李白:

还可以,正确地说出了李白的朝代。如果看不懂英文,让它直接翻译成中文也没问题:

在接下来的练习中,让我们尝试一下中英混合提问,将一个“炸食物”一词加入到中文句子中。模型的输出效果也相当不错:

让我们再试探一下模型,让它进行一些评价,看看李白和杜甫哪个更厉害

当然,不止是电脑,手机也能玩。

我们试着用语音输入“给我推荐一个菜谱吧”:

可以看到模型准确地输出了一个“茄子芝士”的菜谱,就是不知道好不好吃。

不过,我们在尝试的时候也发现,这个模型有时候会出bug。

例如有时候它并不能很好地“听懂人话”。

要求输出中英混合的内容,它会假装看不懂并输出英文:

当中英混合询问想听“TaylorSwift的Red”时,模型出现了严重的错误,不断重复输出同一句话,甚至无法停止……

总体来看,当遇到中英混合的提问或要求时,模型输出能力还是不太行。

不过分开的话,它的中英文表述能力还是不错的。

那么,这样的模型究竟是怎么实现的呢?

从试玩来看,LLaSM主要有两个特点:一个是支持中英输入,另一个是语音文本双输入。

要做到这两点,分别需要在架构和训练数据上做一些调整。

架构上,LLaSM将当前的语音识别模型和大语言模型做了个整合。

LLaSM由三个部分构成,分别包括自动语音识别模型Whisper、模态适配器和大模型LLaMA。

在这个过程中,Whisper负责接收原始语音输入并输出语音特征的向量表示。模态适配器的作用是对齐语音和文本嵌入。而LLaMA则负责理解语音和文本输入的指令,并生成回复

模型的训练分为两个阶段。第一阶段是训练模态适配器,此时编码器和大模型被冻结,让模型学习语音和文本的对齐。第二阶段是冻结编码器,训练模态适配器和大模型,以提升模型的多模态对话能力

训练数据上,研究人员整理出了一个包含19.9万个对话和50.8万个语音-文本样本的数据集LLaSM-Audio-Instructions。

在50.8万个语音-文本样本中,有8万个是中文语音样本,而42.8万个是英文语音样本

研究人员主要基于WizardLM、ShareGPT和GPT-4-LLM等数据集,通过文本转语音技术,给这些数据集生成语音包,同时过滤掉无效对话。

这也是目前最大的中英文语音文本指令遵循数据集,不过目前还在整理中,据研究人员表示,整理完后会进行开源。

然而,目前还没有对比该论文与其他语音模型或文本模型的输出效果

这篇论文的作者来自LinkSoul.AI、北京大学和零一万物

共同一作YuShu和SiweiDong均来自LinkSoul.AI,此前曾经在北京智源人工智能研究院工作。

LinkSoul.AI是一家AI初创公司,之前推出过首个开源Llama2的中文语言大模型。

作为李开复旗下的大模型公司,零一万物也在这次研究中有所贡献。作者WenhaoHuang的HuggingFace主页显示,他毕业于复旦大学。

THE END
1.西餐菜单食谱英文版西餐菜单食谱英文版怎么写图片欢迎来到我们的餐厅,今天我们将为您呈现一道经典的西餐——经典牛排配时蔬,这道菜品将牛排的鲜嫩口感与时蔬的清新味道完美结合,是一道美味又健康的西餐。 Ingredients 1、Beef steak (根据客人需求选择不同厚度和重量) 2、POtatoes (根据人数选择数量) http://coffee.cn/xican/post/345037.html
2.美食推荐:烧汁牛仔骨海鲜沙拉配牛油果蟹黄豆腐制作方法洋葱做法: 1、将带子、蛤蜊、扇贝处理干净,焯水后捞出改刀备用。 2、在热水中加入几片日本的昆布烫熟,再拌入熟透的牛油果、柠檬刨成的丝、芝麻菜、月桂、蒜头、薄荷叶、泰国小辣椒和欧芹碎拌匀。 3、撒上橄榄油、盐拌匀即可。 蟹黄豆腐 原料: 熟拆活水大闸蟹蟹黄10克,内酯豆腐25克,咸鸭蛋黄2个,玉米淀粉、盐、https://www.163.com/dy/article/JIJ3VI1J0553TKGX.html
3.(完整)英文食谱中英双语.doc完整英文食谱 中英双语完整英文食谱 中英双语完整英文食谱 中英双语英文食谱:红烧排骨的做法Braised Spare Ribs in Brown Sauce 中英双语How to make homestyle Chinese pork rihttps://www.renrendoc.com/paper/298148119.html
4.20210530梅兰芳戏曲史料图画集书籍装帧特点为四眼线装,上下两册,函盒装。这是一套令人爱不释手的书,无论内容还是形式。全书整体工细流利,墨彩相映,蕴静委婉,古简典雅。函盒为玄色丝织压印戏曲人物脸谱,上下朱印方章点缀,函背为中国红,书皮采用米色略带光泽的纸,上印戏曲人物图,一派雅淡简逸之气。版式编排具中国典籍神韵,图文外绕线框,纸质润和,主辅https://blog.csdn.net/qq_39027095/article/details/117401023
5.中英文菜单怎么翻译?中英文菜单的翻译方法取决于具体的餐厅和文化背景。以下是一些常见的中英文菜单翻译方法:1. 直接翻译:https://ask.zol.com.cn/x/24976348.html
6.烹饪达人宣言附整只烧鸡食谱双语达人双语阅读英中对照 中英对照 英文在前 中文在前 只看英文 只看中文 Just cook. That is the message of the moment, the act to embrace. Just cook dinner. It is a habit as easy to form as a bad one, and more beneficial by far. 做饭吧。它是当下的潮流,是受欢迎的行为。做晚餐吧。这个好习惯跟坏https://www.kekenet.com/read/201410/336819.shtml
7.公共标识范文12篇(全文)汉英双语标识主要集中在银行、大型医院、商店、邮局和宾馆等服务部门, 小型服务部门和政府部门的英文标识很少;公园、火车站、书店等公共场所室内外缺乏必要的英文导游标识和服务标识。而且这些既有的标识语的英语翻译仍然存在着许多问题, 有些标识语译文不但不能达到交流的目的, 而且将误导外国游客,给他们带来极大的不便https://www.99xueshu.com/w/ikey50317njc.html
8.中嘉美食每周食谱Dec.2MON.周一 早餐Breakfast 紫薯粥 Purple Potato Porridge 锅贴饺 Pot Sticker Dumplings 水煮鸡蛋 Boiled Eggs 戚风蛋糕 Chiffon Cake 营养沙汤 Nutritious Soup 肉沫花卷 Pork Foam Rolls 蒸小山芋/清炒娃娃菜 Steamed Baby Taro Stir-fried Baby Cabbage https://mp.weixin.qq.com/s?__biz=MzA4OTc1ODQ3Mw==&mid=2247569030&idx=1&sn=ccba8c2d1745f92367e3efe958a69382&chksm=901580e0a76209f67888e78b6dd7d7bdf7498cc15fc8f0d7ef6c0bedf6c44c1822c24567e916&scene=27
9.中国饮食的英译(精选十篇)所以,如何更好的把具有中国特色的中华美食介绍给外国友人,并促进中外文化,特别是饮食文化的交流与合作,中餐菜谱的英文翻译的准确与恰当则显得尤为关键。对于翻译工作者来说,将两个不同语言进行有效地沟通与匹配是一个工作的难点亦是工作的中重点。文化的不同是翻译过程中要考虑的重点。中国是一个美食大国,一个“https://www.360wenmi.com/f/cnkey5lb5x76.html
10.2021年英语媒库文选及热词:英汉对照.pdf《参考消息》的中英双语版面,最初宗旨是在报道国际 社会经济文化资讯的同时,为读者拓展当代英语语文知识。 经年积累下来,这一报纸版块在读者中产生了一定程度的影 响,把双语版面内容汇编成书正是回应读者的要求。但由于 《参考消息》的独特性,我们在着手这份编辑工作时,发现 它超出了汇编英语学习资料的预期。 参考消https://m.book118.com/html/2023/1215/6211214013010022.shtm
11.在CRF和CR的处理过程中,施工队是负责相关中英文双语版CR的编制和刷刷题APP(shuashuati.com)是专业的大学生刷题搜题拍题答疑工具,刷刷题提供在CRF和CR的处理过程中,施工队是负责相关中英文双语版CR的编制和发布 、执行、关闭。A.正确B.错误的答案解析,刷刷题为用户提供专业的考试题库练习。一分钟将考试题Word文档/Excel文档/PDF文档转https://www.shuashuati.com/ti/184cc529c0f44e37a8f48793d9061e54.html?fm=bdbf21c4a2531b5d03ac76c914df0ee174
12.关于中英双语版“超级神探夏洛克”的Q&AA:我认为在少年侦探小说的类型化创作中,这套书是上乘之作。比较可贵的是,作者看来还有超越类型化写作的野心,故事越到后面越复杂,人物的层次感增强,破案的难度越来越大,单册的篇幅也更长了。越到后面,对读者的期待也越高吧。 【关于中英文读本的问题(附英文有声书)】https://weibo.com/ttarticle/p/show?id=2309404812114639585730
13.守护舌尖上的安全!龙华34家民办学校为3.3万名学生提供用餐服务龙华中英文实验学校制定《学校领导陪餐制度》,学校领导根据《学校领导陪餐轮值表》,每天与学生共同用餐,做好陪餐记录。学校安排安全主任、后勤主任对食堂饮食安全进行监管。为保障师生的每天摄取均衡营养,集团采购中心结合师生口味,精心设计菜谱,提升膳食的营养品质。 https://static.nfapp.southcn.com/content/201905/07/c2196976.html
14.英国饮食文化论文模板(10篇)如果译为一般的烤肉,译文就未尽菜谱之意。因此,叉烧可译为Roast印iced Filletof Pork , Guangdong Style。又如潮洲烧雁鹅,可译为ChaozhouRoast Goose或Roast Goose,Chaozhou Style。 第三,中国独有的特色食品的英译,音译法是得到普遍认可的。如饺子、粽子、点心、锅贴、测羊肉都可音译为Jiaozi,Zongzi , Dianxin ,https://www.haofabiao.com/haowen/31830.html