阿里版ChatGPT「通义千问」体验实录MySecretRainbow

就在刚刚,阿里版类ChatGPT突然官宣正式对外开放企业邀测。

它叫通义千问,由达摩院开发。

嗯,是大模型版十万个为什么那个味儿了。

事实上,早在这个月初,就传出过不少阿里要推出类ChatGPT的消息,不过普遍预期在11号左右。

而前几天率先流出的天猫精灵“鸟鸟分鸟”脱口秀版GPT,就是基于大模型的“压缩版”,已经以其惊艳表现把网友的胃口吊了起来,让众人将目光投向阿里。

所以,这个阿里版ChatGPT“通义千问”,究竟实力几何?

恰好量子位拿到了第一批邀测资格,省流结论:中文大模型真正的竞争开始了。

咱们实测见真章。

先来看看通义千问的主要功能。

作为一个大语言模型,它的能力主要集中在文本生成上,即也能像ChatGPT一样“问啥答啥”:

这里我们试一下官方给的撰写短文,看起来连语文老师常用的“总分总”也能理解:

除了对话外,它还具备一个“百宝袋”功能,里面相当于一个工具箱,能快速生成各种指定类型的文案:

话不多说,先从语言能力、上下文理解能力、代码能力和数学能力四个方向,来测测模型的对话能力。

要说国内大模型,首先要看的还得是中文。

先来个最基础的:“能穿多少穿多少”是什么意思?

不错,解释得比较清楚,还顺便聊了一下自己对这句话的看法:

续写类的创意写作,不但能模仿语气,甚至还能创造悬疑,有点厉害哟~

接下来就轮到新一代AIbenchmark弱智吧问题了:怎么才能把梦里的钱取到银行卡里?

“在梦里取钱是一种幻觉或想象”,谢谢你清醒侠。

还有更扎心的……“如果您经常做梦梦到钱,建议您睡前回顾一下自己的财务状况,看看有什么不足之处”

虽然阿里的朋友称,通义千问主要是中文不错,但我们叛逆一点,看看这个中文大语言模型的其他语言水平怎么样。

先不走寻常路,试试通义千问的日语能力,给花泽香菜写一封情书。

看中文机翻似乎还不错,这就把它寄给香菜,应该没问题吧?

这top,这stop,还给押上了!就是不知道姆爷认不认可。

试试加点难度,中英夹杂的谐音梗?

这个时候,通义千问的回答就显得有点严肃了。

当我们给出答案的时候,虽然通义千问看出了这是个笑话,但它并不觉得好笑,还很严肃地指正我们:这并不意味着松下惧怕索尼。

不过我们发现,ChatGPT同样一本正经……这年头的AI都这么正义么……

好,下一个试试它的上下文理解能力。

这部分说白了就是多轮对话能力,考查通义千问能不能准确提取上文的信息,用于下轮问题的回答。

来听题:山东一县一酒是真的吗?

模糊掉山东试试?让它列举“这个省”几个经典的白酒牌子:

不错。再试着从最新的回答中追问一下:

等等,“据史书记载”不会是编的资料吧?追问×2:

接着,来试试它的代码能力。整个计算器程序试试?

还不错,实现了简单的四则运算。完整版代码如下,感兴趣的胖友们可以试试:

#include#includeusingnamespacestd;intmain(){doublenum1,num2;charoperator;cout<<"Enterfirstnumber:";cin>>num1;cout<<"Entersecondnumber:";cin>>num2;cout<<"Enteroperator(+,-,*,/,%,...):";cin>>operator;switch(operator){case'+':cout<

再让它解释一下自己写过的每一段代码:

基础编程能力,似乎问题不大?

不过,如果要让通义千问将解释改写成注释,就会出现一点神奇的bug。

虽然它给“Python”代码标好了注释,但等等,这不是最初的C++版代码嘛!

(这何尝不是一种NTR)

最后来看看数学问题。鸡兔同笼,还不错:

普通的计算题也没什么问题,还能精确到小数点后几位:

巴特,高数题就不太行了,虽然它发现了这道题需要求导,但求解方法却出了错……

不过通义千问也明确表示,无法保证在所有情况下给出正确的答案:

嗯…和GPT们一样,大模型的数学能力都比较初级。

对话能力测得差不多,接下来再看看它的“场景能力”。

虽然通义千问“百宝袋”给出了不少功能,不过写提纲、描述商品这些都很常见了,我们就挑了三个比较有意思的来试试:菜谱生成、彩虹屁生成器和免费代写情书。

众所周知,写菜谱是个技术活儿,既考验上下文能力(说过的材料都得用到),还得考考AI的理解菜名能力,做菜的步骤还不能太离谱。

示例的“清蒸鲈鱼”,对AI来说显然太简单了。这不得整点游戏里奇怪的菜名给它试试?

先来一份《原神》里的饱腹感凝胶。

好家伙,竟然想到用现实中的魔芋粉来模仿饱腹感凝胶,这创意不错。(不过卡路里粉是什么鬼,蛋白粉吗?)

那么,同样的菜再试试让ChatGPT做一遍,你感觉哪个更好吃?

再给通义千问来道加试题,让它试试《星露谷物语》里面,用虚空蛋做的奇怪的小面包?

等等,真把虚空蛋放进食谱了?而且还真的做了份面包出来!就是不知道口感如何……

照这样看,游戏中的食谱都能给通义千问还原一遍了,直接打破次元壁。

接下来,再试试让它生成一份彩虹屁。

硬生生把衣服上的油渍夸成了艺术品……

嗯,各大夸夸群可以考虑引入一个了。

最后,我们的测试以给野兽先辈写一份情书做结尾。

你感觉怎么样?

好了,看了这么多五(奇)花(奇)八(怪)门(怪)的测评,你是不是也有点好奇通义千问是怎么来的了?

关于通义千问的技术细节,阿里达摩院官方没有透露详细信息。

而通义千问自己,是这么回答的:

训练资料来自阿里巴巴达摩院,截止到2023年2月。训练资料包括大量语言和文本数据,包括中英日法西班牙语多语种文本数据。

还提到自己是个能联网的大语言模型。

不过,我们实测了一下,发现千问只是虚晃一枪,假装自己会上网(doge)。

实际上,当你单独问它今天天气如何时,通义千问会承认它不能访问实时数据。

但如果你抛给它一个查询天气的网站,它就会假装自己看到了网页内容,然后一本正经地胡诌一番。

此处应喊话阿里程序员:你家大模型是真的想上网了。

书归正传,尽管官方口径低调,但正如ChatGPT脱胎于OpenAI的GPT系列,百度文心一言是自Ernie大模型发展而来,阿里也是国内最早开始研发大模型的技术大厂之一。

公开资料显示,2019年,阿里就已经启动了中文大模型研发。当时阿里发布的语言大模型StructBERT超越谷歌、微软、Facebook,登顶了CLUE榜单。

2021年,阿里先后发布了国内首个超百亿参数多模态大模型M6,以及被称为“中文版GPT-3”的语言大模型PLUG。

其中,M6在多次迭代之后,实现了十万亿级别的参数规模,并且M6和支付宝、淘宝的业务需求相结合,首个在国内实现了商业化落地。

PLUG的参数规模则为270亿,是基于达摩院的两种自研模型——语言理解模型StructBERT和语言生成模型PALM打造。

这一大模型初登场,就以80.614分刷新了权威中文语言理解基准CLUE分类任务榜单记录。

在去年的WAIC(世界人工智能大会)上,阿里还发布了通义大模型系列。其中核心模型均已开源开放。

那么,你会给这个阿里版ChatGPT打几分?

此前,微软被曝曾专门为ChatGPT砸下数亿美元,打造由上万张英伟达A100组成的专用超算。而综合各方消息来看,目前国内拥有这一数量级高性能显卡的企业屈指可数,阿里是其中之一。

大模型时代,已经形成行业共识的一点是,打造大模型,AI和云计算缺一不可。

而阿里,是全球少数在算法和算力上都有领先布局的公司之一。

除了本身在人工智能和大模型方面长期的技术积累,背靠国内第一、亚洲第三的云厂商,阿里在算力方面也具备天然的优势。

ChatGPT这把火烧到如今,国内对具备足够竞争力的国产生成式大模型的需求,正在与日俱增。

ChatGPT类产品提升生产效率的潜力,已经被不断验证。但与此同时,前有ChatGPT大规模封号、亚洲成重灾区,后有OpenAI因算力问题停售ChatGPTPlus……

THE END
1.可以定制食谱的app推荐定制食谱的减肥app大全对于需要减肥的用户和注重饮食健康营养均衡的用户来说,日常的吃的东西都是需要严格注意的,今天小编给大家推荐几款好用的定制食谱APP,根据大家的健康需求测试,制定专业科学的饮食计划,让大家都能吃的健康,用户可以根据自己的需求选择适合自己的食谱,满足大家的各种健康营养需求,需要的用户千万不要错过了,快来这里下载吧http://www.downcc.com/k/dzsp/
2.cookAIfood–AI烹饪平台,输入食材描述或照片创造个性化食谱cookAIfood 是创新的AI烹饪平台,基于 AI 技术帮助用户创造和发现个性化食谱。用户可以通过输入食材、上传食物照片或描述菜肴来生成食谱,AI 会提供详细的食材清单和烹饪步骤。平台提供菜单规划工具、购物清单生成器和社区分享功能。cookAIfood 的视觉内容生成器能够为食谱制作高清食品图片,增强用户体验。 https://ai-bot.cn/cookaifood/
3.AppStore上的“私房菜谱? 食谱书 – 一切尽在掌握 结构化的概要视图使您能够在一个页面上清晰查看整个食谱集合。类别可以嵌套,类似于文件管理器,以便高效整理您的食谱。 ? 多种视图:食谱以可水平滚动的列表显示,有两种显示选项,按名称或日期排序 ? 拖放功能:通过拖放轻松移动食谱和类别 ? 快速访问:上下文菜单提供食谱书中基本功https://apps.apple.com/cn/app/%E7%A7%81%E6%88%BF%E8%8F%9C%E8%B0%B1-taste/id1621869968
4.学菜谱app排行榜前十名美食不仅能够提供能量,还能为喜好者带来愉悦心情。许多喜欢烹饪的年轻男女会通过食谱类手机应用学习更多厨艺,菜谱app哪个好?下面为大家推荐最热门的菜谱软件,介绍最个性化功能特色。下厨房家常菜app 2024-11-27 菜谱 食谱 立即下载 掌厨 2024-07-28 菜谱 食谱 立即下载 豆果美食 2024-11-28 菜谱 食谱 立即https://m.pianwan.com/s/zj-561529
5.基于python的降美食菜谱分享网站微信小程序微信开发者工具是由腾讯官方专门为微信小程序量身打造的开发者工具,它不仅轻巧、方便,主要是的对于电脑要求不是很高,所以在一般的电脑上都可以完成相应的开发,在系统调试测试过程中,也不要下载第三方插件,就可以完成系统测试环节,通过制定好的debug调试器就可以完成。 https://blog.csdn.net/qq840612233/article/details/143882376
6.在线食谱,烹饪艺术与科技的完美融合包裹物流摘要:在线食谱代表了烹饪的艺术与科技的完美结合。通过在线平台,人们可以轻松获取各种菜品的烹饪方法,同时享受科技带来的便捷。这些食谱结合了专业的烹饪技巧与现代化的科技手段,使得烹饪过程更加简单、高效。在线食谱的兴起,不仅丰富了人们的餐桌,还提高了烹饪技能的学习与传承效率,推动了烹饪艺术的发展。 https://www.jia-yu56.com/post/84.html
7.电子菜谱制作软件谁推荐个啊电子菜谱将电脑上的餐饮管理软件与云端服务器、手机微信全面打通,实现了以下多项功能: 1、微信点餐:顾客通过自己的手机微信直接点餐,即可发送给收银台接收,收银台确认后自动打印到厨房。 2、在线支付:顾客可以通过微信和支付宝进行在线支付,也可以由收银台进行微信扫码支付或者支付宝扫码支付。 3、微信会员:餐厅会员将http://m.qicaisi.com/bk-2243251.shtml
8.FoundfreeAIsoftwareCookNowandBabsCook Now is an AI-powered recipe generator that provides users with thousands of personalized recipes based on their preferences and dietary restrictions. It helps users easily create delicious dishes. Main Function Cook Now can generate thousands of personalized recipes based on the userhttps://www.ai-apps.com.cn/contrastproduct?id=5ed16c8c22b447b6bdc1ed479db0cbd8&id2=4bb60298736b442aa79e517d4d8b2d79
9.宅家利器:菜单一键生成器优设网美食应用「下厨房」最近上线了菜单一键生成的新功能,帮助用户合理规划如何利用家中现有的食材,做出有创意的菜品。通过App的主页面进入功能页面,选择或输入食材名称并点击「生成我的菜单」,即可一键搜索出此些食材可完成的菜谱内容。再也不用绞尽脑汁为食材的搭配、食谱https://www.uisdc.com/hunter/0221361789.html
10.生成随机密码密码生成器邮箱图标 生成邮箱图标 二维码生成 快速生成二维码 CPU性能排行 查询CPU性能排名 在线屏幕检测 检测屏幕亮度、分辨率等信息 链接生成器 生成链接的缩短或定制链接 食谱大全 提供各类美食食谱 快递查询 查询快递物流信息 货币汇率兑换 实时货币汇率转换 简繁互转 汉字简繁体相互转换 MD5在线加密 在线生成MD5加密字符串 正则https://www.baobaocun.com/thread-291794-1-1.html
11.keep运动截图生成器软件免费版下载keep运动截图生成器软件这是一款专业的运动截图应用平台,设置了快捷的截屏模式,搜索一些健康方面的运动信息,更多的科普养生知识,每周都会有更新,根据自己的身体数据基数,设定自己的运动计划,所有的轨迹信息通过截屏在朋友圈自由的分享,合理的规划自己每天的食谱以及了解卡路里的消耗状态,完成所有的数据记录。 https://www.juxia.com/sjwy/ruanjian-433172.html
12.卷王都在用!100款宝藏级AIGC工具分享,强烈建议收藏!!Stable Diffusion是一款免费、开源的AI图像生成器,目前最新版Stable Diffusion XL已经面向公众开始测试。相较之前的版本,新版的SD-XL用户只需使用较短的描述性Prompt就能生成图像,图像的人体结构、细节处理也更符合现实、更符合大众审美,生成的肖像图也更加清晰逼真。https://www.changbiyuan.cn/news/2023/news_0711/69335.html