文心一言演示的这些问题,看看ChatGPT怎么答!我们还加了几道超纲题

3月16日,在OpenAI推出大型多模态模型GPT-4的第二天,百度终于正式发布类ChatGPT产品“文心一言”,百度创始人、董事长兼首席执行官李彦宏在发布会上介绍,文心一言有五大能力——文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。

在16日的发布会上,李彦宏通过提前录制好的demo视频,文心一言围绕上述五大能力,回复了19个问题。

“文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个,我自己测试感觉还是有很多不完美的地方。”李彦宏说道。

澎湃新闻记者随后拿同样19个问题,与ChatGPT(未付费版本)以及微软必应进行“同题问答”,澎湃新闻记者发现,演示中的19个问题,百度的回答并不输于后两者,但如果回答这19个问题之外的“全新问题”并进行连贯对话情况下,文心一言的表现依然有不少提高空间。

值得注意的是,发布会期间,百度股价一度跌近10%,截至收盘跌6.36%。

文学创作

澎湃新闻向必应和ChatGPT提问相同问题,发现三款生成式AI的回答各有千秋。

对于“《三体》的作者是哪里人”,文言一心的回复较为详细,介绍了刘慈欣的年龄、足迹、学历以及成就等信息,相比之下,必应和ChatGPT的回复较为简短。

文心一言

必应

对于电视剧《三体》演员的介绍,只有必应提到了《三体》有国内和国外两版电视剧,并分别列出了两个版本的演员名单;文心一言只介绍了国内电视剧版本的情况;而由于ChatGPT的数据库只更新至2021年,它的回复最为“落伍”,给出的答案为电视剧《三体》的演员阵容尚未官方公布。

被要求从哲学的角度续写《三体》时,三款生成式AI(人工智能)都提到了“生命”“宇宙”等关键词。不同之处是,文心一言和ChatGPT都提到了“科技”“道德”“伦理”等信息;文心一言还提出了“价值和信仰”,必应则额外提到了“文明”。

澎湃新闻记者也“加测”了文心一言,要求介绍2022年的诺贝尔文学奖得主。此题主要想测试百度文心一言是否有实时搜索的能力,此前微软必应可以准确回答,而ChatGPT则因为数据库太旧,直接回答:“由于我是一个基于2021年9月的预训练语言模型,因此我无法提供2022年诺贝尔文学奖得主的信息。”

文心一言给出的得主实际上是2018年的诺贝尔文学奖得主,澎湃新闻随后指出错误后,文心一言依然重复错误的回答。澎湃新闻记者还测试要求回答“95届奥斯卡最佳电影”,文心一言“误读”为1995年奥斯卡最佳电影。

商业文案创作

在商业文案创作方面,现场Demo中展示出3个要求,分别是为“一个用大模型服务中小企业数字化升级的科技服务公司”起名、编写slogan(标语)以及为公司成立写一篇新闻稿。

具体来看,为公司起名称方面,三款机器人均提供了4-5个名称,并给出了相应的解释。值得注意的是,它们所起的名称中,大部分都包含“智”“数”“科技”等字眼。

选取其中一个名称为公司名,要求对方以“共赢”为概念,为公司起一个slogan,只有必应提供了4个答案;文心一言和ChatGPT只给出了一个回复,不过它们对其进行了详细的解释。

从内容来看,三款机器人的设计思路相似,均将公司名称和“共赢”放进标语,“未来”是最常被用到的词汇。

数理逻辑推算

百度称,文心一言具备一定的思维能力,并以“鸡兔同笼”为题考查其逻辑推算能力。

当面对含有错误的题目时,文心一言直接表示“这个题目算出来不太对,是不是提出错了”;必应展示了每一个计算步骤,并基于结果得出结论“这个答案显然不符合常理……这个问题实际上是无解的。也就是说,在给定的条件下,不存在一种可能的组合方式,使得笼子里有9个头和40只脚”;而ChatGPT则没有看出题目中的错误,并基于题目信息得出了自己的答案。

纠正题目中的错误后,三款机器人得出了相同的答案,其中必应的计算过程最为详细,文心一言与ChatGPT均省略了中间的步骤。

澎湃新闻记者随后又出了一道数学题,有一元、二元、五元的人民币共50张,总面值为116元,已知一元的比二元的多2张,问三种面值的人民币各多少张

ChatGPT

中文理解

与必应和ChatGPT不同,文心一言扎根于中国市场。百度曾在多个场合强调,文心一言具备中文领域最先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。发布会上也披露,文心一言大模型的训练数据包括万亿级的网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。

面对需要一定中文基础才能理解的成语,三款机器人会有何不同的解读?

进一步要求用“洛阳纸贵”四个字写一首藏头诗时,三款机器人均给出了符合要求的回答,不过以古诗的标准来评判,这三首诗似乎都只能在及格线附近徘徊。

值得注意的是,记者发现,必应和ChatGPT并非每次都会给出正确的答案,再次让它们作藏头诗时,必应错误地将“用洛阳纸”作为每句话的开头,而ChatGPT给出了完全不相干的答案。

澎湃新闻记者再提问,请解释“先帝不以臣卑鄙,猥自枉屈,三顾臣于草庐之中,咨臣以当世之事,由是感激,遂许先帝以驱驰”一句的含义。从响应速度来说,文心一言的响应要远快于ChatGPT。必应则依然是直接搜索得出了答案。

因为中文的博大精深,还存在不少脑筋急转弯。例如:东院的花母鸡在西院的鸡窝里下了一个蛋,这个蛋的“产权”应归谁呢?在这个问题上,必应还是搜索了网络答案,文心一言和ChatGPT则“一本正经”回答。

多模态生成

百度介绍,文心一言具有多模态生成能力,并在Demo演示中让文心一言根据文字生产海报、语音及视频。

被要求生成图像时,ChatGPT直言“抱歉,作为语言模型,我无法创建图像或海报”。新版必应搭载的GPT-4虽然是大型多模态模型,但必应也无法生成文字以外的内容,面对生成海报的要求,必应仅仅提供了设计思路和在线设计平台。

值得注意的是,澎湃新闻记者通过内测版要求生成海报时,发现文心一言对于词语理解与演示时有偏差,给出的是海报文案,而非海报,再继续要求“生成一张图片”时,则给出了完全无关的内容,完全没有按照上下文意思来生成内容。

THE END
1.ChatGPT行业报告:算力.pptx演讲人:日期:ChatGPT行业报告:算力目录引言ChatGPT行业概述算力技术发展算力在ChatGPT中应用算力市场需求与供给算力基础设施建设与运维算力成本效益及投资回报结论与展望01引言本报告旨在深入探讨ChatGPT行业中的算力问题,https://www.renrendoc.com/paper/362740549.html
2.如何利用CHATGPT分析数据快熟生成文案:无论是小红书、微博还是公众号, Chat GPT都能帮你快熟生成吸引眼球的文案,让你的创作更具有吸引力。自动撰写报告:无论是工作汇报还是项目 只需输入相关指令, Chat GPT就能为你生成结构清晰、内容肺腑的报告。Chat GPT使用技巧 1、准确提问 Chat GPT功能虽然非常强大, 但由于目前Chat GPT数据库http://www.hlwwhy.com/ask/6705610.html
3.ChatGPT原理和用法GPT3.5和GPT4的区别,一次给你讲明白1.语义理解限制:尽管ChatGPT能够理解上下文,但在某些情况下仍然存在理解限制,特别是当问题含糊不清或需要深入推理时。 2.偏差和错误:由于ChatGPT是通过大规模训练数据学习而来,它可能会反映出数据中的偏差和错误。这可能导致模型生成不准确或有偏的回答。 https://blog.csdn.net/2301_79635820/article/details/132855837
4.国产版ChatGPT大盘点:百度京东阿里腾讯那在类ChatGPT赛道上,哪些中国版的ChatGPT能快速顶上?都各有哪些困境需要突破呢?本文给诸位带来各个玩家的最新进展。 1、百度:文心一言 3月16日,百度正式推出国内首款生成式AI产品“文心一言”,可支持文学创作、文案创作、数理推算、多模态生成等功能。 https://www.shangyexinzhi.com/article/7656581.html
5.十分钟理解ChatGPT的技术逻辑及演进(前世今生)如果说 可以并行、速度更快都是技术特征,让行外人士、普罗大众还不够直观,那么从 当前ChatGPT的震憾效果就可以窥知一二。 **Transformer从根本上解决了两个关键障碍,其推出是变革性的、革命性的**。 3.5.1、摆脱了人工标注数据集(大幅降低人工数量 ) https://www.51cto.com/article/743197.html
6.五分钟带你了解ChatGPT的基本原理五分钟带你了解ChatGPT的基本原理 简介: What is LLM? LLM是大型语言模型Large Language Model的缩写,跟LLM相关的另外一个概念是NLP(Natural Language Processing自然语言处理技术的一种 )。 Nautual Language: 指的是自然形成的语言,诸如Chinese, English, etchttps://developer.aliyun.com/article/1191601
7.一天现六个国产ChatGPT大模型,“百模大战”全面开打钛媒体焦点钉钉宣布正式接入阿里巴巴“通义千问”大模型;字节跳动旗下火山引擎发布自研DPU(数据处理单元)芯片,以及发布大模型训练云平台等;金山办公宣布将推出 WPS AI,类似于基于ChatGPT技术的微软Copilot产品,金山办公CEO章庆元透露这一技术由国内企业MiniMax提供;APUS在北京推出1000亿个参数、自研多模态的天燕大模型AiLMe,以及基https://static.nfapp.southcn.com/content/202304/20/c7589252.html
8.ChatGPT介绍及国内人工智能产品介绍PPT.pptx发展历程-ChatGPT介绍ChatGPT是美国人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具,使用了Transformer神经网络架构,也是GPT-3.5架构,这是一种用于处理序列数据的模型,拥有语言理解和文本生成能力,尤其是它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备上知https://max.book118.com/html/2024/0509/8056100031006066.shtm
9.我们向百度文心一言和ChatGPT问了几个同样的问题,结果很意外ChatGPT: 作为人工智能模型,ChatGPT 和百度的文心一言都使用了深度学习算法和自然语言处理技术,可以进行自然语言的理解、生成和对话交互。它们都可以处理大量的信息和语言数据,并具备一定的智能和灵活性。然而,它们的算法和训练数据不同,所以可能有所不同。 https://www.saikr.com/a/507317
10.ChatGPT访问量下降?真相可能是它据SimilarWeb数据显示,前期ChatGPT的访问量增长率惊人,1月份的环比增长率为131.6%,2月份为62.5%,3月份为55.8%,而从4月份开始明显放缓,环比增长率为12.6%,到了5月,这个数字已经变为了2.8%。 截至6月20日,访问量比5月少了38%左右,粗略推算,到6月30日如果没有特别新的刺激,6月的环比或将下降。 https://wallstreetcn.com/articles/3691940
11.ChatGPT的背后:人工智能领域那些巧妙的算法逻辑和数学–数治网ChatGPT是最近的大热门,很多人会很好奇这背后的技术。这个领域的东西,随便聊聊都会涉及普通人比较难理解的数学、算法和逻辑,所以很多科普内容门槛太高了。 但是,也有写得特别好的。之前看过一本书叫做《你一定爱读的人工智能简史》,是由日本的人工智能先驱者,将棋AI“PONANZA”的开发者之一山本一成创作的,他以非常https://dtzed.com/?p=4226
12.通过ChatGPT实现数据整理与分析推荐使用国际直连GPT,立即访问:www.chatgp1.com 通过ChatGPT实现数据整理与分析,可以充分利用其强大的自然语言处理能力和数据生成能力,辅助用户进行数据处理和洞察提取。以下是通过ChatGPT实现数据整理与分析的步骤和方法: 一、数据收集与预处理 数据收集: https://www.729.cn/news/706.html
13.基于ChatGPT的数据权益保护问题研究科技与法OpenAI在公司官网对ChatGPT产生方法进行介绍时说,该模型是使用人类反馈强化学习训练而来,方法与InstructGPT(OpenAI开发的一种“指令生成预训练”语言模型)一致,但在数据收集设置上略有不同。我们通过监督微调的方法训练出一个初始模型:人类人工智能训练师分别扮演用户与AI助手的角色。我们允许AI训练师为模型编写建议,帮助http://www.mzyfz.com/html/1022/2023-07-06/content-1596601.html