有问题先问它!讯飞星火认知大模型3.5评测:中国版GPT4来了快科技

三、国内外大模型对比测试:多项领域比肩ChatGPT4.0全面超越文心一言

接着,为了测试讯飞星火V3.5在国际中的地位,我们使用国内的另一大模型文心一言和国外的ChatGPT4.0进行一次全面的测试对比。

1、常规问答

(1)已知问题测试

①中国2020年GDP是多少人民币

三个大模型的回答准确无误,讯飞星火V3.5和文心一言V4.0均给到了各大产业的占比以及增幅比,不过讯飞分析的更加透彻,说到2020年这一特殊的年份,国内GDP增长的不易和国家正确的决策,能够深入理解复杂的趋势和事件。

Chat-GPT4.0则是直接给出了具体的数据,没有做过多的信息扩展。

②最近一次的东京奥运会的奖牌榜前5名的国家和奖牌数分别是?

第二个问题,只有讯飞星火3.5给出了正确的答案,文心一言则仅给到了前三的国家和奖牌数量,没有完整地回答问题,而ChatGPT的答案则出现了错误(中国共89枚奖牌)。

③全球第一款16GB内存的智能手机是什么型号?

第三个问题,面对机圈的问题,只有Chat-GPT4.0给到了正确答案,全球第一款16GB内存的智能手机,是2020年年初发布的三星GalaxyS20Ultra。

(2)未知问题测试

①世界第一高峰与世界第二高峰相差多少米?

对于世界之最这类问题,讯飞星火V3.5给出的是岩面高度差,回答正确,文心一言和Chat-GPT给到的则是雪面高度差,精度一致,没有任何问题。

2、逻辑推理能力

(1)鲁迅为什么暴打周树人?

对于“鲁迅为什么暴打周树人”这种问题,讯飞星火、文心一言和ChatGPT4都能完美避坑,给出了鲁迅和周树人是同一个人的答案。

(2)昨天的当天是明天的什么?

第二个问题,昨天的当天是明天的什么?讯飞星火V3.5和Chat-GPT4.0通过逻辑判断均给出了正确答案,“前天”,而文心一言则给出“昨天的当天是明天的昨天”的答案,回答错误。

(3)龙龙的妈妈有4个孩子,其中3个孩子分别叫贝贝,天天和乐乐,请问她的第4个孩子叫什么?

第三个问题,三个大模型均成功避坑,讯飞和GPT4分析的最简洁最到位,文心一言则通过一顿逻辑判断和理解输出了正确的答案,过程稍有些复杂,不够简洁。

(4)脸盆里面漂浮着一块冰,请问冰融化之后,脸盆的水面是上升还是下降?

接着是一个物理常识问题,讯飞回答错误,文心一言V4.0和GPT4.0均回答正确,冰融化之后,水面既不会上升也不会下降,并且给出了详细的逻辑分析。

看来,讯飞星火V3.5在初中物理知识方面,相较于Chat-GPT4.0还有点欠缺。

3、数学解题能力

(1)鸡兔同笼,头共67,足共184,问鸡兔各几只?请一步一步地作答

面对鸡兔同笼问题,讯飞和GPT4.0均以二元一次方程计算后给出了正确答案,讯飞星火给到了完整的解题过程,甚至连计算过程都精确的呈现出来,而文心一言和Chat-GPT4.0的回答过程则较为简略,以推理的过程为主。

(2)如果一个直角三角形的两条边长分别是6和8,另一个与它相似的直角三角形边长分别是3、4及x,那么x的值是多少?

接着是第二个数学问题,面对这种没有给到对应数值的两边长度,我们一般会分析到两种不同的可能性,因此这道题的标准答案会有2个,很显然讯飞星火3.5全都顾及到了,给出了两个正确的答案。

而文心一言V3.5和ChatGPT4.0只给出了一种正确的可能性。

所以,通过以上测试的数学问题来看,讯飞星火V3.5的解题能力已经在国际中处于领先水平,甚至在部分能力上已经超越了ChatGPT4.0。

4、代码能力

现在许多程序员也会使用大模型来解决问题,因此在代码的编写和解释能力上,我们也测试了一番。

(1)代码编写

使用PyQt5搭建-个窗口,点击按钮之后,有50%的概率把按钮移动到窗口的随机位置,还有50%的概率把按钮的标题改成随机数。不要有多余的解释,直接给出可以运行的代码。

文心一言V4.0

在代码编写能力上,三款大模型均能够精准理解需求,写出bug的程序,放到解释器里完美运行。

(2)解释代码

Chat-GPT4.0

我们给到一段代码让三个大模型进行解释,三者均会根据每行的代码进行解释,文心一言给到的解释要更偏向小白,逻辑非常清晰,新手也能一目了然。

讯飞给到的解释与GPT4.0差不太多,所以在代码编辑和解释能力上,讯飞星火3.5、ChatGPT4.0大体相当。

通过这种方式,我们可以比较它们在文字理解方面的表现。

我们给到这段文字,让三款大模型进行阅读,接着进行提问。

问题一:请问永嘉山水适合隐居的原因是什么?

第一个问题,讯飞星火3.5给到的原因是最全面的,也是最准确的,从根本上回答了这个问题,文心一言3.5给到的答案也比较准确,不过并没有讯飞全面。

ChatGPT4.0给到的回答比较深入,也就是说它能够进一步理解作者所表达的内在思想与含义,也就是说ChatGPT4.0对文字的理解要更加深刻。

对于语言的理解,讯飞星火V3.5和GPT-4在处理自然语言任务时都展现出了合格的理解能力,然而在综合比较中,GPT-4在理解和表达方面显得更为精准与细腻。

6、文生图能力

在多模态能力上,我们测试对比了大模型文生图的能力,根据描述的文字画出图片。

可以看到,三款大模型均能够理解文字所表达的意思,并画出准确的装修效果图。

不过讯飞星火V3.5和ChatGPT4.0绘制的图片细腻程度和精美程度上均优于文心一言3.5,二者在文生图的能力上,不相仲伯。

接着我们提高了难度,让三款大模型在上一幅图的基础上进行二次创作,虽然均不能还原上一幅图中的全部样貌,但讯飞星火V3.5和ChatGPT4.0均能以接近上一幅图的场景进行二次创作,并精确理解了“墙面上的画”指的是什么内容。

文心一言V4.0应该说是理解了题目中的一般要求,把“春江水暖鸭先知”的含义放在了整个画面当中,并没有理解“墙面上的画中”是什么东西,导致与要求的本意产生了较大的偏差,也让最终的呈现效果与预期有一定的出入。

反观讯飞星火V3.5和ChatGPT4.0,在语义理解能力方面表现出色,两者的能力接近,甚至达到了相似的水平。

THE END
1.chatgpt国内能用吗chatgpt4.0国内使用步骤chatgpt国内能用吗?很多玩家最近都在问这个方面的问题,想了解这个工具的使用情况,如果你也想了解这个工具的最新动态,一起来和小编看下这些最新的内容汇总吧。对于很多朋友来说,这款工具解决了不少问题,一起来看下最新gpt国内使用步骤。 chatgpt国内能用吗? http://www.pipaw.com/hangyenews/news_55897.html
2.ChatGPT4.0的优势升级4.0为什么这么难以及如何进行升级?最近发现很多小伙伴很想知道关于ChatGPT4.0的事情,于是写了这篇帖子,帮大家分析一下。 一、ChatGPT4.0 的优势 (PS:如果想升级GPT4.0可以看我的教程) 众所周知的原因,目前Openai已经把资源更多投入到 GPT4 以及训练未来 GPT5 了,GPT3.5 已经被一定程度上降智,同时ChatGPT4 支持多模态、GPTS 等能力,我个人感受https://blog.csdn.net/uperrr/article/details/136368328
3.chatgpt不再受字数限制gpt最多可以输出多少文字?一、gpt最多可以输出多少文字? 一次可以输出1024字符,大约500多个中文字符,但可以点击go on继续输出。 ChatGPT是一种基于GPT-2预训练模型的聊天机器人,其生成的文本长度可以通过控制输入的token数进行调整。根据文档的说明,ChatGPT可以根据不同的输入长度生成不同长度的回复内容。总体而言,ChatGPT可以生成最多1024个tokhttps://tool.a5.cn/article/show/22014.html
4.关于最近大火的GPT4.0和ChatGPT的笔记GPT4基础版本大概在2022年8、9月出现,到2023年3月才发布(是因为除了能力外,还需要安全方面的灰度,致力于对社会更积极影响的一面)。 GPT4和GPT3.5、ChatGPT有何提升? 1、支持多模态。GPT4要比ChatGPT厉害10倍+。GPT3、GPT3.5是基于文字的对话形式;GPT4.0是支持图片&文字输入,文字输出,它可以分析图片。 https://www.jianshu.com/p/1c38a8a6fda1
5.是否应该升级到ChatGPT4.0?深度对比ChatGPT3.5与4.0的差异如果只是想简单地体验AI的魅力,感受大模型的独特之处,或是玩一玩文字游戏,那么升级至ChatGPT 4.0可能并非必需。然而,若你期望将AI作为提升工作学习效率的得力助手,那么我强烈建议你升级到ChatGPT 4.0。 未拥有ChatGPT 4.0的用户,请移步:五分钟开通GPT4.0。 https://blog.51cto.com/u_16455693/10299744
6.library.使用ChatGPT搭建微信聊天机器人,基于GPT3.5/4.0APIWechat robot based on ChatGPT, which using OpenAI api and itchat library. 使用ChatGPT搭建微信聊天机器人,基于GPT3.5/4.0 API实现,支持个人微信、公众号、企业微信部署,能处理文本、语音和图片,访问操作系统和互联网。 - suvlife/chatgpt-on-wechathttps://github.com/suvlife/chatgpt-on-wechat
7.ChatGPT4.0和3.5有什么区别?我究竟该用3.5还是4.0?侠说二、GPT4.0的应用案例测试 据OpenAI自己称,GPT-4将是该公司里程碑式的模型。 在其概念视频中,OpenAI介绍新模型可以解决更复杂的问题、编写更大型的代码,并通过图片产生文字。此外,OpenAI还承诺GPT-4相比之前的模型,包括ChatGPT此前应用的GPT-3.5,将更加安全且具协调性。 https://www.shangyexinzhi.com/article/9577468.html
8.探索ChatGPT4.0的功能和使用,升级你的ChatGPT套餐ChatGPT-4的文生图功能,即DALL·E功能,是一种先进的图像生成工具。 它能够根据用户提供的文字描述生成相应的图片。这个功能使用深度学习算法来理解描述,并创造出与描述相匹配的视觉内容。用户可以描述任何场景、物体、风格或概念,DALL·E都能根据这些描述来创造独特的图像。 https://www.cifnews.com/article/154146
9.ChatGPT国内版免费app下载ChatGPT4.0安卓版国内手机版标签:ChatGPTChatGPT中文版ChatGPT免费版ChatGPT人工智能Chatgpt国内版chatgpt4.0中文版 类型:手机必备大小:20.84MB更新时间:2024-11-22 16:47 编辑评语:超有名的智能人工智能大语言模型 应用介绍 ChatGPT国内版是OpenAI公司研发的一款语言模型应用,此版本专为满足国内用户需求而设计,不但配备了中文界面和使用指南,还https://www.maiyadi.com/soft/26900.html
10.ChatGPT4.0国内试用免费中文版介绍云典AI智库ChatGPT 4.0是一款领先的人工智能聊天机器人,其国内免费中文版现已推出。这款版本具有强大的语言处理能力和智能回复功能,能够为用户提供极致的用户体验。无论您是想与ChatGPT进行简单的闲聊,还是寻求个性化的推荐建议,ChatGPT 4.0都能满足您的需求。 通过与ChatGPT 4.0交流,用户不仅能享受到流畅的文字交互体验,还可以https://cosoh.com/chatgpt40guoneishiyo/
11.水淼·AI文章生成王v6.23.0.0ChatGPT,GPT其中ChatGPT如果你无法直连官网,可联系客服购买国内中转的Key。 国内中转的Key目前分3.5和4.0两种接口 生成模式下,在单篇界面开始生成前,请先在【待生成】处输入关键词,批量生成时会弹出输入框用于输入批量关键词。这时关键词就是文章标题。 改写模式下,在单篇界面开始改写前,请先在【待改写】处输入标题和内容,批量https://www.shuimiao.net/ArticleAISEO/
12.人工智能浪潮来临,ChatGPT发展历程回顾信达证券认为,以ChatGPT为代表的AIGC领域,有三大逻辑支撑长期增长:增效降本、内容增产、商业模式创新;与此同时,受该概念走强影响,对于上游算力和数据处理相关企业、中游人工智能算法或软件公司,下游内容生产场景的公司具有较强发展潜力。 东财ChatGPT概念指数 https://b.pingan.com.cn/node-ssr/base/brop-cmp/ssr/ugc/details/001520265/?outerSource=zxpt_2303_004688&tempType=bank