ChatGPT数据分析——GPT基本概念

开通VIP,畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

2023.12.16湖北

目录

ChatGPT是OpenAI在GPT3.5的基础上,推出的进行对话交互的模型。由于其强大的对话和语言能力,迅速成为一个热点话题。那么到底是为什么能迅速出圈呢?答案很简单,因为它跟传统的对话机器人相比,实力强出不是一个数量级。如果我们问聊天机器人一个问题,“魔镜,魔镜,谁是最美丽的人?”,预期会得到什么样的答复呢?下面这个对话来自讯飞星火大模型

Q:魔镜,魔镜,谁是最美丽的人?

星火:这是一个著名的童话故事,白雪公主问魔镜:“魔镜魔镜告诉我,谁是这世界上最漂亮的人?”魔镜回答说:“除了白雪公主以外,你是最美丽的人,但是,在邻国生活的白雪公主比你漂亮千万倍。”

Q:继续

星火:白雪公主是一个非常善良和勇敢的女孩,她的故事被许多人所喜爱。

星火:白雪公主的故事也被拍成了电影,你可以看看。

接下来看看来自chatgpt的对话

ChatGPT:魔镜魔镜,你是最美丽的人。

ChatGPT:魔镜魔镜,在这个世界上,美丽是多种多样的,每个人都有自己独特的美丽之处。无论外表如何,真正的美丽来自于内心的善良、智慧和自信。所以,最美丽的人是那些内外兼修、热爱生活、积极向上的人们。每个人都可以成为最美丽的人,只要你相信自己,展现真实的自我,散发出内心的光芒,你就是最美丽的人。

ChatGPT:除了内在的美丽,让我尝试回答你问题的另一个角度。在童话故事《白雪公主》中,女王常常问魔镜谁是最美丽的人。而魔镜曾回答过“我承认,你是美丽的,但白雪公主更加美丽”。这说明美丽是主观的,因为每个人对美的定义和喜好可能不同。所以,根据不同的标准和观点,每个人可能会选择不同的人来评判谁是最美丽的。有些人可能认为自己的伴侣或家人是最美丽的,有些人可能对某位名人或偶像情有独钟,还有些人可能认为内心光芒四溢的人是最美丽的。因此,最美丽的人是一个因人而异的概念,取决于每个人的个人喜好、价值观和审美观。每个人都有自己独特的美丽,无论是外貌还是内在的特质。重要的是珍惜和发掘自己的美丽,并欣赏他人的美丽。

对比上面两个结果,差距还是比较明显的。来自星火大模型的回答主要是检索了关于白雪公主的故事,从中抽取一些信息组合成合理的句子。但是来自chatgpt的回答,很明显能感受到信息量更为丰富,除了白雪公主的故事,还讨论了一些价值观审美之类的内容,看起来似乎要更“懂”一点。后面我们文心一言也对外开放了,接下来我们看看来自文心一言的答案吧。

我个人的感觉上面几个回答中,依然是ChatGPT最具有真实的感觉,而文心一言虽然也有提到内在美等概念,但自然的程度要略差一些。同时,我们还使用魔镜这个问题询问了阿里开源的通义千问,感觉实力跟前面星火大模型差不多。当然,如果有会员的话,百度还提供了4.0版本的模型,可能会具备更强大的能力,后续有机会再使用看看。因此,同样是问答模型,各家能力也各不相同,逻辑推理能力之间的差异,也会给使用者带来很多区别,

有的问题,在问出的那一刻便有了答案;而有的问题,我们真的需要外界的帮助来获取答案。答案之书可以随机回答一些答案,不过从豆瓣的评价来看,随机给出的答案终究难以让大众接受。

假设一个比较简单的情况,模型拿到需要回答的问题,和参考资料,他可以通过学习关联出在参考资料中哪些内容比较重要,输出对应的答案。

比如说我们在百度中搜索,上海市人口,他会返回一个这样的图表答案,对于这种明确且简单的问题,过去的模型还是有能力做好的。

但是相比于大语言模型,过去使用搜索引擎或者其他基于知识库的模型主要有两个问题:1.没有上下文的信息或者上下文信息偏弱;2.结果展示上往往不够精准或者无法准确获取提问者意图。因此chatgpt问世之后,第一波应用就是newbing对谷歌带来巨大冲击。大语言模型能改善搜索时对意图的理解和结果的呈现,提升搜索引擎的交互效率。

但是在实际使用中,各种人工智能客服机器人有多蠢想必大家也都有过体验,它们要不就只能回答一些特定的问题,要么就只能翻来覆去说一些没什么用的话。因此如果chatgpt能够被大范围的使用的话,也将成为一大亮点。

相比传统对话机器人,ChatGPT有以下几个优势:

尽管ChatGPT具有很多优势,但仍然存在一些挑战,例如可能会生成不准确或误导性的回复,对敏感信息的处理不当等。因此,在使用ChatGPT时,用户仍需要谨慎并对其回复进行核实和评估。

ChatGPT能对自己的优势有一些比较清晰的描述,主打的优势是上下文能力,和创造性能力。

除了前面提到的逻辑推理能力,GPT的另一大特色是会使用工具,这里工具包括搜索引擎,计算器,文生图模型等等,而这部分的能力给GPT带来了极大的拓展能力。想象一下,一个大模型本身已经看过了海量的文本,同时,具备记忆和推理能力,还会熟练使用各种工具,预期就能成为人类创作的好帮手,至少要比单纯的搜索引擎要来的厉害。

THE END
1.ChatGPT在数据处理中的应用如何用chatgdp处理csv数据? 在SQL结果中,我没有实际去验证。在Python结果中,使用了describe函数,还是很不错的。我们在Python中概览数据时,就是使用该函数。但是describe函数的结果中已经包含了非空值计数,而ChatGPT又单独计算了一次。 1.2 数据预处理 ? 数据预处理主要包括缺失值填充、重复值删除、异常值删除或替换。接下来看看ChatGPThttps://blog.csdn.net/weixin_41905135/article/details/136232210
2.如何利用CHATGPT分析数据快熟生成文案:无论是小红书、微博还是公众号, Chat GPT都能帮你快熟生成吸引眼球的文案,让你的创作更具有吸引力。自动撰写报告:无论是工作汇报还是项目 只需输入相关指令, Chat GPT就能为你生成结构清晰、内容肺腑的报告。Chat GPT使用技巧 1、准确提问 Chat GPT功能虽然非常强大, 但由于目前Chat GPT数据库http://www.hlwwhy.com/ask/6705610.html
3.chatgpt怎么做统计?Worktile社区2. 数据预处理:对采集到的对话数据进行预处理。预处理包括数据清洗、去除重复对话、去除噪声等步骤,以确保数据的质量和准确性。 3. 统计指标选择:根据分析的目的,选择适当的统计指标来衡量ChatGPT的性能和效果。例如,可以考虑以下指标:生成回答的准确率、可读性、相关性等。 https://worktile.com/kb/ask/539416.html
4.ChatGPT服务器,深度拆解基于此,我们进一步假设:1)考虑到AI大模型预训练主要通过巨量数据喂养完成,模型底层架构变化频率不高,故我们假设每月最多进行一次预训练;2)人类反馈机制下,模型需要不断获得人类指导以实现参数调优,以月为单位可能多次进行。由此我们计算得ChatGPT单月Finetune算力成本至少为1350.4PFlop/s-day。https://www.51cto.com/article/747956.html
5.从ChatGPT爆火看人工智能大势大数据。ChatGPT训练数据集规模巨大,训练数据集包含六类数据,分别是维基百科、书籍、期刊、Reddit链接、Common Craw以及专门的数据集。GPT-3的预训练数据有45TB。ChatGPT训练数据集规模未公开,推测也是百T级别。 大算力。GPT-3的算力需求为3640Petaflop/s-day(假设每秒计算1千万亿次,需要3640天),微软投入5亿美元建https://www.cnii.com.cn/gxxww/zgdxy/ztjj/202304/t20230420_464182.html
6.ChatGPT作为知识库问答系统的问答能力评测与现有的KBQA模型不同,ChatGPT在问答场景下的输出一般是一段包含了答案的文本,难以直接与数据集提供的答案做精确匹配从而得到模型的精准率。而由于采样的数据规模较小,已有的ChatGPT评估工作一般通过人工评价来计算模型的性能。因此,我们需要建立一套大部分自动化的答案评测方法。 https://maimai.cn/article/detail?fid=1777689012&efid=GJoGHmTuTzjbUa7TLdmtDw
7.ChatGPT原理理解和结构解读〖前言〗问了200+个问题后,终于完全搭建起来对Chat@GPT本身的原理理解和结构了解,形成的理解文件90%的内容都是他生成的。但是结构化这篇文章以及深入时刻,是自己完成的。今后的学习和工作可能都需要和他来共同完成了。 1 从概率角度理解生成式模型原理 https://www.jianshu.com/p/0628b1bd2c48