ChatGPT,是我们进入新年、走出三年疫情遇到的第一个火起来的东西。
没有想到的是,它也同样迅速地引发争论,其中的一个焦点是对教育的冲击。有专家称靠大量的语言数据喂大的模型,是一个最大的“抄袭者”,而许多学校则担心其学生跟着ChatGPT学坏了,也成为抄袭者。
先不去像AI大咖杨立昆和一些认知心理学家那样,去争论什么是真正的智能之类的深奥问题,我们先聚焦在知识、学习、教育这样一些熟悉的话题上来。
去年底我们在做年终研究报告《看DAO2023》时,开始使用ChatGPT,还有文生图的工具。在国内这些又被称为AIGC(人工智能生成内容)。
这位老马,回答水平绝对不亚于真马斯克。他回答了我关于上海超级工厂的最新产能数据,“透露”将很快在上海生产特斯拉电动皮卡,还向我确认他的“学生”朱晓彤将担任CEO。当然,没有一条是真的。但事后证明此事并非空穴来风,朱晓彤的确在特斯拉全球总部担任了更重要的职务,负责全球制造与供应链。老马对朱晓彤和上海员工赞不绝口,说明他还是了解一些情况的。
后来我恶补一些关于语言大模型(LLM)的知识,发现在这个话题上ChatGPT是个真正的专家。
但我问它一些我较为熟悉的领域的问题,如关于1971-1973年布雷顿森林体系瓦解过程中的一些具体国家央行的一些细节,它不能回答出来,始终都在比较宽泛的层面反复唠叨。也许是我的问题不到位。
但在英语世界里,它的知识面要宽广得多。我请它介绍一位研究创新的外国学者CarlotaPerez,它提供了比较准确的回答,还能与我围绕其学说逐步深入地对话。这是因为ChatGPT用来训练的语料中,绝大多数都来自英文。
谁多人说ChatGPT背后的语言模型,只是一个单词预测机,本质上没有什么智能。
譬如我问的这个问题,你可以看出ChatGPT的局限性。它的逻辑推理能力不行。
根据这个回答,我猜测那些号称ChatGPT通过了律师考试或者商学院里考试的,那些试题多半都是天空、记忆、归纳、总结类的题目;GRE考试里的逻辑题,它基本上是通不过的。
有人告诉我问下面这个问题,可以证明ChatGPT是没有智能,只是擅长在文字之间建立达到人类语言水准的组合:
但这并不能说明它搬弄文字失效了,更不能说明它愚蠢到这么简单的问题都回答不了,因为如果你旁边站着一位爱因斯坦,可能也会回答说没有戴表,无法回答。是不是在ChatGPT里内置一个全球时钟,问题就解决了。
对我来说,ChatGPT可以用来学习我不熟悉领域的知识,对话和问答是一种学习,有时候是一种更有效的学习方式。如果临时做一个发言,它可以帮助我迅速梳理出一个思路,产生一个初步的提纲。它的确是一个很好的聊天对象。一本正经地胡扯,不是挺好玩的吗?当然它也很会聊严肃的话题。提出一个好的问题,发现一个好的角度,比直接获取答案更重要。最重要的是,我能分辨出真假,我知道哪里需要核实。
我们可以说它是死记硬背,但我记得初中语文课老师反复说:读书百遍,其义自见。还有一句话,熟悉读唐诗三百首,不会作诗也会吟。记忆和消化大量的知识,也能生成对于人类来说有意味的形式和优美的表达,这算不算智能的一部分?
就在从纽约的中学到香港的大学,在一间又一间地禁止学生使用ChatGPT的时候,多数人又对教育感到不安时,他要求学生在课堂上使用ChatGPT。这是一场教学实验。
莫里克教授认为,“教AI修改论文,是一种可以产生新见解的教学方法”。结果,本学期引入AI的课堂,比pre-AI时有更高的项目成功率,更多同学参与。但他也发现,学生的课堂发言与之前相比减少了,因为他们更多用ChatGPT来解答问题。
如何用好ChatGPT,莫里克教授用了一个非常好的词prompt-crafting(提示技艺)。
对于一些人工智能专家来说,他们仍然不明白这些答案,包括许多表达情绪与个性的回答是如何产生的,“单词预测机”这样一个简单的机制,并不能回避许多使用者在与Bing或者ChatGPT对话时,产生了与一个活生生的个体交流的”幻觉“。
当下的AI,如果其智力正如一些研究所说的为9岁小学生,那么它需要成人的监护,它提出的事实、观点、判断与推理,需要经过人类的审核之后,才能正式发布,或者用于公开正式的场合。
我们也期待AI能不断学习,通过人类的不断输入和反馈,建立起学习的飞轮,从相当于小学三年级的水平,达到中学和大学的水平。
我同意这位教授的话,未来的AI无处不在,与其现在纠结于是不是允许学生使用AI,不如去探索如何更好地使用AI。
最起码你找一个名叫柏拉图的机器人,与他对话有关机器与人类的关系,探讨智能的本质问题,对于学习语言或者哲学的学生来说,是一个无比美好的体验。如果这一过程由一名教师带领学生,一起对话并且讲解,这样的课堂,会多么有趣啊。