新春假日AI领域并不平静,屡屡搞出王炸。前有英伟达发布的ChatwithRTX,即每个人都可以利用自己的算力和数据做私有的ChatGPT,后有OpenAI全新发布的文生视频模型Sora,即将永久改变内容创作行业。
但这些跟当下的大多数人有什么关系呢有人会说娱乐,嗯,的确是的,但还有一样隐藏之下,那就是学习。
ChatGPT将大幅提升每个人自学的能力,能提升多少倍呢
我说ChatGPT可以让你从原来读不懂到能读懂,这是多少倍这里谦虚一点,就当1000%吧。今天就来聊一聊自学这个话题。
许多人在开始工作后便与老师告别,主要依靠自学来获得知识,我也不例外。
我每年读的专业书籍大概30本,10本大致能读懂,剩余20本书籍由于受认知水平、专业能力、翻译质量、通俗程度等因素影响,基本会半途而废,倒不是这些书籍内容不好,而是自己没办法读懂。
有一个观点是这么说的,一本书中如果有85%的内容是你比较熟悉的,15%的内容是陌生的,那么这15%的内容估计你跳一跳也是能够到的,这种难度的书对你获取新知是最好的。但如果一本书大多属于陌生的内容,那学习的效果会很差。
举个例子:
我很早以前就读过TOGAF、DAMA、微服务等一些专业书籍,当时读起来就非常吃力,我认识里面的每个字,但组合起来就完全不知道是什么意思了,虽然最终靠着毅力翻到了最后一页,也只是为了证明“我终究是读完了这本书”。
自己也曾经为读不懂DAMA诸如此类的找理由,比如说因为翻译的不好,因此读不懂,后来去找英文原版来读,结果还是一样读不懂。
当然,这里的“读懂”不是指简单的字面上的理解,而是一种更深层次的、所谓的“融会贯通”。
比如DAMA对数据治理有一个定义,即“对数据资产管理行使权力、控制和共享决策(规划、监测和执行)的系列活动”,这个定义里有个词叫作“控制”,那么什么是“控制”呢
很显然,知道“控制”中文原意不叫读懂,在DAMA的语境下,“控制”涉及到的在数据治理背景下,哪些场景需要控制,为什么需要控制,谁来控制,怎么控制,谁来监督有没有控制......,短短一个词,不同的人读出的是不同的层次和含义,这是读了与读懂的区别。
那么怎么衡量自己读懂了呢
费曼学习法是一种借鉴方式,你不仅需要拿读懂的东西写一篇读后感,还能够给大家谈下读后感,然后为大家讲一堂课,甚至辩证的指出里面存在的问题,这才叫读懂,也就是融会贯通。
很多人估计都看了董宇辉的直播吧,觉得他对于很多知识信手拈来,这种能力确实可以看作是读懂的一种表现(至于董是否有自己独到的见解,那就另说了),虽然你可能表达不如他,但骨子里要有这种“教”的能力。无法教会别人的知识,岁月还是会把这些知识遗忘。
但我等普通人,虽然每天都被各种知识环绕,但要真的读懂这些专业知识实在太难了。99%的人估计都没教过人吧,你现在知道的那些知识,有多少是可以自己讲出来的离开了现在的平台,还会有多少人会为你的专业知识买单偶偶设想一下这种场景,可以帮助我们更清醒地认识自己。
许多人上大学的时候都学过傅里叶变换吧,但当时的我,除了掌握一些解题技巧外,并没有理解这个所谓的变换的真正技术原理(5W1H),而依靠教科书来理解这些原理,几乎是不可能完成的任务。
然而,现代的专业知识体系极其庞大,哪是靠几个专家就能用白话解释清楚的,对于大多数普通人来讲,如果真想深入理解某个领域,实际门槛是很高的,很多专业读物没有专门的研究者或原作者解释,无法读懂读透,有时候其实你也分不清楚,到底是你读不懂,还是作者自己都没想清楚。
我很早的时候读DAMA就是这个感觉,但随着经历增多,慢慢对某些章节的内容能理解了,但还是有不少内容读的时候会感觉抽象,无法找到现实中的例子来论证,毕竟,我一个人不可能把数据管理要做的事全部经历一遍,也找不到任何其它辅助理解的读物。
去年由于工作需要,我特别想重新系统性的学习一下架构,在网上一番搜索后,我发现像TOGAF这样的框架仍然是学习架构的最佳读物。然而,回想当初为了考TOGAF证书而经历的那段痛苦的时光,仍然心有余悸。
首先,对于我这样半路出家的人来说,TOGAF等专业读物并不友好。将大量英文段落准确转换成通俗中文极为困难,有时候读了老半天也不知道在讲啥。
其次,大量的陌生英文名词要彻底搞懂不容易,而且问无可问,比如内容元模型、架构视点、构建块等等,很容易把人绕晕。
再者,即使勉强能理解表面意思,但由于TOGAF本身不带案例,自己也没有实践,举不出形象的案例来加深理解,因此会感觉学得非常抽象,比如TOGAF提到了大量的交付物说明,但这些交付物到底长啥样,完全懵逼。
我当时真的很想学好TOGAF,也知道懂的人大有人在,但的确无能为力,或者说代价超出了能承受的范围,这是一个知识无处不在的时代,也是一个知识传授代价极大的时代。
虽然人人都在说我们需要成为综合性的人才,成为T字型的人才,但哪有这么容易,你找到了所需要的知识,可惜你就是读不懂。移动互联网时代,信息的不对称也许越来越少了,但知识的不对称大了去了。
然而,自从有了ChatGPT之后,一切都在发生改变。
我发现,在ChatGPT的帮助下,再次学习那些理论性、方法性的专业读物变得容易多了,可以说是进入了快车道。以下用我学习DGI数据治理框架的经历来说明。
第一,中英文语义的完美对齐者
我制作了ChatGPT中英文翻译prompt,它可以基于上下文将英文翻译成地道的中文,完全符合中文习惯且不失准确,抹平了由于翻译造成的信息差,极大降低了理解成本,吊打各种翻译软件。
我给大家看个示例:
可以看到,ChatGPT的解读显然更上了层次。在读英文文献的时候,即使我看懂了,也特别喜欢让ChatGPT结合上下文再翻译一遍,因为总是能从它的翻译中获得惊喜,有时一字之差,谬以千里。有了ChatGPT,世界各种语言间的知识传递变得更容易了,ChatGPT某种意义上就是现在的世界语。
第二、基本概念的“全能解释器”
掌握概念是理解文献的基础,针对书中怎么也看不明白的专业概念,定制化的ChatGPT可以给出非常通俗且令人惊叹的解释,未来如果有了文生视频Sora的助力,那解释就更形象了。
下面是我用“数据治理专家”GPTS解释数据治理和数据管理区别的一个例子:
数据治理(DataGovernance)与数据管理(DataManagement)虽然在很多方面是相互关联和互相支持的,但它们在目的、范围和执行上存在本质的区别:
数据治理(DataGovernance)
范围:数据治理是一个战略性的框架,旨在通过跨部门的合作、政策制定、标准化和监督来管理和控制组织的数据资产。
参与者:数据治理涉及的是组织中的高层管理者和决策者,包括数据治理委员会、数据所有者和数据管理员等角色。
目标:其目标是确保数据符合组织的业务策略、合规要求和质量标准,支持数据的有效使用和管理决策。
数据管理(DataManagement)
范围:数据管理是实现数据治理策略和标准的具体执行机制,它包括数据架构、数据建模、数据仓库、数据质量、数据安全等多个领域。
参与者:数据管理通常涉及到数据工程师、数据库管理员、数据分析师等技术人员和操作人员。
目标:其目标是通过有效的技术和流程,确保数据的可用性、可靠性和安全性,从而支持组织的日常运营和长期发展。
简而言之,数据治理是制定规则和政策的框架,强调组织、流程和决策权的管理,而数据管理是根据这些规则和政策进行的实际数据操作和技术活动。数据治理为数据管理提供了指导和监督,而数据管理则是数据治理计划的执行手段。
第三、复杂语义的“完美推断者”
对于那些实在难以理解的句子和段落,ChatGPT能够利用上下文对内容的原意进行合理猜测,给出详尽的解释,极大的拓宽我的思路,这种方法某种意义上就是一种新型的头脑风暴,展示了AIGC的独特优势。
下面以DGI数据治理框架图为例说明:
该图中第9个组件叫“DGWORKProgram”,翻译成中文叫“数据治理工作计划”,我对其中的DGWORKProgram的“Program”被翻译成“计划”很不理解,因为“计划”在中文的语境中是未来要做的事,而这里显然包括当前做的事,我就让ChatGPT给我解释清楚在这个上下文中的“Program”到底是什么意思,解释的挺到位,如下所示:
ChatGPT也能读懂图片(支持中文比较差),我让ChatGPT详细解释这张框架图,下面是它给出的结果:
ChatGPT用通俗的方式迅速解读完了全部内容,还有自己的一些推理。这让我在碰到疑问时总是习惯性的看看ChatGPT有什么理解,帮助自己打开思路。
第四、跨越从抽象到具体的鸿沟
同时,数据治理项目还可能被咨询如何修改现有的通用控制(如变更管理、政策制定、培训、生命周期管理和项目管理等),以更好地支持治理目标。
比如某公司原来尽管有数据变更管理流程,但是在实施数据变更时,缺乏对数据安全性的评估。因此,公司决定在变更管理流程中增加一个专门的步骤,要求在任何数据变更执行前,必须进行数据安全评估。
当然控制措施的作用不止于风险管理。它们通过确保数据、数据产品及其使用过程能够满足预期,能为企业带来价值。这些控制措施可能由人工执行,或嵌入到自动化程序或系统中,侧重于标准化、遵守规定或促进数据的有效使用。
比如某金融公司利用数据来提供个性化的金融产品和服务,因此高质量的数据对其业务至关重要。为了确保数据的准确性和一致性,公司采用了一种自动化的数据质量管理工具,会定期自动检测和纠正数据仓库中的错误和不一致性,其不仅管理了数据风险,还提高了数据的质量和可用性,从而增强了其金融产品和服务的个性化能力。
第五,自己的定制化数字孪生体
ChatGPT还可以让我们基于私域资料定制自己的ChatGPT,即GPTS。我自己就做了“数据治理专家”、“翻译精灵”、“修改大师”、“标题天才”等一众垂类GPTS,目的就是让GPTS的回答得更加专业。下面是“数据治理专家GPTS”的部分Prompts,它已经刻上了我的个人烙印,因为我上传了很多自己的专业资料作为知识库。