2009年2月,一位名为@popelizbet的推特用户向名叫科林的人提出了一个具有明显历史性的问题:她问科林是否能够对她“自以为是地解释”(mansplain)一个概念。,事实上,去年夏天发表mansplain这个词的词典编纂者伯纳德特佩顿(BernadettePaton)相信这是第一次有人以可记录的形式使用这个词。“它已被删除了,但我们抓住了它,”帕顿满意地告诉我。
从一个层面上讲,再没有东西比字典更简单的了:只是人们使用或已经使用的单词列表,并解释这些单词现在的含义或者是曾经的含义。然而,从另一个层面上讲——也就是词典编纂者烦恼和迷恋的层面——很少有事情会更复杂。谁使用过这些词,何时何地使用这些词?你如何知道的?其中还包括哪些词,以什么语义语境为基础?你如何从中辨明这个词的语义?到底什么是“英语”?
对于像牛津英语词典这样的词典——其声称为公元1000年到现在的英语中的每一个单词提供一个“确定”记录——这个问题甚至更难回答:我们能否全面理解、调查和分析这种处于不断发展之中的活的语言?与词典编纂人员交谈会让人有些担心再使用“字面意思”这个词,但是对于一本明确的词典来说,实际上并没有所谓的字面意思。即便你到达了山顶,也会发现需要探索的内容又扩大了100英尺。然后你意识到它甚至不仅仅是一座山,而是地球上一系列连贯的山脉。(在这个“英语全球化”的时代,这种比喻似乎很恰当。)
在第一版出版后的第90年,比约翰逊词典更久远《牛津英语词典》目前正在进行第三版,这是一个涉及每个词条大修的浩大工程(其中许多词的语义要追溯到维多利亚时代晚期),并添加至少30,000个遗漏的单词,以及将词典完全数字化。原计划整个词典的修订工作将在2000年完成,然后推迟到2005年,然后又一次推迟到2010年。从那以后,牛津英语词典编纂委员会就不再提及完成日期。我问普罗菲特他们的进度。“大约48%,”他回答。
这本字典的权威性和存在意义毋庸置疑。20世纪80年代后期的某个时候,普罗菲特的前任主编约翰辛普森(JohnSimpson)曾向英籍牙买加作家及诗人本杰明·泽凡尼(BenjaminZephaniah)请教名词“skanking”的原始语义。泽凡尼认为最合适的解释方法是到《牛津英语词典》总部进行面对面的交流。决定唯一解释的方法是到《牛津英语词典》总部进行私人的一对一表演。Skanking正式被收录进《牛津英语词典》,被定义为“一种搭配雷鬼音乐的西部印度舞风格舞姿,腰部以上身体向前弯曲,同时膝盖向上抬起,双手顺势抓拍空气。”
这个故事触及到了一些深刻的东西:在捕捉一个词时,可以就此观察和定义真实的生活体验。也就是说只要你能够理解所有的词,也许就可以定义真实存在。
然而,第一批英文词典编纂者制作者对捕捉整个文化毫无幻想。汉语和古希腊语等语言相早在几千年前就存在系统的,字典式的作品,但相比之下最早的英语词汇直到16世纪才开始出现。英语词汇过于零碎,且继承了多种语言,堪称老盎格鲁日耳曼语,挪威语,拉丁语、希腊语,以及诺曼法语的混合体。
这种杂交的语言已经足够令人困惑了。但在16世纪中叶,由于时局动荡以及殖民贸易引发的新一轮移民潮,英语变得越来越混乱。同期也带来了很多新词汇:诸如“酒精”(alcohol)诞生于1543年,源自阿拉伯文以及拉丁文;“放弃”(abandonment)诞生于1593年,来自法语。科学和医学的发展加剧了这种混乱。1582年,理查德·马尔卡斯特(RichardMulcaster)呼吁学者“将我们在英语中使用的所有词汇编成一本字典”。这样一来可以规范拼写,另外也最终建立“适于使用”的词汇规则。
1604年,一位名为罗伯特·考德雷(RobertCawdrey)的神职人员创造了一个临时解决方案:面向“女士、名媛淑女以及其他技能不熟练人”出版了单一语言的《字母表》(TableAlphabeticall),在其中列出了大约2,500个“较难使用的词汇”,这还不到当时常用语的5%。而且词义比较模糊,其中的“饮食”(diet)一词被描述为“进食的方式”,也没有任何解释性的引用,更不用说追溯语源了。《字母表》的词汇量非常少,甚至没有关于字母W的条目。
图示:罗伯特·考德雷(RobertCawdrey)于1604年出版的《字母表》
这个时期,法语、意大利语以及西班牙语都已经出版了综合字典,但英语却没有。1664年,英国皇家学会组织成立了一个22人的“改进英语”委员会,仅仅召开了几次会议就宣告解散。1712年,乔纳森斯威夫特(JonathanSwift)针对这个问题发表了一番言论,对轻率使用英语的情况大加挞伐,坚持认为“应该考虑采用某种方法来明确和修复我们的语言”-认为英语需要进行详实考证,英语使用者应该遵守一些规则。这个提议撼动了每个人。直到1746年,当一个出版商财团设法说服塞缪尔约翰逊(SamuelJohnson)接受这个“伟大而艰巨的工作”时,英语综合字典的完成似乎值得期待了。
约翰逊的词典最终在1755年完成,堪称壮举。他收集了43500多个单词,估计囊括了当时惯用词汇的80%。但在某些人看来,这不仅仅是编纂者的失败,也是一次英雄式的失败。与他1747年计划的自信满满和乐观主义相比,其在前言中关于“固定”和“保存”的谈话使得字典成为了一个纯粹的现实主义作品,。约翰逊解释说,驯服快速发展的生物(如英语)的想法不仅是不可能的,而且是荒唐可笑的:
“我们往往会嘲笑那些夸口能让人活一千年的长生不老药,并且藉此平等的所谓正义驱使下,也会嘲笑那些从无到有创造的词典的编纂者,而这一词典是在不断变化中保存我们这个国度的语言。但是编纂者更乐于想象,他的字典保证他们的语言不会堕落和衰变,可以让它们被铭记于心。“
正如约翰逊曾经幻想过的那样,词典编纂者可能会幻想捕捉和固定词汇的意义。然而,对于一种不断变化的语言来说,将永远不断超越原有内容。
尽管如此,梦想仍在继续。如果一本词典能够囊括从有文字记录到现在为止的所有英语词汇呢?业界也提到了约翰逊词典的修订本或竞争对手的可能性,但事实上鲜有这种作品问世。1828年,一位名为诺亚韦伯斯特(NoahWebster)的美国康涅狄格州教师出版了第一本《美国英语词典》(其中包含7万个英语词汇)后,英国人的自豪感再次受到威胁。
1857年11月,伦敦语言学会召开会议,听取威斯敏斯特院长理查德·切尼维克斯·特伦奇(RichardChenevixTrench)所撰写的题为《关于我们英语词典中存在的一些缺陷》一文。这是一个重磅炸弹:特伦奇争辩说,英国英语词典是如此不可靠,以至于需要推倒重来。站在现有立场上,他简要介绍了关于“一本字典的真实想法”。这种柏拉图式的资源应该严格按照学术上的历史线索进行汇编,甚至要深入到古语源学语言的洞穴之中。它应该客观描述而不是硬性规定,对于从盎格鲁-撒克逊单音节词到最新的技术术语都应当秉持客观公正的态度。最重要的是,它应该是全面的,给予特伦奇所谓“我们的母语”以荣誉感。
对语言整体性的追求可能已有数百年历史,但是,像一条伟大的铁路或重要桥梁一样,这本新字典将是彻底的维多利亚时代产物:科学态度,冒险精神,史诗般宏大和代价高昂。编纂这样一本字典完全是是爱国义务的使然。特伦奇坚持说:“字典是历史丰碑,是一个民族的历史”。
在最初的二十年里,所谓的“新英语词典”看起来好像会走以前许多类似项目的老路。第一位总编辑在入职一年后离世,留下了一个烂摊子;第二个总编辑是一位女性,注意力完全没有在字典编纂上。事实上,直到牛津大学出版社在1879年说服一位小有名气的苏格兰教师和文学家詹姆斯默里(JamesMurray)担任主编后,新英语词典的编纂工作才开始走上正轨。
图示:詹姆斯默里(JamesMurray)组织编纂了第一版《新英语词典》,于1928年出版
这是有史以来用现有语言编写的最大书籍之一:如果你把所使用的活字金属首尾相连,它将从伦敦延伸到曼彻斯特。这部词典的问世或许迟到了60年,但出版商最大程度地宣传“牛津字典是最高权威,没有竞争对手”。
唯一的解决办法是对词典进行修订。《牛津英语词典》的第一个增补版于1933年问世,收录了编辑在知识过渡期间发现到的新词以及原始遗漏问题。第二次增补于1957年开始,最终在1972年至1986年期间分四期出版,共计69,300多项新词条。然而,这似乎是一场失败的战斗,也算是芝诺悖论(Zeno'sparadox)的一种特殊形式:《牛津英语词典》词典编纂者离终点线越近,终点线看起来就越远。
对于词典编纂者来说,语料库语言学最让人兴奋的是它可以让你窥探非正规用语。整理出现特定词汇的短语可以让你解开这个词不同的意义。探究一个词是如何被“误用”的,暗示着它的重心可能在发生变化。例如,比较代表性的语料库可以让你看到特朗普支持者频繁地部署一个名词,比如说“自由”,以及这个词在BlackLivesMatter运动中的用法有多不相同。“这完全改变了我们所做的事情,”词典编纂者迈克尔·润德尔(MichaelRundell)告诉我,“这产生了自下而上的影响。你必须重新思考几乎所有的事情。“
但是,尽管其他词典出版商推崇语料库语言学,但《牛津英语词典》的编辑们则坚持他们所了解的,抵制电脑化并依靠大学图书馆和研究人员提供的引用语进行编纂。在20世纪70年代和80年代,很少有人想到要彻底改变这最伟大的历史词典,更不用说让它保持最新状态:它的漏洞和原来一样多。当《牛津英语词典》第二版于1989年3月出版时——一共20卷,其中包含291,500个词条以及240万条引用语——有人抱怨说这根本不是真正的新版词典,只是一个换了排版的旧版词典。关于“计算机”(computer)的词条将其定义为“计算用机器;尤其是用于执行数学或逻辑运算的自动化电子设备“。这是从1897年的一本期刊中引用的。
令人吃惊的巧合是,就在《牛津英语词典》第二版问世的当月,一条爆炸性消息撼动了世界:一位英国计算机科学家蒂姆·伯纳斯-李(TimBerners-Lee)提出的“大型超文本数据库”的概念。这个称之为万维网的技术为词典化未来提供了一条闪亮道路。数据库可以共享,并相互连接;用户可以扫描整个图书馆,并可以检索其中的内容。人们使用电脑和调制解调器就可以获取所有现存的文本。
事实上,现在可以从网上获得如此多的文本,这是最为剧烈的变化。现在已经讲过的单词现在在社交媒体上输入。俚语专家强纳森·葛林(JonathonGreen)说:“长期以来俚语词典专家一直梦想能够追踪词汇的不同使用形式。”现在,通过Facebook或Instagram,这实际上是可以实现的。词典编纂者几乎可以在词语诞生的那一刻发现:在此之前,编纂者针对诸如“mansplain”之类的词语将不得不寻找能够证实其存在的印刷记录。
当《牛津英语词典》在19世纪50年代首次被构想时,英语是不列颠群岛、北美洲大部以及海外殖民地的官方语言。如今,世界上近四分之一的人口,也就是15亿人口把英语作为第二语言。英语也有许多区域性变体,从西印度群岛到西非再到威尔士都是如此。所有这些区域性英语比以往任何时候都有更加明显的特征,每种英语都以更大更快的速度互相交织。
图示:出版于1928年的第一版《新英语词典》
有些人的想法更大。其中一位是罗马Sapienza大学的计算机教授RobertoNavigli,他在2013年开发了一个名为Babelnet的网站,该网站的目标是成为击败所有现有词典的词典。这要归因于它并不是真正意义上的词典,其被称之为“语义网络”,可将现有资源(包括维基百科,维基词典和微软术语)汇集到一起,旨在创建一个不仅包含英语而且包含271种语言的全面层次化根映射,使其成为最大的词库和百科全书。Navigli告诉我他的真正目标是使用“语义技术”为各地的软件工程师提供终极武器:自动化文本阅读器。“这是梦想,对吧?”他说,“可以阅读文字并理解我们所说的一切的机器。”
当然,机器已经理解了很多。有些人曾谈到了“文化经济学”,这是算词汇学的一种计形式,它使用语料库工具来分析和预测人类行为的趋势。一项为期31个月的Twitter用语研究试图衡量英国民众对紧缩政策的反应情绪。至少在大数据环境下,计算机和掌握数据的信息巨头可能比我们自己更能理解语言的本质。
对于词典编纂者和谷歌之流来说,探究语言仍然存在固有的障碍。现在构建书面文本语料库,在特定环境中理解语言作用相对容易,但是关于口语的处理就要困难得多。原因很明显:录制语音,然后创建一个可用的数据库既费时又昂贵。语音语料库确实存在,但体量小且不具代表性。
对于词典编纂者而言,发音是所有人最宝贵的资源,也是最难以捉摸的。如果你能够捕捉到大量样本——从操场,办公室食堂到超市,人们会在每一种可以想象到的环境中讲话——你就可以更加准确地监控人们日常使用语言的方式。“如果我们破解了用于转录正常对话的技术,”迈克尔朗德尔(MichaelRundell)说,“它确实会改变游戏规则。”
“现在去词典学术会议,你会看到很多行外人,”朗德尔说。尽管他接受过词典编纂者的培训,但他现在主要担任顾问,为出版商提供建议,该如何使用基于语料库的资源。“它曾经是一种职业,”他接着说,“但是30年前的工作并不是那么简单。”他指着他空无一物的架子,“但是,我对印刷业的凋零不是太伤感,我把大部分词典都带走了。“
即使关于词典编排的基础设施已经完全失效或完全被改造,但有些东西仍保持着一致性。每一位与我交谈的词典编纂者都明确表达了对“单词爱好者”的厌恶,在词典界,所谓的单词爱好者对单词的解释不会多于十个词条,还常常向人卖弄自己读得出“世界上最长的英语单词”。一向对人和蔼可亲的约翰辛普森(JohnSimpson)毫不客气地指出:“我认为这种并不是在’享受’语言,而只是在使用语言。”
或许人们最不愿承认是的,爱好才是让人们花费毕生精力去筛选和分析语言的主要原因。要成为“关于单词的侦探”需要特殊的才能:他们普遍是语言学学者,档案史学家,记者和传统侦探的综合体。尽管语料库语言学家与传统的词典编纂者相比,语料库语言学家和学术语源学家之间的矛盾还不是很大,但词典编纂似乎是一种特殊的专业的专业,参与的人们有着一种挥之不去的共同目标感:我们反对那种不断扩张的多头英语。英语。“这是一种强迫症,”简·所罗门(JaneSolomon)如是指出。
她继续说,大多数词典编纂者都知道,所谓制作完美语言资源的想法是非常愚蠢的。“我从过去的词典学了太多东西,以至于曾经把这个想法当作个人目标。”但是,成为词典编纂者的兴奋之处在于,他们知道这项工作永远不会完成。英语总是变形、发展、演变;不安分的活力让它是如此得引人入胜。“英语总是在变化,”所罗门说,“你必须喜欢它。”
关于词典编纂还有其他的乐趣:捕捉到新释义的激动,或者创造出一个不完美、至少正确的定义。“这听起来很俗气,但它可以像诗歌一样,”迈克尔·朗德尔(MichaelRundell)反思道,“编纂一本词典和其他手艺一样都是一门艺术。”
在词典发展的整个过程中,《牛津英语词典》都在努力,想要比遗忘更完美地完成今天的任务。词典编纂团队现在更倾向于将其称为“移动文档”,只添加单词,但不会删除。他们永远不会被删除。我向迈克尔·普罗菲特(MichaelProffitt)说,现在的《牛津英语词典》就像一艘骄傲而又漏水的维多利亚式战舰,船员们试图在阻止其漏水,同时保证其安全,他看上去反应冷淡。“我过去常说,这就像在为福斯桥涂油漆,永无止境。但后来他们又停了下来——我想是有了一种新的油漆。”他停顿了一下,“但现在只有我们。”