本文将介绍Morten H. Christiansen和Nick Chater所写的一篇文章:『Towards an integrated science of language』,全文发表于2017年7月出版的Nature子刊Human Behaviour,由于篇幅较长,全文译文将分两次发出,欢迎关注并留言评论!
绪言
长期以来,人们一直认为语法是一套抽象的规则体系,世界上的语言遵循着普遍的模式,而且我们生来就拥有“语言本能”。然而,另一种聚焦于我们如何学习和使用语言的范式正在兴起,颠覆了这些以及更多的假设。
哲学家Susan Haack将科学比作填字游戏。在填字游戏中,线索越难,就越能从它们的相互关系中获益:三行竖排线索帮助我们解决五排横行的问题,反之亦然。这种逻辑支持了整个自然科学中方法和解释层面上整合的力量。然而,对语言研究来说却往往正好相反。句法、语义学、语言类型学和变化、计算语言学、语言处理、儿童语言习得和语言进化的研究已经脱节,而且他们给出的建议并不相容。但是,让语言科学碎片化,就像是解决填字游戏:先单独处理每条线索,只是在最后把它们整合在一起——这种策略注定要失败。
幸运的是,在跨学科工作的推动下,另一种综合体开始出现在语言科学中。这种综合体推翻了过去对语法本质的假设,把语言处理和学习与基本认知原理联系了起来,将语言视为文化进化的产物,而不是由基因编码的“Bauplan”指导的。
乐观与撤退
20世纪50年代,语言研究进入了现代时期,当时诺姆•乔姆斯基提出了转换语法:这是一种严格的数学规则体系,旨在生成每种自然语言符合语法的句子。转换语法本身经历了各种重要的理论发展阶段,并且很快与一些惊人的论断联系在一起:所有的人类语言都遵循着同样深刻的普遍模式,这种“普遍语法”是天生的,在语言发展的过程中逐渐展开,就像小鸡长翅膀一样。语言的进化是瞬间的,可能是由突然的大规模基因突变引起的。生成语法项目最初承诺要建立起跨学科之间的重要联系。心理学家在语言处理过程中寻找语言转换的痕迹;发展心理学家试图将儿童语言理解为“处于不断变化中”的生成语法;工程师们尝试将生成语法融入到他们的自然语言系统中;神经科学家和遗传学家寻找着普遍语法的生物学根源;语言变异的学生则评估了所谓普遍原则的普遍性。
然而,这些最初充满希望的发展,连同它们的许多变化,很快就失败了,心理学家找不到任何转换的证据。儿童语言只能用极端的假设来使其与生成模式相一致(例如:孩子们不是在犯错误,只是在说一种与他们所接触的语言不同的语言,或者说,两个单词的表达是由于某些原因被删除了很多材料的复杂句子)。语言学似乎无助于基于计算机的自然语言处理,正如IBM工程师 Fred Jelinek所指出的那样,他有一句名言:“每当我们解雇一名语言学家,语音识别系统就更准了。”神经科学无法分离出语言的特殊机制,而“语言基因”被证明是虚幻的。世界上的语言似乎充满了与普遍模式相反的例子。一些研究人员正勇敢地努力解决这些问题,但主流的反应是无视它们。理论语言学家、心理语言学家、儿童语言研究者、计算语言学家、对语言感兴趣的生物学家、田野语言学家等等,他们开始出现分歧,往往达到了不理解相互理论的程度。事实上,主流语言理论开始积极地创造差别(例如,能力VS表现,核心VS外围,学习语言VS处理语言,语言变化VS语言演变),旨在证明这些语言的不同学科观点之间是可以封闭的。
当然,在物理和生物科学中,分析水平和不同数据之间的整合与交互是普遍存在的(粒子物理学家与宇宙论者,进化论者与地质学家,胚胎学家与遗传学家等等)。自然的填字游戏只有通过跨学科的整合和持续的交互才能解决。许多主流语言学家认为语言学是生物学的一部分,或者把理论语言学和理论物理学相提并论,然而现实却大不相同。
迈向另一种综合体
二十多年前,作为爱丁堡大学的研究生,语言研究的瓦解使我们深感不安,而且有这种感觉的绝不仅仅是我一人。在我们自己的大学以及世界各地,出现了各种非正统的理论框架、计算模型和实证程序。但这些“少数”的方法已经逐渐占据主导地位,令人兴奋的是,共同的线索正慢慢出现,这为语言研究中本质不同的综合体奠定了基础。
这个新兴的替代框架的核心是结构,它是形式和意义的学习配对,包括单词有意义的部分(例如单词结尾-s,-ing),单词本身(例如企鹅penguin),多词序列(例如cup of tea),词汇模式和图式(例如the X-er, the Y-er,就像the bigger, the better)。这种构造语法的准规则性使它们能够抓住类似规则的模式以及无数的例外情况,而这些例外经常被基于抽象规则的旧观点中的命令所排除。从这个角度来看,学习一门语言就是学习使用结构来理解和产生语言的技巧。因此,传统观点认为,儿童就是一个小小的语言学家,其艰巨的任务是从有限的输入中推断出正式的语法,而基于结构的框架将儿童看作是一个发展中的语言使用者,逐渐地磨练其语言处理能力。这并不需要假定的普遍语法,而是要有对语言输入中可用的多种概率信息来源的敏感性:从单词的发音到它们共同出现的模式,再到来自语义和语用语境的信息。对儿童语音的计算分析显示,他们可获得的信息比以前假定的要多得多。例如,可以通过对哪些单词和短语一起出现的统计分析来推断词汇分类和含义,而且跨语言分析表明,名词和动词的发音往往不同。随后的实验表明,儿童利用这些线索来帮助自己学习新单词,成人在处理句子的过程中也依赖这些线索。
考虑到语言此时此刻的性质,拥有尽快集中和整合信息的能力是至关重要的。我们都有过这样的经历:仅仅转移了片刻的注意力我们就失去了谈话的思路。我们对听觉信息的记忆非常短暂,加上新信息迅速消除了旧信息,所以我们甚至很难回忆起只有少数几个元素的序列(虽然对话以很快的速度进行着,每分钟大约150个词),总之尽快集中和整合信息的能力是十分关键的。因此,大脑必须快速地处理新信息,否则它将永远丢失。这个“亟待突破的瓶颈”可以解释为什么语言结构和处理在语言信号中是具有高度局部性的(例如,为什么语音被组合成单词;为什么复数和时态标记通常与它们所修饰的词直接相邻;为什么相邻的单词会变成短语,等等)。从这个角度来看,语言习得涉及到通过概率信息的快速整合来推断局部模式。
有趣的是,致力于需要实时响应人类语音的系统的工程师也已经获得了类似的局部模式匹配解决方案,就拿我们现在手机上的语音识别系统来说。如果你问外面的温度是多少,哪怕是几秒钟的延迟都会让你感到尴尬和不自然。因此,人工语音识别系统也必须处理即时的语言。他们采用的策略揭示了:它们依赖于单个单词、多字符串或带有“通配符”字符串部分的概率模式匹配(例如,what’s your X,其中X可以由某人的名字来实例化),而并非是抽象规则生成的语法树。它们还尽可能多地包含先前的上下文或其他背景知识(例如,正在讨论的内容区域),以确保它们一次性正确(或者是在大部分情况下)。因此,自相矛盾的是,任何我们能够真正与之交谈的电脑,像Stanley Kubrick’s 2001中的HAL,可能都需要构建一个类似人类的亟待突破的瓶颈。