T深呼吸。
当你呼吸时,你的肺部充满了空气。空气通过管通过肺部的每一部分携带。这些管以特定的方式组织。他们分支,一个进入左肺,一个进入右侧。管子通过分支,分支和分支填充我们的肺部,进入细微和细小的管。每个分支点类似于前一个分支点。你的呼吸,你的生命,取决于这种结构。它是由自我相似性原则组织的结构。
自相似性在自然界中无处不在。看看蕨类植物:每一片蕨类植物的叶子都是由更小的复制品组成的,而这些复制品又由更小的复制品组成。或者想想巨大的三角洲,在那里,巨大的河流分叉成越来越小的溪流,直到它们消失在地球或海洋中。一条河的每一个分支都与之前形成这条河的分支相似。
如果你弥补了任何复杂性的句子,并在互联网上搜索确切的句子,它几乎从不存在。
互联网有没有人监督它的,进化成一个自我相似的模式,巨大的集线器连接到较小的集线器,这些本身以与相同的方式连接到较小的集线器到手机和笔记本电脑。
自相似无处不在,因为它是有效的。如果管道,将肺部变成肺部或进入蕨类植物,每次生长时都会做同样的事情,那么基因不需要指定增长的细节。同样的事情发生在较大的范围内,并且在较小的尺度上发生。无论河流是亚马逊还是微小的流,它都没有区别,它以同样的方式分支。
自相似性也是语言的核心。
年代人类语言的句子和短语,所有的人类语言,都有一种听不见也看不见的等级结构。当我们还是孩子的时候,我们把这种结构强加在我们听到的声音序列上。我们的大脑不能直接把连续不断的声音作为有意义的语言来理解。相反,我们下意识地将它们分解成零散的部分——声音和单词——然后将它们组织成更大的单元。这意味着句子有一个层次结构。
其他动物,甚至是非常聪明的进化近亲,如倭黑猩猩和黑猩猩,都把单词的顺序当成顺序,而不是等级。基于深度学习的现代人工智能也是如此。然而,人类似乎无法做到这一点。当我们遇到语言时,短语和句子的等级结构是我们的大脑无法逃避的东西。我们听到声音或看到迹象,但我们的大脑思考的是句法。
最基本的语言,单词和词部分单位限于数万。如果我们需要,我们可以在飞行中创建新的,但我们没有针对我们存在的各个方面都有一个不同的词。扬声器知道的单词数是一个有限的商店。我们可以向该商店添加单词,我们可以忘记单词。但我们可以说或理解的句子是无限的。他们创造了之前没有的意义。
人类的语言非常有创意。如果你弥补了任何复杂性的句子,并在互联网上搜索确切的句子,它几乎从不存在。几乎我们说的一切都是小说。然而,在这种能力的核心中,我们的令人难以置信的简单心理技术:合并。合并需要两点语言,说出两个单词,并在另一点语言中创造出来。它构建了语言的分层结构。
米erge是由诺姆·乔姆斯基(Noam Chomsky)在20世纪90年代早期提出的。他认为,这一单一的心理技术,加上儿童可以从他们的语言经验中学到的特定语言限制,足以捕捉所有人类语言的语法。
让我们用两个词,喝和酒.合并说的是,我们可以把这两种语言,从它们中创造出一种新的语言。我们不会像人工智能或倭黑猩猩那样,把两个单词按顺序排列。相反,我们建立了一个新的层次单元。本单元将动词组合在一起喝与名词酒创建短语喝酒, 和酒的语法宾语喝.
让我们通过把东西放在框中来展示合并在动词及其对象上的操作。每个盒子都是一点语言。如果你不在一个盒子里,你就没有一点语言。盒子里面的东西不在序列中;他们没有订单。盒子添加的唯一信息是它内部的位被分组在一起。这些话喝和酒都是语言的一部分,而“合并”说这些分组也可以是语言的一部分。我们可以用这样的盒子来表示:
合并创建了一个自相似的结构:一个较大的语言包含两个较小的语言。盒内盒。一个看不见的层次结构。
现在,在口语或书面语中,我们必须把一个词放在另一个词之后。这就是这些语言通道的工作方式。我们不能同时说两个字。说,并在较小程度上签名,扁平化的层次结构,合并构建成一个序列,该序列有一个顺序。这意味着这个结构(就合并而言只是一个结构)可以用两种方式发音。我们要么把它读成葡萄酒饮料,或者喝酒.语法对象要么出现在动词之前,也可以在它之前出现。那些是唯一的两个逻辑可能性。首先是我们用日本语言找到的顺序,我们会说waino nomu,随便葡萄酒饮料.第二个当然是英语。
语言学家通常使用小树形图来编写合并的结果。这些树形图为我们提供了来自Merge(什么单词组合在一起)的信息,以及关于顺序的信息。英语和日语的图表是这样的:
这些树木在合并方面是相同的,但在其部分的顺序中截然不同。我们翻译了纯粹的层次结构,这些层次结构合并给我们提供我们发音的命令。
让我们假设我喝葡萄酒。要将此思想表达为句子,我们希望在我们刚刚创建的语言中添加语法。由于Merge表示我们可以采取两位语言并创建一个新的语言,我们可以将合并申请到这个词我和我们刚刚建造的语言单位:
现在我们有了嵌套的盒子。一个大的单元包含两个较小的单元,其中一个是之前合并过程的结果。日语单词最好地翻译英语单词我是Watashiwa.,所以我们可以写下我们的两棵树:
英语是一个主题动词对象语言,而日语是一个主题对象动词语言。但两者都是相同的,就合并而言。
还有一些语言会混淆这些顺序。例如,马达加斯加语的英语顺序是喝酒,但把主题放在单位之后:
misotro divay阿霍
喝酒I.
Malagasy的合并结构与英语或日语相同,而那些语言首先将主题放置,Malagasy将其持续。
最后的逻辑可能性是我们说相同的地方葡萄酒喝我意味着我喝酒.
在世界语言中,这是相当奇特的。事实上,多年来,语言学家都无法找到一种能够自然表达这种思想的语言。然而,在20世纪60年代和70年代初,已故的德斯蒙德比郡(Desmond Derbyshire)住在巴西亚马逊河流域的卡萨瓦村(Kasawa)。在那里,他学习并分析了当地Hixkaryana部落的语言。在德比郡研究英语的过程中,他发现英语的基本顺序与英语完全相反。来表达男孩捉到了一条鱼,Hixkaryana表示相同的一条鱼抓住了男孩:
假名yanimno biryekomo
钓鱼他抓住它的男孩
由于Derbyshire的工作,许多用此订单的其他语言,对象动词主题订单,已经亮了。即使这些稀有语言也可以被认为是具有相同的结构,由合并给出:
希克斯卡里亚纳得到了日本人最深入的命令,给予Kana Yanimno.(字面上地鱼被抓住了)。但它有Malagasy为该主题订单biryekomo, “男孩。”整个句子可以给出一个看起来像这样的树图:
米Erge并不十分复杂,但它做了许多语言学家需要它做的事情。它适用于语言的离散单位(单词或它们的部分)。它不是按顺序,而是分层次地组合这些元素。它没有说明单词的发音顺序,所以它允许不同语言之间的变化。我们刚才看到的四种语言的层次结构都是一样的,但对应单词的顺序不同。
自相似无处不在,因为它是有效的。
层次结构相同,但语序不同,这一事实让我们能够表达一个重要的想法。语言构建意义的方式是通过合并。每次合并都会对句子的意思产生影响,这种影响通常是稳定的和系统的。这就是为什么说日语和英语的句子意思相同是有道理的。它们有不同的顺序,但有很深的共性。合并在两种语言中以相同的基本方式构建结构和意义。语言是非常相似的,而不是非常不同。
合并也是开放式的。正如我们刚才看到的,它可以重用它已经创建的东西。
因为合并重复使用自己的输出,所以它是一个递归过程。递归过程在数学中是众所周知的,形成现代计算理论的基础。合并是一个非常特定的递归过程 - 它使用两个单位,它会创建语言的结构。如果我们的人类语言结构被合并引导,那将解释为什么所有人类语言都是等级的,没有顺序。它还解释了为什么人类语言如此无限制,为什么句子没有自然上限。合并两个创造和限制,无限的语言潜力。
我说我们刚才看到的四种语言是合并的四种逻辑可能性。但是有一个明显的问题。还有其他类型的单词顺序:两个重要的是动词主题对象和对象 - 主语动词语言。事实上,动词主题 - 物体相当普遍。这是在苏格兰盖尔的凯尔特语语言中找到的订单,玛雅语言,如CHOL,以及一些像夏威夷这样的辉尔尼人语言。
让我们来看看盖尔语。在这种语言中,要说“一个男孩抓了一条鱼”,我们说:
Ghlac balach支助小组
抓住了男孩鱼
只需切换对象和动词的顺序,我们无法从合并中获取此订单,或者使用其余句子的主题的顺序。正如我们所看到的那样,当我们这样做时,只有四种可能性:
合并不足以让我们所有想要的订单。乔姆斯基是错误的,建议合并就足以作为所有语法构建的单一方式吗?
看来他没有错。记住,合并使用了两种语言,并创建了一种新的语言。到目前为止,我们只是使用Merge将独立的语言片段放到一起。这就是我们到目前为止在英语、日语、马达加斯加语和希克斯卡里亚纳语中使用的结构。
但是归并是递归的。它可以重新使用已经使用过的东西。这意味着我们可以合并包含动词的那部分语言抓住(即盒子抓住内部)用其他一切的语言(即大的外部框)。我们创建的是一种新的语言,其中包含带有动词的框,以及包含该框的框:
动词抓住这里均在包含的盒子内被捕获的鱼。在一个更大的盒子里抓住和一个包含其他一切的盒子。它有两个地方一次。我们在结构中创建了一种循环。我们没有延长合并以执行此操作。合并具有我们可以重用已经使用的语言的比特。
这为我们理解像盖尔语这样的动词-主-客体语言提供了一种方式:它们包含了这种循环。如果我把这些框框写成树形图,按照正确的顺序排列,我们就可以开始看到解决困境的方法了:
这里的主题,Balach.,是“男孩”和对象IASG.是“鱼”。动词ghlac,“caught”与它的对象结合在一起,赋予了与捕鱼相关的含义。然后这个结果与主体融合在一起。它可以被排序为主语-动词-宾语,boy caught fish。最后,Merge应用到一些它已经使用过的语言(动词)ghlac并将其与主-动-宾语单元合并。我们现在可以这样读这棵树:
GHLAC BALACH GHLAC IASG
抓住了男孩抓鱼
哎呀!自动词以来,这不是我们想要的,因为动词(ghlac),“抓住了”出现了两次。这个动词只是语言的一部分,但它出现在两个地方,因为我们重复使用了它。
但是,常识可能表明如果你有一点语言,你就会发出一次。在盖尔的情况下,当我们重用动词时,我们将其发出重复使用的位置。这就是我们在盖尔的原因Ghlac balach支助小组,这是被男孩的鱼.
当然,词序比我在这里展示的要复杂得多。有些语言的词序非常自由,甚至在语言内部也有许多有趣的复杂性。然而,这个想法,即“合并”既可以组合语言,又可以重用它们,让我们对人类语言的语法如何工作有了统一的理解。
由于Merge递归构建层次结构,每个应用程序都连接到含义和声音,因此它构建的有意义的结构的复杂性是无止境的。融合让我们有能力建立新的思想世界,这些思想对人类的成功和失望都至关重要。它使语言无限。
大卫·阿杰是语言无限:我们最具创造力背后的科学,本文改编了这篇文章。他是伦敦王后大学语言学教授和英国语言学协会主席。
阅读我们对大卫·阿杰的采访在这里.
铅图像:Inus / Shutterstock