简历阅读- - -这个简单的结构将所有的人类语言结合在一起

关闭

你已经阅读了每月两篇免费文章中的一篇。学习更多的知识。

关闭

这个简单的结构将所有的人类语言结合在一起

语言通过自相似性构建意义。

深呼吸。当你吸气时,你的肺就会充满空气。空气通过管道通过肺的各个部分。由大卫adg。这些

T深呼吸。

当你吸气时,你的肺就会充满空气。空气通过管道通过肺的各个部分。这些管子以一种特殊的方式排列。它们分开,一个进入左肺,一个进入右肺。这些管子通过分支、分支、再分支的方式充满我们的肺,形成越来越小的管子。每个分支点都与前一个相似。你的呼吸,你的生命,都依赖于这个结构。它是一个由自相似原理组织起来的结构。

自相似性在自然界中无处不在。看看蕨类植物:每一片蕨类植物的叶子都是由更小的复制品组成的,而这些复制品又由更小的复制品组成。或者想想巨大的三角洲,在那里,巨大的河流分叉成越来越小的溪流,直到它们消失在地球或海洋中。一条河的每一个分支都与之前形成这条河的分支相似。

如果你编造一个复杂的句子,并在互联网上搜索那个句子,它几乎不会出现。

互联网在没有人监督的情况下,已经发展成一种自相似的模式,巨大的集线器连接到较小的集线器,这些集线器自己以同样的方式连接到更小的集线器,一直到手机和笔记本电脑。

自相似无处不在,因为它是有效的。如果一个试管(发育成肺)或一个蕨类植物的叶子在每次生长时都做同样的事情,那么基因就不需要指定生长的细节。同样的事情发生在更大的尺度上,也发生在更小的尺度上。无论一条河是亚马逊河还是一条小河,它都是以同样的方式分岔的。

自相似性也是语言的核心。


年代人类语言的句子和短语,所有的人类语言,都有一种听不见也看不见的等级结构。当我们还是孩子的时候,我们把这种结构强加在我们听到的声音序列上。我们的大脑不能直接把连续不断的声音作为有意义的语言来理解。相反,我们下意识地将它们分解成零散的部分——声音和单词——然后将它们组织成更大的单元。这意味着句子有一个层次结构。

其他动物,甚至是非常聪明的进化近亲,如倭黑猩猩和黑猩猩,都把单词的顺序当成顺序,而不是等级。基于深度学习的现代人工智能也是如此。然而,人类似乎无法做到这一点。当我们遇到语言时,短语和句子的等级结构是我们的大脑无法逃避的东西。我们听到声音或看到迹象,但我们的大脑思考的是句法。

Sapolsky_TH-F1

凯库勒的问题

科马克·麦卡锡是世界上最著名的小说作家。这些作品包括《血色子午线》、《骏马历险记》、《老无所依》和《路》。在圣达菲研究所(SFI),他是一位研究同事。阅读更多

语言最基本的单位,单词和单词部分,被限制在数万个。如果需要的话,我们可以快速地创造新的词汇,但我们没有一个明确的词来描述我们存在的每一个方面。说话者所知道的单词数量是有限的。我们可以把单词添加到存储库中,也可以忘记单词。但是我们能说或能理解的句子是无限的。他们创造了前所未有的意义。

人类的语言具有惊人的创造性。如果你编造一个复杂的句子,并在互联网上搜索那个句子,它几乎不会出现。事实上,我们所说的一切都是新颖的。然而,在我们这种能力的核心是一个难以置信的简单的心理技术:合并。合并使用两种语言,比如两个单词,然后从中创造出另一种语言。它建立了语言的层次结构。


erge是由诺姆·乔姆斯基(Noam Chomsky)在20世纪90年代早期提出的。他认为,这一单一的心理技术,加上儿童可以从他们的语言经验中学到的特定语言限制,足以捕捉所有人类语言的语法。

让我们用两个词,.合并说的是,我们可以把这两种语言,从它们中创造出一种新的语言。我们不会像人工智能或倭黑猩猩那样,把两个单词按顺序排列。相反,我们建立了一个新的层次单元。本单元将动词组合在一起与名词为了创造这个短语喝酒,的语法宾语

让我们通过将事物放入框中来可视化Merge如何作用于动词及其对象。每个盒子都是一些语言。如果你不在盒子里,你就没有语言。盒子里的东西不是按顺序排列的;他们没有命令。盒子所添加的唯一信息是里面的位被组合在一起。这句话都是语言的一部分,而“合并”说这些分组也可以是语言的一部分。我们可以用这样的盒子来表示:

合并创建了一个自相似的结构:一个较大的语言包含两个较小的语言。盒内盒。一个看不见的层次结构。

现在,在口语或书面语中,我们必须把一个词放在另一个词之后。这就是这些语言通道的工作方式。我们不能同时说两个字。说,并在较小程度上签名,扁平化的层次结构,合并构建成一个序列,该序列有一个顺序。这意味着这个结构(就合并而言只是一个结构)可以用两种方式发音。我们要么把它读成酒喝,或者喝酒.语法上的宾语要么出现在动词之前,要么出现在动词之后。这是唯一的两种逻辑可能性。第一个是我们在日语等语言中会发现的顺序,我们会说waino nomu,随便酒喝.第二个当然是英语。

语言学家通常使用小树形图来编写合并的结果。这些树形图为我们提供了来自Merge(什么单词组合在一起)的信息,以及关于顺序的信息。英语和日语的图表是这样的:

这些树在合并方面是相同的,但它们部分的顺序是不同的。我们已经把“合并”带给我们的纯层次结构转换成我们可以发音的顺序。

假设我喝葡萄酒。为了将这个想法表达成一个句子,我们需要在我们刚刚创建的语言中添加一个语法主语。因为“合并”说我们可以用两种语言创建一个新的,我们可以将“合并”应用到单词上以及我们刚刚建立的语言单元:

现在我们有了嵌套的盒子。一个大的单元包含两个较小的单元,其中一个是之前合并过程的结果。日语单词最好地翻译英语单词watashiwa,我们可以这样写这两棵树:

英语是一种主-动-宾语语言,而日语是一种主-宾语-动词语言。但就合并而言,两者是相同的。

还有一些语言会混淆这些顺序。例如,马达加斯加语的英语顺序是喝酒,但把主题放在单位之后:

misotro divay阿霍
喝酒我

马达加斯加语的Merge结构与英语或日语相同,但当这些语言将主题放在首位时,马达加斯加语将主题放在最后。

最后一种逻辑上的可能性是我们说的等价物葡萄酒喝我意味着我喝葡萄酒

在世界语言中,这是相当奇特的。事实上,多年来,语言学家都无法找到一种能够自然表达这种思想的语言。然而,在20世纪60年代和70年代初,已故的德斯蒙德比郡(Desmond Derbyshire)住在巴西亚马逊河流域的卡萨瓦村(Kasawa)。在那里,他学习并分析了当地Hixkaryana部落的语言。在德比郡研究英语的过程中,他发现英语的基本顺序与英语完全相反。来表达男孩捉到了一条鱼希克斯卡里亚纳说,相当于一条鱼抓住了那个男孩

假名yanimno biryekomo
鱼他扑到了男孩

自德比郡的研究以来,又出现了许多以客体-动词-主语顺序排列的语言。即使是这些罕见的语言也可以被认为具有相同的结构,这是由Merge给出的:

希克斯卡里亚纳得到了日本人最深入的命令,给予假名yanimno(字面意思).但它的主题是马达加斯加式的biryekomo“男孩”。可以给整个句子一个树形图,看起来像这样:


Erge并不十分复杂,但它做了许多语言学家需要它做的事情。它适用于语言的离散单位(单词或它们的部分)。它不是按顺序,而是分层次地组合这些元素。它没有说明单词的发音顺序,所以它允许不同语言之间的变化。我们刚才看到的四种语言的层次结构都是一样的,但对应单词的顺序不同。

自相似无处不在,因为它是有效的。

层次结构相同,但语序不同,这一事实让我们能够表达一个重要的想法。语言构建意义的方式是通过合并。每次合并都会对句子的意思产生影响,这种影响通常是稳定的和系统的。这就是为什么说日语和英语的句子意思相同是有道理的。它们有不同的顺序,但有很深的共性。合并在两种语言中以相同的基本方式构建结构和意义。语言是非常相似的,而不是非常不同。

合并也是开放式的。正如我们刚才看到的,它可以重用它已经创建的东西。

因为Merge重用它自己的输出,所以它是一个递归过程。递归过程在数学中是众所周知的,也是现代计算理论的基础。合并是一个相当特定的递归过程——它使用两个单元,并创建语言结构。如果我们人类对语言结构的感知是由“合并”指导的,那就可以解释为什么所有的人类语言都是分层的,而没有一种是顺序的。这也解释了为什么人类的语言是无限的,为什么句子没有一个自然的上限。两者的结合创造了语言的无限潜能,也限制了语言的无限潜能。


他说,我们刚刚看到的四种语言是合并的四种逻辑可能性。但有一个明显的问题。还有其他几种语序:两种重要的语序是动词-主语-宾语和宾语-主语-动词。事实上,动词-主-宾是很常见的。在凯尔特语言中,比如苏格兰盖尔语,玛雅语言中,比如Chol,还有一些波利尼西亚语言中,比如夏威夷语。

让我们来看看盖尔语。在这种语言中,要说“一个男孩抓了一条鱼”,我们说:

Ghlac balach支助小组
被男孩的鱼

我们不能仅仅通过改变宾语和动词的顺序,或者主语和句子的其他部分的顺序来获得合并的顺序。正如我们所见,只有四种可能:

合并看起来还不够强大,不能让我们得到想要的所有命令。乔姆斯基认为“合并”作为构建所有语法的单一方式就足够了,这是错误的吗?

看来他没有错。记住,合并使用了两种语言,并创建了一种新的语言。到目前为止,我们只是使用Merge将独立的语言片段放到一起。这就是我们到目前为止在英语、日语、马达加斯加语和希克斯卡里亚纳语中使用的结构。

但是归并是递归的。它可以重新使用已经使用过的东西。这意味着我们可以合并包含动词的那部分语言抓住了(即带有抓住了内部),语言位包含其他所有内容(即外部的大框)。我们创造的是一种新的语言,它包含了包含动词的方框,以及包含动词的方框:

动词抓住了这里是两个盒子里面的包含被捕获的鱼。在一个更大的盒子里抓住了还有一个盒子,里面装着其他所有东西。它同时出现在两个地方。我们在结构中创建了一种循环。我们不需要扩展Merge来做这个。合并的结果是我们可以重用已经使用过的语言。

这为我们理解像盖尔语这样的动词-主-客体语言提供了一种方式:它们包含了这种循环。如果我把这些框框写成树形图,按照正确的顺序排列,我们就可以开始看到解决困境的方法了:

这里的主题,balach,是“男孩”和对象支助小组是“鱼”。动词ghlac,“caught”与它的对象结合在一起,赋予了与捕鱼相关的含义。然后这个结果与主体融合在一起。它可以被排序为主语-动词-宾语,boy caught fish。最后,Merge应用到一些它已经使用过的语言(动词)ghlac并将其与主-动-宾语单元合并。我们现在可以这样读这棵树:

我就是我
被抓的男孩被抓的鱼

哦!这不是我们想要的,因为动词(ghlac),“抓住了”出现了两次。这个动词只是语言的一部分,但它出现在两个地方,因为我们重复使用了它。

然而,常识可能告诉我们,如果你有一种语言,你只会发一次音。在盖尔语中,当我们重复使用动词时,我们会在重复使用的位置上发音。这就是为什么在盖尔语中我们说Ghlac balach支助小组,这是被男孩的鱼

当然,词序比我在这里展示的要复杂得多。有些语言的词序非常自由,甚至在语言内部也有许多有趣的复杂性。然而,这个想法,即“合并”既可以组合语言,又可以重用它们,让我们对人类语言的语法如何工作有了统一的理解。

由于Merge递归构建层次结构,每个应用程序都连接到含义和声音,因此它构建的有意义的结构的复杂性是无止境的。融合让我们有能力建立新的思想世界,这些思想对人类的成功和失望都至关重要。它使语言无限。


大卫·阿杰是语言无限:我们最具创造力背后的科学这篇文章就是从那里改编的。他是伦敦玛丽女王大学的语言学教授,也是英国语言学协会的总统。

阅读我们对大卫·阿杰的采访在这里

铅图像:Inus / Shutterstock

加入讨论