事实如此浪漫

喃喃自语不是懒惰的表现,而是一种巧妙的数据压缩技巧

电话接线员
埃弗雷特收藏通过Shutterstock

M我们中的任何人都教导了透学元音毫不含糊,伸张的辅音是邋and的症状,如果不是直接忽视英语。爱尔兰剧作家圣约翰ervine认为,这习惯是有证据表明一些发言者“太弱的弱点和阉割地说出他们的高尚语言”。“如果是这样,那么我们正在在语言之秀的海洋中游泳;基思约翰逊发现扬声器放松或掉了声音超过60%的谈话词语。幸福地,喃喃狂的科学提供了远不那么少的评判 - 更加迷人 - 我们的不完美酥脆发音。

降低或减少声音并不是语言冷漠或道德败坏的症状,而是一种与创建MP3和JPEG所用的数据压缩方案类似的基本逻辑。这些算法减少了数字存储声音和图像所需的空间,方法是丢弃冗余信息或不会给我们的感知体验带来太多影响的信息,例如,以我们听不到的声音频率丢弃数据,或者不费心编码难以看到的轻微颜色梯度。这样做的目的是只保留影响最大的信息。

喃喃自杀或语音弱化,正如语言科学家们更喜欢称之为的那样,它似乎遵循了类似的策略。并不是所有的词都会同样地减少。在演讲中,你更有可能减少像这样的常用词美好的比罕见的话t.如果他们在上下文中可预测,那么你也更有可能减少单词,所以这个词美好的将在像“你将只是很好”的句子中那样明显明显,而不是“这句话中的最后一句话很好”。这表明发言者在纯粹无意识的层面,在需要时策略性地保留信息,但常常在没有提供太多交际的回报时留出来。口语是一种努力,认知的昂贵的活动,并通过精简他们可以的地方,发言者最终会产生更好设计的更流利的句子。

这种语言数据压缩不限于发音:它还驱动了关于是否发出或省略某些单词的决定。你更有可能指明你的邻居是一个女的警务人员或男性护士而不是如果性别逆转。历史上,大多数警察一直是男性和大多数护士女性,在通常的情况下,性别在惯例中是相当可预测的;珍贵的认知能源是为异常情况而保留的,其中单词男性女的更有用。

远离语言漠不关心或道德衰减的症状,丢弃或减少声音会显示类似于用于创建MP3和JPEG的数据压缩方案的底层逻辑。

战略懒惰的概念,其中努力和信息价值与彼此明显平衡,超越各个发言人,以解决整体语言,帮助解释为什么他们有一定的财产。例如,它提供一些洞察为什么语言容忍大量的歧义在他们的词汇表中:扬声器可以易于发出易于发音的单词和短语来接受多种含义,在听众可以轻松恢复扬声器的意图中。它也被调用以解释跨语言的事实,最常用的词往往很短,携带最少量的语音信息,并占原因语言采用某些单词订单.

您还可以通过检查跨语言的颜色词汇表来查看战略数据压缩。某些语言与只有三个或四个不同的颜色作用;例如,乐乐语乍得成千上万的人说,使用单个单词来包含黄色,绿色和蓝色.在工业前的社会中,具有极简主义颜色词汇表的语言,在工业前的社会中往往有很少的制造对象,颜色已经人工上应用。这意味着扬声器主要是指自然对象,颜色是高度可预测的,就像性别传统上是护士或警察一样。如果你觉得回到最后一次你要求别人出去削减绿色草还是给你买点黄的Bananas,在没有丰富的颜色菜单 - 特别是在一个没有消费产品的区域内,更容易看出一种语言如何获得。

虽然有很多理由相信语言涉及大量数据压缩而不会造成灾难性的意义损失,但科学家们对于说话者如何准确地判断哪些信息可以省略以及什么时候可以省略仍然知之甚少。用于创建MP3文件的数据压缩算法基于大量的心理声学实验,这些实验探索了人类听觉感知的细微之处。演讲者是否有关于什么信息对听者最重要的隐含理论?如果是这样的话,这些理论是什么样子的,演讲者是如何得出这些理论的?以及如何看待人们有时含糊不清地咕哝着,或者抛出太多的信息,或者抛出错误的信息?(还看到了AATISH BHATIA的早期帖子,“mp3,jpegs和homer simpson的脸后面的数学伎俩。“)

我们也不知道发言者如何调整其数据压缩算法到各个侦听器的需求。准确预测听众可以轻松恢复的信息有时需要了解他以前的经验或知识的很多。毕竟,一个人的冗余可以是另一个人的异常,正如我曾经与同伴乘客的交换所说的那样。我们在加拿大罗基斯旁边离开卡尔加里市。我的同伴们向佛罗里达队前往佛罗里达州告诉我,他和他的家人一起度过了一个可爱的假期,花了几天的雪地在山上滑雪。到我的加拿大人的耳朵,这听起来很奇怪 - 不滑雪通常涉及雪?我问他是否只用这个词滑雪. 是的,他耐心地解释。但是,那将是在水上。


Julie Sedivy在卡尔加里大学教导语言学和心理,并在Twitter上交易信息@索尔顿语。

27评论 - 加入讨论