行业资讯 > 最新资讯 > 科研成果

语言表达的共同目的

1.jpg

这里有一个简单的问题:下面2个句子哪个表达的意思更明确?


1. "John threw out the old trash sitting in the kitchen."


2. "John threw the old trash sitting in the kitchen out."


这两个句子从语法上都没有问题,但是你可能会发现第一种说法显得更自然,这可能是"out"这个词的位置放在句子中间更加适合的原因。


用术语来说,第一句话的“从属长度(dependency length)”更短。也就是说句子中关键元素之间的距离更短。根据来自MIT的3位研究者关于37种不同语言的研究,大部分的语言在实际运用中都会有“从属长度最短化(dependency length minimization, DLM)”的倾向,也就是说只要有可能,语言的使用者都倾向于使用更简短的关键性短语。


这篇文章的主要作者,MIT大脑与认知科学学院的PhD学生Richard Futrell MIT表示人们喜欢使用那些句子中相关词语位置更为接近的说法,“有一个原则,也就是在句子中语法上相关连的词语之间的距离应该尽量缩短”他说。这篇文章发表在Proceedings of the National Academy of Sciences(PNAS),研究表明无论是讲述者、倾听者还是读者运用语言时都倾向于更加简短的表示方法,因为这样可以使我们的大脑容易理解。Futrell提到,“如果我正在跟你说话,而你在试图听懂我的意思,那么你就必须从语法上分析哪些词语是相互联系的,如果2个相关词语之间的距离过长,也就是说你不得不牢记这些词语一段时间,那样会造成理解困难。”DLM的存在之前已经在某些语言中得到验证,但是最近这项研究是迄今为止规模最大的有关DLM的研究。


Edward Gibson,一位认知科学的教授和该研究的合作作者说到:“很有意思的是人们以前仅仅是只注意到了一两种语言就得到了该结论,尽管我们认为那个结论是无误的,得到更多的数据去验证也很重要...我们并不是想研究最完美的语言的表达方法,而是为了确认DLM确实与之有关。


为了进行该研究,研究者使用了四种能够解析句子语法的数据库:一个来自于布拉格的Charles大学,一个来自Google,一个来自于Universal Dependencies Consortium(一个新的计算语言学家小组),还有来自宾夕法尼亚大学Linguistic Dependencies Consortium的中文数据库。研究内容的语句选自各种出版物用以代表日常用语。为了衡量那些相关词语在句子中的距离远近,研究者们将某些句子的从属长度和该种语言的基准从属长度相比较。基准从属长度是将从属长度随机化得到的,也就是从“关键”词语(比如前面的"threw")和“从属”词语(如"out")的的距离。但是有一些语言,比如英语的词语顺序规则就比较严格,研究者也使用了另一种基准用来说明词语顺序的效果。


在所有的情况下,Futrell, Gibson和合作者Kyle Mahowald发现DLM在不同的语言中程度不同。意大利语似乎具有更加优化的简短表达方式,而德语,一直以来以迂回复杂的句子结构而臭名昭著,语言的使用远远不能称作完善。研究者们也发现一些语言诸如日语,韩语和土耳其语,他们的“关键”词语往往放在句子末尾,这些语言的DLM程度相对较小。


原因可能是这些语言有相对扩展的格位标志(用来说明词语的作用,比如一个名词是做主语还是宾语)。这种不同的格位标志因此可以用来解释这些语言中更长的从属长度。Futrell说:“在一些词语在句子中的格位标志十分明显的语言中,从属词的的位置往往并不十分重要”。其他研究专家也表示这项研究提供了非常有价值的信息。


“这是一项有趣又激动人心的工作”,Rochester大学的David Temperley教授表示,他和他的同事Daniel Gildea是一项对比英语和德语从属长度的研究的合作者。“我们很想知道这种现象到底有多么普遍”,他说。Futrell,Gibson和Mahowald也坦然地表示他们的研究留下一个很大的问题:DLM倾向的发生是否主要是为了帮助语言的产生,语言的接收,还是仅仅是一种语言的认知功能,或者包括以上所有内容?“可能是为了帮助讲述者或者倾听者,也许两者都是,总之很难去区分”Gibson说到。


热门排行

推荐阅读

回到顶部