猕猴学会嵌套性语法结构动物也能掌握复杂规则！

新浪科技综合

2018.06.2110:31

关注

来源：BioArt微信公众号

人类的语言和动物的发声到底有没有本质的差异？这并不是个容易回答的问题。20世纪早期，有一批研究者尝试教小猩猩学习用嘴“说话”，结果发现即使把猩猩从小当作孩子养在家里，它们也学不会说话，只能发出模糊不清的声音，比如把“妈妈”叫做“毛毛“[1]。当时科学家们觉得这并不能说明猩猩没有语言能力，可能只是它们的口腔和声带等发声器官不适合说话，才限制了表达能力。

于是，20世纪中期的另一批研究者尝试教会猩猩用手语和人交流。他们发现，猩猩可以表达简单的短语，如”苹果-我-吃“、”挠-我-玩“，最长的短语是”给-橘子-我-给-吃-橘子-我-吃-橘子-给-我-吃-橘子-给-我-你“[2]。虽然手语比发声进步了很多，但这仍然不符合人类语言的定义：猩猩能用手势指代某些事物，但却不能把这些手势按一定的规则组合起来——即它们知道手势的语义，却不明白手势之间的关系（即语法）。

“

No such an animal is man。

”

序列学习（sequence learning）是人类习得语言的重要基础。早在上世纪50年代，Karl Lashley便提出应当从行为学及神经科学的角度对序列编码的机制进行深入研究[3]。人们想知道大脑是如何编码事物之间的时间顺序，比如怎样利用这些时间信息从记忆表中提取和分辨事件，怎样预测即将出现的下一个事件，以及怎样将这种提取、分辨及预测能力泛化到其他具有相似结构的新序列中。Lashley指出，人类语言的感知及创造，包括鸟的鸣叫、大鼠的定位导向行为，都包含对系列事物的相互串联。人类和其他动物不仅能够对有着固定时间间隔的前后两个事物之间进行联系，也能提取出存在于多个事物之间的抽象的序列结构。

图1。抽象程度不同的序列（自上而下越来越抽象）

六十年来的语言学研究已经证实，语言的表征需要以嵌套树状结构的方式来完成[4]。相似的，一些利用更简单的实验范式开展的行为学及神经生理学的研究表明，在对声音序列和动作序列编码时，不仅采用了简单的串联模式，而是存在很多不同的表征形式。Dehaene等人[5]的研究综述中指出，序列中包含抽象程度逐渐增加的五种信息：转换及时间信息、组块、次序信息、代数规则及嵌套树状结构（图1）。之前的研究已经明确的表明动物可以利用前四种信息进行序列编码[6-9]。

人类的语言包含复杂的嵌套树状结构[4， 5]。比如句子 The cars [that pass this truck] are red ，尽管中间插入的句子中存在一个名词（truck），但系动词（are）却是用来连接复数主语（cars）和表语（red）的。这种长距离的相关性正是语言的重要特征，只有以树形结构表征语言时，才能忽略“cars”和“are”在时间距离上的差距，进而连接在一起（图2）。

图2。嵌套树形结构图：黑色结构嵌套绿色结构。

之前的研究认为，人类与动物在高级认知功能上的重要区别在于，人类能够理解并产生诸如语言、音乐等具有嵌套结构的序列，而非人类动物不能理解嵌套结构[10， 11]。那么，理解嵌套结构的能力是否是人类所特有的呢？早期的实验表明，绢毛猴（Saguinus oedipus）不能理解中央对称嵌套树结构（center-embedded nested tree structure，如A[A[AB]B]B，表示为AnBn），但是能够理解非嵌套的配对结构（non-nested pairwise structure，如[AB][AB][AB]，表示为（AB）n）[12]。此外，序列学习、工具使用、音乐和数学知识的理解等行为表明，获取并操作嵌套树状结构的能力可能是人类所特有的[13-15]。

最近一些研究者的结果表明，鸣禽和狒狒能够编码中央对称嵌套结构[16-18]。Gentner等人[16]通过设计go/nogo任务范式，测试欧洲椋鸟（一种已经被证明能组合多种不同叫声的鸣禽）对嵌套结构的分辨能力。实验结果表明，通过训练，一部分欧洲椋鸟能够快速掌握分辨两种不同类型（（AB）n和AnBn）的序列结构的能力，并且能将这种分辨能力泛化到新异刺激及不同长度的序列中。Abe和Watanabe[17]在另一项研究中发现，孟加拉雀对于违背中央对称嵌套规则的新异序列的响应比对符合规则的熟悉序列的响应显著降低。

但是，这些结果尚存在较大争议：一方面，这些研究没有引入足够充分的抽象泛化刺激来证明动物的规则泛化能力；另一方面，这些行为学结果也能用转换概率和配对关系等简单的非递归编码方式来解释[19-23]。

2018年6月14日，中国科学院神经科学研究所/中科院脑科学与智能技术卓越创新中心王立平研究员课题组在Current Biology杂志在线发表了题为Production of Supra-regular Spatial Sequences by Macaque Monkeys 的研究论文，首次证明猕猴具有处理中央对称嵌套结构的能力。这项研究填补了之前研究的空白，并对“嵌套结构是人类独有”的假说提出了挑战。杂志还同期配发了来自维也纳大学的进化生物学家 W。 Tecumseh Fitch 的评论文章Bio-Linguistics： Monkeys Break Through the Syntax Barrier。

王立平博士近些年一直从事序列学习的相关研究，2015年发表在Current Biology上的研究论文通过fMRI手段探究了猕猴在听觉模态下对于代数规则的理解[24]。结果表明，非人灵长类动物即使未经训练，也能编码抽象的数字概念以及代数规则。但是，人和动物的大脑对于这种抽象规则的编码是不同的：猕猴对于序列长度的激活脑区与呈现模式的激活脑区是分开的；而在人的大脑激活脑区来看，对于序列两种变化的编码存在很大的重叠，主要集中在IFG （inferior frontal gyrus）和pSTS （posterior superior temporal sulcus），而这些脑区在人类语言的句子处理中同样会被激活。基于这些结果，研究人员推测，人类大脑的语言相关脑区拥有一种更高级的能力，能够将抽象的序列信息组合成统一格式的语言表达方式，而猕猴可能分别理解序列中的数字与属性。

虽然，非人灵长类动物能够学会在听觉序列中检测结构[6]，并能够编码序列中的数字（或长度）信息和代数规则[24-26]。但是，这些实验范式都没有涉及到更高等级的序列编码，无法检测动物对嵌套结构的理解能力。为此，王立平课题组设计了一个新的实验范式——延时序列产生任务（delayed sequence production task）。在这种任务条件下，被试需要根据指定的规则完成序列操作（图3，图4）。研究者比较了两种规则：镜像（mirror）规则，序列具有中央对称嵌套结构，如ABC|CBA（图5）；重复（repeat）规则，序列刺激间具有交叉依赖（cross-dependency）特征，如ABC|ABC。形式语言理论认为，完成这两种规则的操作，需要使用到超常规语法（supra-regular grammar）。迄今为止还没有证据表明非人类动物能够理解超常规语法[10， 11]。

图3。示意图：猕猴在完成任务

图4。实验范式：屏幕上有六个固定位置的白色空心点，学习阶段，让动物观看三个黄色的点相继出现在不同位置后消失；学习结束后，动物根据不同的提示（cue）用手指按照刚刚黄点出现的顺序（或相反顺序）触摸相应位置的白色空心点。

图5。镜像规则是一种嵌套

采用延时序列产生任务，王立平课题组首次证明猕猴可以产生超常规语法（重复或镜像规则）构成的序列。并且，猕猴可以将习得的语法泛化到不同的形状（如金字塔型或直线型等）以及不同长度的序列中（从长度为2或3泛化到长度为4或5）（图6）。此外，猕猴还可以将两种不同的规则组合在一起，处理具有两层等级结构的复杂序列。

序列长度泛化（上）及形状泛化（下）

尽管大鼠[27]，鸟类[28， 29]和少数非人灵长类动物[6， 30]可以识别模式声音串中的统计关系和代数规则，但它们的自发产生能力（例如发声或身体运动）并没有表现出这样的抽象规律。该研究采用的新颖的空间序列产生范式，第一次证明猕猴拥有产生复杂语法结构的能力。

此项研究结果质疑了乔姆斯基层级结构中人类和非人类动物对于regular和supra-regular（上下文无关或少关联）语法之间理解能力不同的观点[10， 12， 14， 31]（图7）。人类与非人类动物之间在规则学习能力上的界限需要重新考虑，并不像目前假设的那样清晰[11]。

图7。乔姆斯基层级结构（Chomsky hierarchy）：按照语法的生成能力，将计算语言按照复杂程度归类。最外圈囊括的是一切可被图灵机识别的语言（0型文法，递归可枚举语言）。乔姆斯基认为，人类语言处于context-free language （Ⅱ型文法）与context-sensitive language（Ⅰ型文法）之间，动物只拥有regular language这种Ⅲ型文法。大于regular范围的文法称为supra-regular system。

作为参照，研究人员还测试了学龄前儿童的复杂规则学习能力。与猕猴相比，学龄前儿童习得相同语法的速度要快得多。这一发现与最近的神经网络模拟实验相似：传统神经网络虽然在序列学习中最终可以习得递归语法，但这个过程需要大而复杂的训练集；而采用嵌套树状结构的神经网络却能很快的习得复杂的语法[32-34]。即使在经过大量的强化训练后，猕猴在操作长度为4的序列时仍然依赖于简单的有序记忆进行编码，而学龄前儿童则会自发的使用组块和几何结构来压缩信息。这样的结果提示我们，人类大脑中可能拥有动物不具有的计算系统，该系统能让研究人员在归纳学习中通过信息压缩高效的进行序列表征[35， 36]。

综上所述，研究人员的研究结果表明，猕猴对超常规结构的学习没有根本的障碍。人类的独特性可能并不是独自拥有习得超常规结构的能力，而是在于学习这种结构的快速性，以及在结构操作过程中使用到的某些人类特有的结构敏感算法[36-38]。前人大量的研究表明，人类大脑左侧的Broca区和pSTS脑区与人工语法中等级结构的编码相关[39-42]，这些大脑激活网络是否可以推广到猕猴上还没有定论。通过建立研究嵌套结构的行为学范式和动物模型，王立平课题组正在结合前沿的神经科学方式（功能磁共振成像及单细胞记录等）探究其神经层面上的机制。

华东师范大学心理与认知科学学院博士生姜新剑和中科院神经科学研究所博士生龙腾海为本文共同第一作者，王立平研究员为通讯作者。

参考文献

1。 Catherine Hayes （1951）， The Ape in Our House。 NewYork： Harper

2。 Terrace H S， Petitto L A， Sanders R J， et al。 Can anape create a sentence？[J]。 Science， 1979， 206（4421）： 891-902。

3。 LASHLEY K S。 The problem of serial order in behavior [J]。 In Cerebral Mechanisms in Behavior： The Hixon Symposium， LA Jeffress， ed （Wiley）， 1951， pp。 112–46。

4。 CHOMSKY N。 Three models for the description of language [J]。 IRE Transactions on information theory， 1956， 2（3）： 113-24。

5。 DEHAENE S， MEYNIEL F， WACONGNE C， et al。 The Neural Representation of Sequences： From Transition Probabilities to Algebraic Patterns and Linguistic Trees [J]。 Neuron， 2015， 88（1）： 2-19。

6。 WILSON B， SLATER H， KIKUCHI Y， et al。 Auditory artificial grammar learning in macaque and marmoset monkeys [J]。 Journal of Neuroscience， 2013， 33（48）： 18825-35。

7。 FUJII N， GRAYBIEL A M。 Representation of action sequence boundaries by macaque prefrontal cortical neurons [J]。 Science， 2003， 301（5637）： 1246-9。

8。 BRANNON E M， TERRACE H S。 Ordering of the numerosities 1 to 9 by monkeys [J]。 Science， 1998， 282（5389）： 746-9。

9。 SHIMA K， ISODA M， MUSHIAKE H， et al。 Categorization of behavioural sequences in the prefrontal cortex [J]。 Nature， 2007， 445（7125）： 315。

10。 FITCH W T。 Empirical approaches to the study of language evolution [J]。 Psychonomic Bulletin & Review， 2017， 24（1）： 3-33。

11。 TEN CATE C。 Assessing the uniqueness of language： Animal grammatical abilities take center stage [J]。 Psychon Bull Rev， 2017， 24（1）： 91-6。

12。 FITCH W T， HAUSER M D。 Computational constraints on syntactic processing in a nonhuman primate [J]。 Science， 2004， 303（5656）： 377-80。

13。 FITCH W T。 Toward a computational framework for cognitive biology： unifying approaches from cognitive neuroscience and comparative cognition [J]。 Physics of Life Reviews， 2014， 11（3）： 329-64。

14。 HAUSER M D， CHOMSKY N， FITCH W T。 The faculty of language： what is it， who has it， and how did it evolve？ [J]。 science， 2002， 298（5598）： 1569-79。

15。 PENN D C， HOLYOAK K J， POVINELLI D J。 Darwin‘s mistake： Explaining the discontinuity between human and nonhuman minds [J]。 Behavioral and Brain Sciences， 2008， 31（2）： 109-30。

16。 GENTNER T Q， FENN K M， MARGOLIASH D， et al。 Recursive syntactic pattern learning by songbirds [J]。 Nature， 2006， 440（7088）： 1204。

17。 ABE K， WATANABE D。 Songbirds possess the spontaneous ability to discriminate syntactic rules [J]。 Nature neuroscience， 2011， 14（8）： 1067-74。

18。 REY A， PERRUCHET P， FAGOT J。 Centre-embedded structures are a by-product of associative learning and working memory constraints： evidence from baboons （Papio Papio） [J]。 Cognition， 2012， 123（1）： 180-4。

19。 VAN HEIJNINGEN C A， DE VISSER J， ZUIDEMA W， et al。 Simple rules can explain discrimination of putative recursive syntactic structures by a songbird species [J]。 Proceedings of the National Academy of Sciences， 2009， 106（48）： 20538-43。

20。 BECKERS G J， BOLHUIS J J， OKANOYA K， et al。 Birdsong neurolinguistics： Songbird context-free grammar claim is premature [J]。 Neuroreport， 2012， 23（3）： 139-45。

21。 FITCH W T， FRIEDERICI A D。 Artificial grammar learning meets formal language theory： an overview [J]。 Phil Trans R Soc B， 2012， 367（1598）： 1933-55。

22。 TEN CATE C， OKANOYA K。 Revisiting the syntactic abilities of non-human animals： natural vocalizations and artificial grammar learning [J]。 Philosophical Transactions of the Royal Society of London B： Biological Sciences， 2012， 367（1598）： 1984-94。

23。 POLETIEK F H， FITZ H， BOCANEGRA B R。 What baboons can （not） tell us about natural language grammars [J]。 Cognition， 2015， 151（108-12。

24。 WANG L， UHRIG L， JARRAYA B， et al。 Representation of numerical and sequential patterns in macaque and human brains [J]。 Current Biology， 2015， 25（15）： 1966-74。

25。 NIEDER A， DIESTER I， TUDUSCIUC O。 Temporal and spatial enumeration processes in the primate parietal cortex [J]。 Science， 2006， 313（5792）： 1431-5。

26。 NIEDER A。 Supramodal numerosity selectivity of neurons in primate prefrontal and posterior parietal cortices [J]。 Proceedings of the National Academy of Sciences， 2012， 109（29）： 11860-5。

27。 MURPHY R A， MONDRAG N E， MURPHY V A。 Rule learning by rats [J]。 Science， 2008， 319（5871）： 1849-51。

28。 SPIERINGS M J， TEN CATE C。 Budgerigars and zebra finches differ in how they generalize in an artificial grammar learning experiment [J]。 Proceedings of the National Academy of Sciences of the United States of America， 2016， 113（27）： E3977-E84。

29。 BERWICK R C， OKANOYA K， BECKERS G J L， et al。 Songs to syntax： the linguistics of birdsong [J]。 Trends in Cognitive Sciences， 2011， 15（3）： 113-21。

30。 SONNWEBER R， RAVIGNANI A， FITCH W T。 Non-adjacent visual dependency learning in chimpanzees [J]。 Animal cognition， 2015， 18（3）： 733-45。

31。 JAGER G， ROGERS J。 Formal language theory： refining the Chomsky hierarchy [J]。 Philos Trans R Soc Lond B Biol Sci， 2012， 367（1598）： 1956-70。

32。 ZHU X， SOBHANI P， GUO H。 Long Short-Term Memory Over Tree Structures [J]。 2015，

33。 LINZEN T， DUPOUX E， GOLDBERG Y。 Assessing the Ability of LSTMs to Learn Syntax-Sensitive Dependencies [J]。 2016，

34。 BOWMAN S R， MANNING C D， POTTS C。 Tree-structured composition in neural networks without tree-structured architectures； proceedings of the Th International Conference on Cognitive Computation： Integrating Neural and Symbolic Approaches， F， 2015 [C]。

35。 KEMP C， TENENBAUM J B。 The discovery of structural form [J]。 Proc Natl Acad Sci U S A， 2008， 105（31）： 10687-92。

36。 AMALRIC M， WANG L， PICA P， et al。 The language of geometry： Fast comprehension of geometrical primitives and rules in human adults and preschoolers [J]。 PLoS computational biology， 2017， 13（1）： e1005273。

37。 YANG C。 The Price of Linguistic Productivity [J]。 2016，

38。 KEMP C， TENENBAUM J B。 The discovery of structural form [J]。 Proceedings of the National Academy of Sciences of the United States of America， 2008， 105（31）： 10687-92。

39。 BAHLMANN J， SCHUBOTZ R I， FRIEDERICI A D。 Hierarchical artificial grammar processing engages Broca‘s area [J]。 Neuroimage， 2008， 42（2）： 525-34。

40。 MAKUUCHI M， BAHLMANN J， ANWANDER A， et al。 Segregating the core computational faculty of human language from working memory [J]。 Proceedings of the National Academy of Sciences， 2009， 106（20）： 8362-7。

41。 KOECHLIN E， JUBAULT T。 Broca‘s area and the hierarchical organization of human behavior [J]。 Neuron， 2006， 50（6）： 963-74。

42。 HILL J， INDER T， NEIL J， et al。 Similar patterns of cortical expansion during human development and evolution [J]。 Proc Natl Acad Sci U S A， 2010， 107（29）： 13135-40。

猕猴学会嵌套性语法结构 动物也能掌握复杂规则！

新浪科技综合

猕猴学会嵌套性语法结构动物也能掌握复杂规则！