“我泰山,你简”:随泰山归来的为何没有“原始语言”?

  包罗万象

如果要从人猿泰山系列中挑出一句代表性的话,那无疑是“我泰山,你简。”(Me Tarzan, You Jane.)在好几部电影和动画改编中,这是泰山说出的第一句话。语言是人区别于动物的标识,而这句话,虽然看起来没什么语法,却正是泰山从野蛮人开始向文明人转变的标志。于是,这句话常常被人们作为原始语言的代表而提起。

在最新的泰山系列电影《泰山归来》中,那位美国来的外交官乔治·华盛顿·威廉姆斯就在见面时把这句话模仿了一番——然而泰山可一点都不觉得这样很有趣。电影中的原因,似乎是他在文明和自然之间还游移不定;但此外还有一个制作方都未必想到的更深层的原因——其实,这根本就不是什么“原始语言”。

乔治·华盛顿·威廉姆斯(右)虽然初见面时有点让泰山(左)恼火,但最终还是成了出生入死的朋友……图片来源:《泰山归来》剧照

“我泰山”真的很“原始”吗?

之所以人们会想当然地把“Me Tarzan, You Jane”这个句子视作“原始语言”的代表,大概是因为在英语使用者看来,这个表示“什么是什么”的句子由于缺乏动词而显得结构简陋、语法破碎,甚至恐怕不得不借助肢体语言的帮助才能表达清楚意思,这是多么符合大众对于“原始语言”的想象啊。然而,这种简单地把两个成分连接在一起的表达方式真的“不现代么”?

并不是,人家只是没有用“系词”而已。

何为“系词”(copula)?
人们常常需要对一个事物的名称做出判断(“他是老师。”),或者对其性状做出描述(“这朵花是白的。”),这时,把事物本身(主语)和他对应的名称或性状(谓语,可以是名词、形容词、介词短语等等)这两种语法成分连接起来的就是系词。大多数时候,系词都是动词,所以系词也常被称作系动词(linking verb),系动词后面的成分也被称为表语(predicate),通常和主语在逻辑上是同一个事物(“老师”和“他”是同一个人),或者是主语本身具有的某种特质(“白”是“花”的特质)。

汉语中的“是”,英语中的“be”,德语中的“sein”等等这些都可以用作系词。光从上面例子中我们就会发现,其实在汉语里,在描述性状时系词就不总是必须的,“我是很美的”也可以说成“我很美”,“我是在家的”也可以说成“我在家”,而后者其实是更常见的说法。

从世界范围来看,在表达“什么是什么”或者“什么是怎样的”这类概念时,省略系词是一种很普遍的现象;在一些语言中,这甚至是某些情况下最合乎语法规范的表达方式。这种方式在语言学上被称为“零系词”结构(zero-copula),例如:

俄语:я человек (ya chelovek)  “我是人”
        我   人

阿拉伯语:محمد مهندس (muḥammad muhandis)  “穆罕默德是工程师”
            工程师  穆罕默德

克丘亚语(秘鲁):payqa runam  “他/她是人”
                            他/她       人

卢干达语(乌干达):omuwala mulungi  “这个女孩是美丽的”
                             这个女孩      美丽的

从上面的例子就能看出,“我泰山,你简”这句话或者这种结构并不能称之为“原始”,它只是一种某些语言的使用者所不习惯的表达方式,而对于另一些语言的使用者来说,简直再正确不过了。

冷知识:“Me Tarzan, You Jane.”并非来自电影台词。
尽管这句台词如此出名,但它最早不但不是电影台词,甚至根本就没有出现在故事原作者埃德加·赖斯·巴勒斯(Edgar Rice Burroughs)所写的任何泰山故事中。
事实上,这句话是第一部泰山电影《人猿泰山》中饰演泰山的约翰尼·威斯穆勒(Johnny Weissmuller)在一次采访中说的。当时他开了一句玩笑:“我根本不需要演,只需要说‘我泰山,你简’就行啦。”这句话令人印象很深刻,导致许多人以为它真的是原著或者电影台词,而后来的许多电影和动画改编也真的用了这句话。

真正的原始语言应该是什么样的呢?

说到原始语言,那么就不得不提到语言的起源。

很久以前人们就开始好奇语言的起源了。希罗多德在《历史》一书中记载了一个故事:古埃及第26王朝的法老普撒美提科斯(Psammetichus)曾命人将两个婴儿在羊群中哺育,不准任何人对他们说话,想看看他们在不受任何语言影响的情况下,最先说出的话语是什么样的。记载中,其中一个婴儿发出了“倍科斯”这个音。经过查证,“倍科斯”在弗里吉亚语(Phrygian,古代小亚细亚地区的一种语言)中是“面包”(βεκος/bekos)的意思,于是认定弗里吉亚语是最古老的语言。

当然这种方法并不靠谱——在此之后,神圣罗马帝国皇帝腓特烈二世(Frederick II)、十三世纪的方济各会修士撒林裴尼(Salimbene di Adam)、苏格兰国王詹姆斯四世(James IV)以及莫卧儿帝国皇帝阿克巴一世(Akbar I)都做过类似的实验,而得出的结论各不相同。

为啥这种办法不行呢?大概是因为语言的诞生实在太久远了。现代语言学家们相信,语言的历史几乎和人类的历史一样。由于语言在人类史前极其久远的年代中就已经发展到了成熟的状态(许多学者估计这个年代不晚于十万年前),因此语言起源的过程本身没有留下丝毫的历史痕迹,在今天的世界上也没有找到任何相似的情况可以类比。学者们对于这个问题提出了无数的假说和理论,不过虽然各种理论层出不穷,总体上还是可以分为两大类:渐进式理论和突发式理论。

渐进式理论认为,语言的产生和人类思维的发展一同经历了漫长的演化过程,一开始可能只是由几十个的词和一两种语法设置组成的“粗胎语”,对应着当时人类的思想范围,随后每隔成百上千年,人类开辟出新的思维领域,产生了新的概念,于是词汇和语法规则都会相应地增加,然后是“原初语”(上百个词),然后是“后原初语”,再然后是“前现代语”,直至发展成拥有成千上万的词汇、需要几百页才能描述清楚的语法规则的复杂的现代语言。

按照这个假说,从最早的语言觉醒发展到一种现代语言那样的复杂程度恐怕需要数万年之久,而人类语言的历史也将由此追溯到十五万年前甚至更久远的智人出现之初的年代。大部分的学者认同这一类理论,其中包括著名的语言学家史蒂芬·平克(Steven Pinker)。

突发式理论则认为,早在语言产生之前,人类已经发展出相当成熟的思维能力,拥有了一套完备的思想概念。随后在某一段相当短的时间段内,在某种外在或内在因素的刺激下,语言开始爆发性地产生。人类可能会模仿自然世界的各种声音来给事物命名,随即有关事物性状、行为和动作等概念的名称也会形成,然后是形成了组织这些名称的语法规则,然后是代词,指示词,时间词,等等。这类理论认为,一旦语言开始产生,语言和思维也将相互促进,得到迅速的发展。罗伯特·迪克森(Robert M. W. Dixon)、诺厄·乔姆斯基(Noah Chomsky)都是这类理论的支持者。

遗憾的是,就目前来说,这两类理论都无法得到证实,甚至可以说,关于语言起源的任何假说现在都找不到任何有说服力的证据支撑。(语言学家开玩笑说,如今关于语言起源的假说的数量几乎与此领域中学者的数量一样多。)说到这里我们还会发现,其实我们根本无法回答“原始语言是什么样的”这个问题。达尔文曾写过“我无法怀疑语言的起源应归因于:对于模仿和修正各种自然声音,其他动物的叫声以及人类自己辅以手势和姿势的本能呼喊现象。”近两百年之后,我们对于真正的原始语言的猜想并没有太多新鲜的内容。

例外:尼加拉瓜手语
值得一提的是,在最近几十年,一种被称为尼加拉瓜手语(Nicaraguan Sign Language)的语言引起了语言学家的注意。这种手语最早出现于上世纪七八十年代尼加拉瓜首都马那瓜附近的数所聋哑学校中,几乎是在当地的聋哑人青少年群体中自发形成的。
它从聋哑学生各自在家惯用的简单手势系统开始,逐渐被发展成一种类皮钦语(不同语言的粗糙混杂)的语言形式;当新的学生入学,从高年级的学生那里学到的手语系统会在复杂程度上有所增加,甚至出现了动词一致(verb agreement,比如英语中单数第三人称动词须加词尾-s)等复杂的语法特征,从而发展成为一种类克里奥尔语(由多种语言混合并形成了稳定的语法规则)。
这种语言不仅被创造了出来,还在应用过程像其他自然语言一样开始经历发展和演化。到1997年,使用这种手语的总人数已经达到了3000人,并且开始在尼加拉瓜全国扩散开来。
尽管对于这种手语的研究仍在进行,但语言学家相信,这是历史上绝无仅有的一个事件,让我们可以“第一次和唯一一次看见一个新语言从零开始的形成”(史蒂芬·平克),也将成为迄今为止人类所能发现的关于语言起源问题最丰富的信息来源。

但是话说回来,世界上还有不少“原始部落”,他们说的难道不算“原始语言”吗?我们难道不能找到一个这样的“原始语言”样本来判断吗?

这就是下一个问题了。

今天世界上还有没有原始的语言?

很遗憾,没有。

几乎所有语言学家都同意,某种所谓的“原始语言”在今天的地球上是不存在的。事实上,不仅当今世界上不存在原始语言,在人类目前能够探知的全部时间和空间之中,人们都尚未找到任何“原始语言”留下的确切痕迹。

而对于大众来说,“原始”这个词很容易让人联想起那些生活在荒原、丛林或是孤岛等等偏远地区,远离现代文明的部落。而这些被贴上“落后”或者“未开化”标签的民族所使用的语言也常常被想当然地视作“原始语言”。但是,它们到底哪里原始了呢?

语音简单?

有人会觉得,所谓的“原始语言”只能发出类似咿咿呀呀或者咕噜咕噜的声音,其实很多罕见或者普遍被人难学的发音在这些“原始语言”中却很普遍。

· 喌(zhōu)音(click),一种利用舌头在口腔中抽缩而产生的洪亮的声音,大量出现在非洲南部的柯伊桑语系(Khoisan)中(很多人都会发这个音但不会用在有意义的词汇中)。

这是一段宏语(!Xóõ)故事的节选。那个感叹号也是这种语言名字的一部分。故事大意是一个猎人建议杀跳羚卖皮给白人,换了钱就不用自己打猎了,结果这个猎人一无所获,还饿了肚子。

如果把宏语用文字转写出来,大致是这样的……

· 喷音(ejective),一种通过挤压把咽腔或口腔中的空气喷射出来的声音,在北美原住民语言中分布极为普遍。

· 加拿大的努哈尔克语(Nuxalk)可以整句话都不用一个元音,例如:clhp’xwlhtlhplhhskwts’(“那时他已经得到了一棵草茱萸”),以至于语音学家都不知道该如何划分音节。

努哈尔克语示例。当然这些例子对整个语言来说还是少数派,多数词还是有元音的……但是能找到这么多例子,已经很惊人了。录制:Cosmodox

· 高加索的乌比赫语(Ubykh)拥有84个辅音音位,是已知最庞大最精密的辅音系统(汉语只有22个,英语一般是24个);

· 而如果把复杂的喌音组合都算上,博茨瓦纳的西部宏语(West ǃXoon)拥有包括111种喌音在内的164个不同辅音。

语法结构简单?

还有很多人会觉得所谓的“原始语言”恐怕根本没有语法可言。事实上这些总是被大众轻视的语言,常常在语法形态上表现出极高的复杂性。

· 高加索地区的采兹语(Tsez)拥有64个名词格(拉丁语有6个,德语有4个,英语的名词只剩下属格一种标记,主格和宾格的区别还残存在代词中)。

· 鄂伦春语有5种语态(英语只有主动态和被动态2种)和15种无关时态的语体(英语也只有进行体和完成体2种)。

· 津巴布韦的修纳语拥有20种名词类,而秘鲁的波拉语(Bora)有大约350种;相比之下,英语根本就没有名词类别的区分,被马克吐温专门诅咒过的德语也只有阳性、阴性、中性三种而已。

· 澳大利亚的迪尔巴尔语(Dyirbal)虽然只有四种名词类,但分类的方法却令人费解:I类包括有生命的物体和男人,II类包括女人、水、火、与暴力或危险有关的事物以及几种特定的动物,III类包括可以食用的蔬菜和水果,其他的名词都是IV类。

· 在因纽特语努那维克方言(Nunavik)中,一个动词在不同人称、数量和语体下(还不包括表示时态等的其他词缀)一共有大约850种不同的词尾变化,而英语中最不规则的动词“be”也只有八种变化(be/being/been/am/is/are/was/were)。

语义粗糙不精确?

· 在澳大利亚与巴布亚新几内亚之间托雷斯海峡西部群岛上的卡劳-拉高-亚语(Kalaw Lagaw Ya)对时态有着非常精确的细分,包括三种过去时态(遥远的过去,最近一段时间,今天)和两种将来时态(马上或不久之后,遥远的将来)以及一个现在时。

· 很多亚马逊盆地的语言拥有相当发达的言据性标记,可以准确地说明说话者所说信息的来源方式以及这些信息的可靠程度。在玛蔡斯语(Matses)中,一个有两个妻子的男人,在回答“你有几个妻子”这个问题时,如果他不能立即亲眼看到那两个妻子,他就必须说在“daëd ikoşh”,也就是“之前有两个”,因为哪怕他五分钟前才见过她们,他也无法确定现在那两个妻子是否还在,而不是死了或者跟其他男人跑了。

· 另一扎亚马逊盆地的语言,图尤卡语(Tuyuca)中,存在五种不同的言据性标记,如果我要说“他踢了足球”这句话,我必须根据情况选择下面这五种方式之一:

目睹式(visual):díiga apé-wi
(我亲眼看到他踢了球。)
非目睹式(nonvisual):díiga apé-ti
(我听到了踢球的声音,也听到了他的声音,但没有亲眼看见他踢球。)
显而易见式(apparent):díiga apé-yi
(我看到了他踢了球的证据,比如球场上留下他的与众不同的鞋印,但没有亲眼看见他踢球。)
引述式(secondhand):díiga apé-yigɨ
(有人告诉了我他踢了球这件事。)
推测式(assumed):díiga apé-hĩyi
(他不在家,当时他的球也不见了,所以我有理相信他当时在踢球。)

上面的例子中,动词词尾的后缀是强制性的,否则就不合乎语法规则,而且会被视为撒谎。试想,如果在汉语中也必须表达出类似关于言据性的信息,法官断案的工作将变得多么轻松。

经过上面的谈论,我们就会明白为什么很多语言学家常常不断地告诫公众:第一,没有原始语言;第二,所有语言都“一样”复杂*。无论对于生活远古石器时代的狩猎先民,还是隐居于幽暗热带雨林中的神秘部落,他们的语言在语法形式的方方面面都有可能表现出惊人的复杂性。人类目前已知的每一种语言,都具有同样的潜力表达人类文明中出现的每一个概念。“就语法形式而言,柏拉图与马其顿的猪倌为伴,孔子与阿萨姆的猎头野人同行”,这就是美国语言学家爱德华·萨丕尔对此做出的著名评论。

*语言的复杂性当然会存在差别,然而对于不同语言的使用者而言,“某种语言更难”这样的比较没有统一的判断标准,也无法得出可以量化的结果。语言学家想表达的其实是,每一种语言都有可能在某些方面表现出不同于其他的语言的复杂性,并且有能力——哪怕这种能力不一定会得到应用——表达出任何一种语言中的任何一种复杂概念。

皮拉罕语:一个特殊案例的研究
尽管在复杂性和表达能力上,所有的语言之间相互并没有什么显著的差别,但在与文化形式相关的具体发展程度上却可能表现出很大的差别。一个著名的例子就是丹尼尔·L·埃弗莱特(Daniel L. Everette)对于皮拉罕语(Pirahã)的研究。

语言的一个重要基本特征就是离散无限性,即通过有限的单元结构(发音方式或者语法规则)构造出无限种可能的组合方式(发音组合或者句子)。而逻辑递归能力则是实现这个特征的重要手段。很长一段时间以来,人们相信所有语言的都天然具有逻辑递归能力,也就是把一个层次的概念通过嵌套叠加进另一个层次中,构造出一个更长的句子来,例如:
我的女儿。
(我的女儿)的狗。
(我的女儿的狗)喝水。
他看见(我的女儿的狗喝水)。
……

通过嵌套的的应用,对于有限的给定信息,理论上可能构造出来的句子总数是无限的。但是根据埃弗莱特的研究,皮拉罕人所使用的语言似乎对这个这个理论提出了挑战。在皮拉罕语中,嵌套的结构无法被构造出来,复杂的逻辑层次必须拆分成多个简单分句来表达。比如说,“张三的儿子有一座房子”这个在我们看来非常普通的句子,在皮拉罕语中必须拆分成两个句子才能表达出来:1,张三有一个儿子;2,这个儿子有一座房子。
在另一个例子中,埃弗莱特依据已知的语法形式强制性地构造出了一个嵌套的结构,但对于皮拉罕人而言,这样强行嵌套却是不可接受的:
       *kó’oí hoagí kai gáihií ‘íga.
   人名     儿子   女儿   那个   事实
那是Kó’oí的儿子的女儿。

埃弗莱特认为,在皮拉罕人的社会中,由于人口很少,每一个人都相互认识,在生活中完全不需要用到这种多重限定的方式,因此这种语言形式完全没有得到任何发展。不过在某些特殊情况下,比如在谈及一个大多数人不认识的外族人、必须要给出额外的信息进行限定时,上面的句子则会表达成:
‘ísaabi kai gáihií ‘íga. kó’oí hoagí ‘aisigí -ai.
   人名  女儿   那个   事实   人名  儿子  相同  是
那是Kó’oí的儿子’Ísaabi的女儿。
而这句话字面的意思是:那是’Ísaabi的女儿;Kó’oí的儿子(和’Ísaabi)是同一个(人)。

在另一个实验中,埃弗莱特在桌上摆了两个人偶,首先指着第一个玩偶告诉作为被试者的皮拉罕人说“他杀死了一只美洲豹”,然后指着另一个玩偶说“他杀死了一只鸟”,最后重新指着第一个玩偶说“他摔倒了”。随后拿走玩偶并问被试者“谁摔倒了?”,被试者的回答是“豹子摔倒了”。实际上这个皮拉罕人想表达的是“杀死豹子的人摔倒了”,但是由于皮拉罕语不允许嵌套结构,所以为了和“杀死鸟的人”做出区别,“豹子”这个区分性的信息就替代了“摔倒”的实际主语。

更令人感到惊讶的是,皮拉罕语还有好几个极其不同寻常的特征:没有真正意义上的颜色词,在需要描述特定物体的颜色时会选择身边和该物体颜色的相近的事物来形容,比如“像血一样”就是红色;用baíxi这一个词同时表示父亲和母亲;没有真正意义上的数字词,只能表达相对意义上的hói(较少)和hoí(较多),发音上只有声调的区别;等等。1980年,埃弗莱特曾尝试教会皮拉罕人计数。课程进行了八个月后,仍然没有一个人能够从1数到10,或者计算出3+1甚至1+1等于几。于是皮拉罕人自己得出了结论,那就是他们无法学会这个技能,于是终止了学习。埃弗莱特认为,造成皮拉罕语言缺乏计数能力的原因有三点:首先,皮拉罕人以狩猎和采集为生,没有财产,社会结构又极其简单,所以生活中没有精确计数的需要;其次,皮拉罕人在文化专注于当前发生的事物,对于过去毫无兴趣(没错,关于皮拉罕人的另一个惊人事实是,他们没有超过两代人的历史故事,没有创世神话),因此进一步去除了抽象概念上对计数的需求;第三,计数本身也是一种嵌套的结构,所以缺乏却套结构的皮拉罕语本身也导致了计数的表达难以实现。

这些惊人的结论似乎和前文一直试图表达的观点相悖。难道这种语言真的无法理解嵌套这样的逻辑过程么?真的无法表达出数字、颜色等等这些在我们看来理所当然的概念么?这样的语言难道不能被称为“原始语言”么?

埃弗莱特对此给出了解释。皮拉罕人并非无法理解这些概念。他们明白“Kó’oí的儿子的女儿”指的是谁,只不过他们的语言不允许这样的表达方式;他们理解不同数量的区别,并且能够地完成依赖准确数量认知的任务,只不过他们的语言没有这样一个词语来表达具体的数目。如果有意识地发展语言中的表达方式,经过足够长时间的学习和训练,数目能力和递归能力等等都是可以建立起来的。不过,总的来说尽管皮拉罕语并不能被称为“原始语言”,它仍是一种发展程度较低的语言,对于皮拉罕语的研究,让许许多多关心语言起源和演化的学者们看到了寻找新的研究思路的契机。

结语:语言的多样性

每个人从一出生就开始接触自己的母语,日常生活也无一不在母语的环绕之下,“语言就是母语”的这种想法可以说十分自然。虽然长大后很多人学习接触了第二语言,但绝大多数人的外语都不超过寥寥几种欧洲语言或邻国语言。这让大部分人在看待其他民族和语言的时候,很难摆脱自我中心和西方中心的视角。

然而现实是,这世界的语言多元程度远远超出了大多数人的想象。一个人对世界的看法如此容易受到母语思维习惯的影响,以至于想当然地给那些不了解的事物打上成见的标签。今天的世界需要我们在面对不同的人和事的时候怀抱着更大善意,并作出去理解的尝试。

与此同时,我们还会意识到,这种语言的多样性正受到巨大的威胁,甚至即将消亡。据估计,本世纪初大约还有5000至7000种语言仍在使用,而到本世纪末,至少3/4(甚至90%)的语言将彻底消亡。而就算到今天,这些语言中的将近一半仍然没有得到很好的记录和描写,甚至还鲜为人知。罗伯特·迪克森说,语言是是其使用者的象征。所以,研究语言其实就是研究人类自己。一种语言包含了太多关于人类演化、民族迁徙、社会发展和文明进步的信息,对任何一种语言的记录和归纳,都可能将成为我们通向遥远过去之路的重要基石。毫无疑问,语言学家应当积极地投身于这项迫切的任务之重;而社会要如应对这种多元的消亡,如果帮助语言学家完成这项工作,同样是一个值得思考的问题。

(编辑:Ent)

参考资料和扩展阅读

  1. 查尔斯·达尔文,《人类的由来及性选择》,叶笃庄、杨习之(译)
  2. 盖伊·多伊彻,《话·镜》,王童鹤、杨捷(译)
  3. 胡增益,《鄂伦春语研究》
  4. J. G. 赫尔德,《论语言的起源》,姚小平(译)
  5. 罗伯特·迪克森,《语言兴衰论》,朱晓农、严至诚等(译)
  6. 希罗多德,《历史》,王以铸(译)
  7. 朱晓农,《语音学》
  8. Barry J. Blake, Case
  9. Edward Sapir, Language
  10. Greville G. Corbett, Gender
  11. Maggie Tallerman & Kathleen Gibson, The Oxford Handbook of Language Evolution
  12. Louis-Jacques Dorais, The Language of the Inuit
  13. Christfied Naumann, 2008. The Consonantal System of West ǃXoon
  14. Daniel L. Everett, 2005. Cultural Constraints on Grammar and Cognition in Pirahã: Another Look at the Design Features of Human Language
  15. Janet Barnes, 1984. Evidentials in the Tuyuca Verb
  16. Michael C. Frank, 2008. Number as a Cognitive Technology: Evidence from Pirahã Language and Cognition
  17. Copula (linguistics) https://en.wikipedia.org/wiki/Copula_(linguistics)
  18. Language deprivation experiments https://en.wikipedia.org/wiki/Language_deprivation_experiments
  19. The Origin of Language http://pandora.cii.wwu.edu/vajda/ling201/test1materials/origin_of_language.htm
  20. Origin of language https://en.wikipedia.org/wiki/Origin_of_language
  21. Nicaraguan Sign Language https://en.wikipedia.org/wiki/Nicaraguan_Sign_Language
  22. Nuxalk language https://en.wikipedia.org/wiki/Nuxalk_language
  23. Ubykh language https://en.wikipedia.org/wiki/Ubykh_language
  24. Taa language https://en.wikipedia.org/wiki/Taa_language
  25. Kalaw Lagaw Ya https://en.wikipedia.org/wiki/Kalaw_Lagaw_Ya
  26. The Story behind the Famous Movie Misquote: “Me Tarzan, You Jane.” http://www.thisdayinquotes.com/2010/03/weissmuller-me-tarzan-you-jane.html

 

LEAVE A COMMENT

This site uses Akismet to reduce spam. Learn how your comment data is processed.