汉语对现代文明的贡献有多大|大象公会汉语是全世界母语人数最多的语言,在中国媒体的报道中,它似乎也是老外最热衷学习的语言。汉语的地位真有中国人想象的那么高吗? 文|刘周岩 据新华社报道,截至 2014 年 3 月,全球汉语学习人数已超过一亿。孔子学院开遍世界、各国中小学生争相学汉语的报道也屡见于国内媒体。似乎今天谁不学汉语,谁就要落后于时代。看起来,汉语已随着中国国力的提升成为除英语外世界上最重要的语言。 可事实真的如此吗? 用户多未必影响大 判断语言影响力的常见标准,是使用这种语言的人数和使用这种语言的国家的国力,按照这两个标准,汉语是当之无愧的世界第二语言。 ▍汉语是世界上母语人数第一的语言,有近 14 亿母语使用者,远大于第二位的六亿母语者的印地-乌尔都语,第三到五位分别是英语、阿拉伯语、西班牙语(图片来源:华盛顿邮报) 从使用人数来讲,汉语是当之无愧的第一大语言。若是考虑国家经济实力(按 GDP 计算),虽不及英语国家总和,但也稳坐第二位。 ▍2003-2010 年间 GDP 按照语言的比例分布,汉语仅次于英语,且占比逐年上升 不过,母语者人数和 GDP,不能直接表征语言本身的信息价值和传播情况。GDP 衡量的是国家经济情况,用它推测该国的语言影响力,实际上是假设了语言与经济情况之间存在正相关性,但这个前提本身并未得到确证。 按照语言自身的标准,中文在“信息产量”上也是绝对的前二。例如期刊文章发表量和互联网信息量,中文都是仅次于英文的世界第二语言。不过这两个标准的问题在于,它们表征的仅仅是信息规模而非“信息质量”。 那么,有没有一种数据,既能反映某种语言产出的信息规模,又可以体现信息的质量,甚至是与其他语言之间的关系呢?有,这就是书籍翻译量。 在各种不同形式的信息载体中,正规出版的纸质书籍往往是较高质量的信息内容,大大过滤了垃圾信息。各种语言间互相翻译的书籍,更是一种二次过滤,因为只有具备较高价值或需求的书籍才会被翻译成其他语言。由此,不同语言的书籍翻译输出和输入数字,可以直观地反映高质量信息的流动、传播方向,以及不同语言在人类知识生产中的地位。 ▍《圣经》不仅是最畅销的书籍,也是被翻译成最多语言的书籍。人类文明中越重要的书籍会被翻译成越多种语言 国际联盟从 1932 年开始就收集各国翻译图书的数据,后来这个任务交由联合国教科文组织负责,建立了世界书籍翻译数据库(UNESCO Index Translationum)。各国政府向联合国教科文组织提供正规出版物中翻译著作的信息,1979 年起的数据都已经完成电子化,可以线上检索。 如果以书籍翻译量作为评判标,中文再也不是世界前二了。根据 2012 年截取的数据(此数据自 1979 年起记录,后文未加特别注明的“翻译量”“翻译排名”等均指这一部分数据),人类社会一共出版大约两百万种翻译书籍(不考虑印数,同一本书的不同译本分别计算)。 其中由中文翻译成外文的书籍一万三千余种,由外文翻译成中文的六万三千余种,合计七万六千种左右,这一数字位于全部语言的第十四位。不仅远远不及英、德、法等语言,也不及许多小语言如丹麦语、捷克语等。 ▍翻译总量前二十的语言,中文仅位列第十四位 翻译数据库所涉及到的超过一千种语言,非常明显地分为四个梯队: 第一梯队是唯一的超核心语言,即英文,全部翻译书籍中约 60%是由英文译出或译为英文; 第二梯队是两个核心语言,德文和法文,各 20%的翻译书籍由它们译出或译入; 第三梯队是五个区域性核心语言,分别是西班牙文、俄文、日文、荷兰文、意大利文,由其中一种语言译出或译入的比例在 5-10%之间; 第四梯队是所有其他语言,即边缘性语言,全部翻译书籍中由其中任意一种语言译出或译入均小于 5%(所有百分比加和应为 200%,因为一本书涉及翻译出与翻译入两种语言,被计算两次)。 由中文译出或译入的书籍,只占人类社会全部翻译书籍的 3%,中文属于第四梯队的边缘性语言。 十三亿人的信息孤岛 翻译规模仅仅是一个方面,另一方面是各语言之间互相翻译的“通道”。全球语言之间的翻译构成一种网络结构,如同高速公路、铁路网,翻译量只能显示“通车量”,在这个网络中的位置以及和其他节点的连接情况决定了这种语言与其他语言的互通程度。 MIT Media Lab 基于这个翻译数据库构建了全球语言网络结构,并计算了每种语言的特征向量中心性(Eigenvector Centrality)。特征向量中心性是网络中某个节点重要性的度量,与这个节点和其他节点的连接权重成正相关。谷歌的页面排名计算即是基于特征向量中心性。我们可以将这个值称为“语言中心性指数”。 ▍基于世界书籍翻译数据的全球语言网络结构。中文是下方的橙色圈“ZHO”。圈的大小表示语言中心性指数;圈的颜色表示语系;连线粗细表示翻译量 ▍各种语言的中心性指数排名,中文位于第二十位 在全球语言网络中,英文处于绝对的中心位置,是信息交互的枢纽,其中心性指数高达 0.90,法文以 0.30 居第二位,德语以 0.26 与法文同处第二梯队。第三梯队中,意大利文借由其在欧洲语言中的重要地位,尤其是和英文、法文、德文的良好信息交互,以 0.09 的中心性位列第三梯队的首位,但按照书籍翻译量排名意大利只是第三梯队的第五。和意大利文情况相反的是日文,因为日文与欧洲语言的信息交互较弱,其中心性指数排名低于翻译量排名。 中文的中心性指数如何呢?很不幸,比按照翻译数量的排名还低,仅以 0.014 的特征向量中心性位于第二十位,这说明中文处在语言网络中的边缘位置。中文与英文、日文两种语言互相翻译较多,而与其他几种主要欧洲语言的翻译则相对较少。中文某种程度上也是一个“区域枢纽”,蒙文、藏文等高度依赖于中文,但这些语言本身即处于世界语言结构非常边缘的位置。 ▍以中文为关注焦点的结构示意图。中文直接与英文相连,此外与日文、韩文联系也较紧密,其他一些语言类似蒙文、藏文等则需要依靠中文作为信息中转枢纽 ▍以英文为关注焦点的结构示意图。英文作为核心中枢,与绝大多数重要语言建立了直接的、大量的信息交互 如果以交通网来比喻语言网络,英文就是北京,是四通八达的核心枢纽,德语、法文是上海、广州等全国性枢纽,日文是区域性枢纽如西安,中文则是西宁,而蒙文、藏文等则是德令哈、刚察。 信息流动更类似于航空而非公路,每一次连接都需要巨大成本,所以不是按照最短距离,而是按照最少连接次数的原则进行传递信息。但不是任意两点之间都可以连接,一个节点只能和上级中枢或周围节点连接。 二十世纪初,中文在世界语言网络中的位置更边缘。鲁迅翻译凡尔纳小说时,即是按日译本译成中文,日译本则是由英译本译出,英译本根据法文原文译出。这样一个法文-英文-日文-中文的途径,非常好的展示了英文作为核心中枢以及日文作为区域中枢的作用。 ▍鲁迅翻译的凡尔纳小说版本 当然,今天中文世界已经有许多直接根据法文原文译出的凡尔纳作品,但是,更小众的信息或是其他边缘性语言的信息想要进入中文世界,仍然要借助其他枢纽的中转,最主要的就是英文枢纽。 所以,虽然中文有着最多的使用人数,占据了世界第二位的 GDP,但在全球语言信息网络中,处于信息的孤岛,外面的信息进来不易,中文世界的信息想传递出去也不易。与中文类似的这种体量大但信息交互性差的语言,还有阿拉伯语。 位置取决于对人类文明的贡献 既然中文有如此多的使用人数,现今中国的国力也不容小觑,那为什么中文仍处在全球语言网络的边缘位置? 究其根本,是中国的文化影响力过低导致了中文的边缘性。 对于上面的判断,有没有什么可以验证的数据呢?有。 MIT 将他们计算出的语言中心性指数与各类数据进行拟合,发现与 Human Accomplishment 中提供的人类知名人士(1800-1950 年)数量存在高度相关性,确定系数 R 平方达 0.858。 |