自律的学术共同体与合理的学术评价作为职业学者,我们取得学位,发表论著,争取课题,得到职位,获得头衔和荣誉,无不需要经过学术评价。我们都有被评价的时候,也有评价别人的机会。学术评价时刻发生在我们身边,构成我们学术生涯的重要内容。可是,据我所知,我们中有不少人并不喜欢学术评价,甚至怀疑它的实际意义。常听人说: “被别人评很痛苦,评别人更痛苦。”这话表明,我们离不开学术评价,可是又难以愉快地接受它。这里就引出了一个十分有趣的问题: 学术评价何以会沦落到“鸡肋”的地步呢? 我们知道,古人论学,有“藏之名山、俟诸后世”的说法; 中国传统学术中长期没有形成系统的评价机制,一部论著的价值,一个学者的地位,大抵取决于同行的“口碑”。良好的“口碑”固然同一定的学术标准相关,但毕竟带有“模糊识别”的性质。而且,人缘、师承和利益,往往对“口碑”产生某种说不清楚的支配性影响。以“口碑”来评价学术,这种风气一直延续到今天。 我们经常会碰到两种反差鲜明的情况: 某些学者,其论著数量不多,书评很少,引用率不高,也几乎没有得过奖,但是在同行中间“口碑”甚好,被公认为学界的重要人物; 另一些学者著述丰赡,书评很多,经常得奖,各种头衔也有一长串,可是在学界却没有什么“口碑”,也谈不上什么地位。系统而严格的学术评价,从理念到制度,再到操作方式,都起源于欧美。欧美现代学术重视即时的发表,离开了发表学术成果的机制和载体,譬如学术会议、专业刊物和出版机构,就几乎无从谈及学术。 公开发表的目的,是要让学术成果为同行所了解,供同行来评价,并给同行的新研究充当继承或超越的对象,从而形成一个知识和思想生产的良性循环。因此,学术评价的本来意义,在于评判学术的进展,鉴别学者的贡献,规范学术行为,激发学者的创造力,以达到推动学术发展的目的。从这个意义上说,没有学术评价,就谈不上真正的学术。另外,对于学者个人来说,学术评价与职位升迁、工作报酬、专业声望和学术地位息息相关; 对于一个以学术为主要事务的机构来说,学术评价则关乎它在本行业中的声誉和竞争力。 学术评价的意义如此重要,在中国何以会蜕变到反面,成为众口一词加以诟病的对象呢? 这肯定是因为其中发生了偏向,产生了流弊。最近十多年来,相关的讨论文章不时见诸报刊和网络,其数量可以百计。论者几乎异口同声地声讨现行学术评价的制度和方式,认为存在若干严重的弊端: 一曰“行政主导”; 二曰“过度量化”; 三曰“以刊评文”。 另外,还有文科学者抱怨说,管理部门普遍采用理工科的模式,片面强调引用率和影响因子,而不顾及文科的特性,违背了人文社会科学研究的“规律”。进而言之,由于学术评价的不合理,以致学术界流弊丛生,丑闻不断,浮躁成风,严重损害了学者的声誉,也阻碍了学术的进步。 为什么学术评价在引进到中国后,其功能和意义会发生这样的“异化”呢?多数论者把责任推到了制度和方式上面。他们认为,学术评价本身是必要的,但是制度和方式不好,以致为祸不浅。基于这种判断,他们提出了技术主义路径的解决方案: 推行“代表作制度”,采用定性与定量相结合的评价方式,或者是“同行评议加适度量化”。还有人提出,要建立合理的期刊体系和标准,使“以刊评文”具备合理性和可操作性。 但是,问题真的是单纯出在制度和方式上面吗? 仅仅是调整制度,改变方式,就能革除学术评价中的流弊,使之成为中国学术发展的推动因素吗? 如果我们从社会和文化的视角来看问题,就可能发现事情不一定是这样简单。任何本身良好的制度和方式,在特定的社会环境中,由文化特性不同的人来操作,就可能产生完全不同的效果。 目前我们在学术评价方面实行的机制和方法,其实都是从欧美引进或仿效而来的。这些起源于欧美、并且长期行之有效的东西,却在中国发生了变异,甚至是“异化”。其中“异化”最明显、危害最严重的,莫过于“同行评议”( peer review)。三百多年前,英国人发明了“同行评议”的办法,以评判科学文献的价值; 后来经许多代人的发展和完善,逐渐运用于论著发表前的评审,论著发表后的评价,学位论文的评审,课题立项和结项的评审,以及学术奖励的评审,成了学术评价的基本方式。中国在什么时候引入“同行评议”,我并不清楚; 但对它近年来所产生的变异和危害,却也有些亲身的观察和体会。 我觉得,促使“同行评议”发生变异的第一个因素,在于权力部门的过度介入。许多由政府机构控制的评审项目,无论立项还是奖励,举凡专家的遴选,评议对象的选定,评议程序的安排,评议结果的确定、公布和利用,全由管理部门一手操控。诚然,管理部门通常组建专家库,采用随机抽取的方式确定评审专家。但是,这个专家库究竟如何产生,专家名单如何敲定,评议人是否回避,这类问题并不明确; 对于评审的方式和程序,参评的专家并没有发言权; 评审的计票,结果的产生,专家通常也不知晓。 现在,越来越多的刊物也采取同行评议的办法,对论文做发表前的鉴定。但是,在专家的选择、评议的方式、评议结果的运用等环节,刊物的负责人和编辑人员掌握着决定权。有时,经几位评议人同时否决的某篇文章,最终仍能见刊。还有刊物自设学术以外的各种内部标准,或者采用“一票否决”,把同行专家的评议置于次要、甚至是无关紧要的位置。 扭曲同行评议的第二个因素或许是人情。我们常说中国是个“人情社会”,表面上的“温情脉脉”让人模糊是非,放弃标准,把学术问题“人情化”,使学术评价成为报答友情、维持脸面或打击对手的手段。在官方主导的评审中,往往强调政策倾斜,特别照顾某些类别的人群或地区,这实际是一种官方“人情”。 在学者方面,基于师承、同学以及利益交换而形成的“人情”,在学术评价中更具有一边倒的影响力。同“人情”相联系是金钱。说项,请客,送礼,以达到影响评议结果的目的,这早已是学术界的积习。一旦有学术评审的事由,评议人总会接到许多的电话、短信和电子邮件,总会遇到来自各种渠道的请托。 虽然也有匿名的机制,但是评议人从论题、风格和论证的内容,都不难猜出其作者。有时,评议人考虑到被评者的切身利益和处境,就以“放人一条生路”为托词,堂而皇之地枉顾学术标准。在会议评审时,参会者相互达成利益交换的默契,不考虑学术因素,心照不宣地瓜分利益,这也几乎成了惯例。即便是正直的人,也因为不愿得罪其他参会者而违心地从众投票。 书评作为同行评议的主要形式,更是“人情”泛滥的重灾区。许多书评乃是请托的产物,有人甚至自己草拟对自己著作的评论,以别人的名义发表。不难想见,这些由“人情”所主宰的同行评议,怎么会看重学术标准、怎么能体现公正呢? “中国式人情”的强大力量,就这样把同行评议变成了学术舞弊的遮羞布。 败坏同行评议的第三个因素,可以说是学术标准的缺失。具体的评议人在学术眼光和判断力方面参差不齐,这是常有的事; 但是,有些学科在整体上缺乏学术标准,不能对一篇论文、一部书稿和一个课题的学术价值做出确切的评价,其评价方式带有“口碑”式的模糊性。 在我参加过的一次学位论文审查会上,虽然好几位与会者不是同一领域的专家,但是都发现某篇论文在论题的界定、材料的运用和立论的方式上,根本不合史学的基本要求,也没有逻辑上的合理性,于是就投了反对票。可是,这篇论文在通讯评议中却得到了全优的评价,在答辩时也被认定为“优秀”。难道所有的评议人都是糊涂昏聩之辈? 难道他们都让人收买了? 肯定不是这样。可能是因为这个学科自身不成熟,还没有形成严格的学术标准。在我们的学术界,这样的学科也许不止一个。 权力支配,人情主导,标准缺失,三者只要居其一,都会使学术评价的意义受到严重损害; 可是,在我们当前的学术评价中,往往是三者一起发生作用,多路夹击,来自欧美的同行评议,怎么可能不水土不服以致彻底变质呢? 细究起来,我们在学术评价中面临的种种问题,固然同制度有关,但并不单纯是制度方面的问题。它们还牵涉社会环境和文化取向。在欧美行之有效的制度,到了中国就发生“橘过淮则枳”的变异,这不由得促使我们反思中国的学术文化。现在各国交流的渠道通畅而便捷,制度的移植和模仿真是轻而易举的事; 但要使制度合理地运作起来,若不从社会和文化着眼,就根本是难以想象的。纯粹的技术主义路径,不可能真正解决学术评价中的问题。 针对当前学术评价的状况,有人提出,只要把学术评价交给学术共同体,许多问题就会迎刃而解。这的确是有见地的主张。可是,我们现在真有学术共同体吗? 就算有,那又是一个什么样的学术共同体呢? 这个学术共同体能够很好地操持学术评价吗? 上面说到的“人情”和标准问题,难道不就是发生在学术共同体内部吗? 如果这个学术共同体充满腐败,缺乏自律,学术评价的权力落到它的手中,还能指望产生良好的结果吗? 以美国学术评价的经验来看,构建自律( 自主) 的学术共同体,既是学术评价存在的前提,也是它良性运作的依托。 自律的学术共同体不是一般意义的学术界,也不是欧洲现代早期那种沙龙式“人文圈”,更不是某种以象征物来维系的“想象的共同体”。它是由学者以专业为基础自愿结成的众多学术团体、学术刊物和学术会议组合而成的。 专业性和自律性是这种学术共同体最突出的特点。专业性消除了学术的泛化,便于形成通行的话语方式和专业标准,这一点不难理解。在这里我想突出强调“自律性”的意义。“自律性”( autonomy) 这个词在哲学、政治学和医学上各有讲究,但我要侧重谈的是另一方面的含义。 在美国,所谓学术共同体的自律性,首先体现为自主结社和自主运作。学者们自愿结成以专业为基础的学术团体,这种团体不是经权力机构的批准而成立,而只是在成立时履行注册等法律手续。学者们自主创办同人性质的专业刊物,这种刊物不为刊号所限,而是借刊号以取得连续出版物的身份。学者们自行召集学术会议,这种会议可以依托学术团体,也可以由学术刊物或学者自己发起。团体、刊物以及其他民间机构还举办学术评奖,以树立学术标杆,鼓励追求精深而高明的学问。 可以说,这种由团体、刊物和会议所构成的组合性学术共同体,不啻是一个开放的学术讨论和批评的空间,是学术秩序的建设者、维护者和监督者。有人说,大学也是某种学术共同体; 但我觉得现代大学更像一种利益共同体,它一方面受行政权力的控制,另一方面又采用资本的运作方式。要求它承担学术共同体的功能,可能是不现实的。 学术共同体的自律性,在美国还表现为“自主立法”。据说,“autonomy”的原意就是“自我立法”。对于学术共同体来说,“自主立法”包括制定学术规范,建立学术标准,形成学术伦理准则。这里的“立法”,当然只是一种“隐喻式”的说法。学术界的“法”不是由立法机构来制定的,而是经过长期积淀而形成的各种惯例和共识,包括学术界共同遵守的研究方式、评价标准、伦理规范和奖惩机制。学术界的“法”既有成文法的精细和明确,也有习惯法的惯性和稳重。最后,这种自律性还落实为学术共同体的自主约束。 学术共同体的成员大都遵从学术规范和专业标准,进而形成认同感和归属感; 学术共同体则通过自主行动来执行学术规则,贯彻学术标准,维持学术秩序。一方面,共同体成员基于信誉、良知和羞耻感,要为自己的学术行为承担责任; 另一方面,共同体则拥有某种“追责”的权力,可以对违规的学者进行处罚。无论是发表还是评议,共同体成员大多能自觉遵循相应的标准和伦理; 违规行为必受到共同体成员的一致谴责。那种为抄袭和剽窃的指控说情、请愿的事,大约是十分罕见的。 美国这种自律的学术共同体,其形成和维持同某些“心灵的习性”和“做事的方式”密切相关,而且也离不开自由、平等和民主的社会政治环境。就我个人在美国的知见而言,各种学术共同体的组织、运作以及风气,都打上了美国社会和文化的鲜明烙印。在那里,人群中形成“自发秩序”的能力是十分突出的,学术的民主和自由也给人深刻的印象。没有什么学术权威是不可质疑的,没有什么学术观点是不可挑战的,也不存在对学界前辈的恭顺和屈从。 学术是自由而开放的领地,任何垄断和霸权都不为共同体所接受; 学术评价也是自由、平等的对话,尖锐的观点对立,激烈的学术争论,通常不涉及个人恩怨和私人感情。同样值得注意的是,无论是学术社团,还是学术刊物,在经济上都不依赖于政府拨款,也不单凭某个人的捐赠,而是依靠学者缴纳的会费以及其他募捐。这种经济上的独立性,是其自主性的基础和保障。 在美国的自律的学术共同体内部,实行一种复合的学术评价机制。这种复合的学术评价机制,对于维持学术界的秩序,鼓励有益的学术探索,惩处学术界的弊端,推动学术的良性发展,具有不可替代的重要意义。这就是说,学术评价应当是、而且从来也是学术共同体的内部事务,不涉及外来权力的干预。虽然政府和大学也可能干涉学术评价,但是这些干涉通常会受到学术共同体的一致抵制。而且,自由表达的权利,终身教职的制度,都能起到保护学者、维护学术共同体的自主性的作用。 就对成果本身的评价而言,自律的学术共同体自主地制定评价的规则、标准和程序,并且主导评价的过程,公布和运用评价的结果。至于“以成果为指标的评价”,也就是借助成果来评价其作者和作者所在的机构,则通常需要学术共同体和相关机构的合作。在对成果本身的评价中,学术共同体采用的是复合评价的制度,包括学术会议的评议和讨论,发表前的评审,发表后的评价,以及学术评奖。 在美国学术界,学术会议自始至终都是一个学术评价的过程。学术会议的组织者对申请参会的论文进行评审; 在会议讨论中,报告、评议和问答等流程,都是对提交的论文进行学术评价。论文和著作在发表之前,须以双向匿名审稿制进行评审,通常由两名同行专家评审; 在出现意见分歧时,另找第三人评议,以多数意见作为取舍的依据。 论文和著作一旦发表,便成为公开评价的对象。专业刊物所组织的书评,乃是这种学术评价的主要方式。这种书评不是作者约请,也不是出版方提供,而是完全由专业期刊自主操作。刊物的编辑遴选拟评书目,再找合适的专家来评议。这种书评一般具有两重功能: 一是鉴定被评著作的学术价值,二是提供最新学术成果的信息。美国许多专业史学刊物都用一半左右的版面来发表书评。 以《美国历史评论》为例,一年仅出五期,而刊登的书评则多达一千来篇。除了发表短篇书评外,许多专业刊物还组织圆桌会议,发表专题文章,对学术趋向和前沿进展加以扫描和“概念化”,并对某些具有重要影响力的著作进行“回顾性”评论。 由此看来,专业学术期刊与其说是发表研究成果的园地,不如说是学术评价的平台。学术评奖则是学术共同体维护学术标准、显示评价权力的又一个重要方式。对于公开发表的论文和著作,学术界以各种名义进行评选和奖励。评出的论著必是当前阶段最优秀的作品,能够体现新的学术风气和研究取向,具有某种标志性的意义。我们知道,同样是评奖,由谁来评,如何评,以及评多少,都直接关系到奖励的真实性和实际意义。 如果评奖由政府主持,那么政治和政策的考虑就会占据优先位置; 如果采取简单的投票方式,就会减损学术的含量; 如果以自我申报为基础,就无异于作者变相索要奖励; 如果一次评出的奖项过多,就等于是滥施荣誉,大大减损奖励的“含金量”。美国的学术评奖通常由学术团体和其他民间机构主持,采取提名制,经过多重筛选,最终获奖的通常只有一种论著。就我所知,美国史学界的成名学者,大多曾有某种论著获得重要的学术奖励,其学术地位便由此奠定。 当然,并不是说美国的学术评价就没有弊端。其实,不少美国学者对他们的学术评价制度和现状也有尖锐的批评。不过,相对说来,我们更应重视其正面的经验。现在不少人反感那种言必称美国的做法,而且还有人呼吁确立中国自己的学术话语权。但是我们不能否认,中国目前通行的学术评价制度和方式,基本上是从欧美引进的; 我们要使学术评价发挥它应当发挥的作用,而不是成为学者的紧箍咒和学术发展的绊脚石,就必须深入了解欧美学术界的经验。 否则,再好的制度,再好的方式,一旦移植过来就会发生变异,甚至完全走到它的反面。抱怨于事无补,自大也不能解决问题,我们现在要做的还是老老实实地反思和借鉴。 对照目前国内学术评价中存在的弊端,我们可能会发现,许多问题都同缺乏自律的学术共同体有关系。为什么权力、人情和金钱能够轻易扭曲学术评价? 为什么许多专业领域长期不能形成有效的学术标准? 如果存在自律的学术共同体,这种状况是不是能够避免或缓解?具体说,管理部门的介入是难以避免的,权力对于学术评价也未必完全有害。特别是在“以成果为指标的评价”中,由于评价的结果直接关系到资源和利益的分配,因而管理机构的作用就更加突出。 我们现在的问题是,在发表、立项、评奖和职称认定等环节,管理机构的权力取代了学术评价。这固然与权力集中、官僚机构膨胀的现状相关,但同样是因为我们没有任何自律的学术共同体来主导学术评价,管理部门的越俎代庖就是顺理成章的了。我们要做的不是继续抱怨行政主导的危害,而是要找到可行的替代方式。 量化的问题也是一样。以发表的数量或论著被转载、被引用的次数,来判断一个学者的创造力及其成果的价值,其好处是清楚而明确,操作性强,可比度高,也便于管理。这种理念出台的初衷,是要梳理知识生产中的继承和创新的关系,后来才被广泛用于评估研究人员的学术业绩。 至于学术产量,也不是完全没有意义的; 优秀学者的高产,总是学术发展的福音。可是,量化为什么会被推到极端,以至出现以字数和篇数来衡量学术贡献的“工分制”呢? 这同样是因为,我们没有任何自律的学术共同体来推行以学术质量为标尺的学术评价,便只有将评价的权力拱手交给偏好量化的管理部门或者是其他官办的评估机构。 对于“以刊评文”的合理性,我们也不宜简单地否定。经过学术界许多年的共同努力,某些刊物取得了公认的声誉,其审稿、用稿、编校、版式、传播和影响力等各个方面,都有高出同类刊物的地方。由于其地位特殊,声望较高,在这样的刊物发表文章,自然就比较难得; 所发表的文章获得更高的评价,也就不是毫无道理的。 在美国史学界,《美国历史评论》、《美国历史杂志》等刊物,也是公认的最重要、最权威的刊物。在学术出版机构中,有些出版社拥有更高的声望,所推出的学术著作更具可信度; 因此,把出版机构的声誉作为判断著作水准的参数,也不是完全没有根据的。可是,如果把刊物和出版机构的声望同论著的质量完全画等号,就成了一个大问题。 我们现在遇到的更大难题是,许多学术刊物并非同人性质,也缺乏专业特色,而且远离学术标准和规范的约束,因而不具备充分的学术信誉; 学术著作的出版则通常采取资助方式,缺少审稿环节,出版后也没有合理的评价机制。这又怎么能充当学术评价的参数呢? 在美国建国时期,有政治精英讨论过谁能享有自由的问题。他们发现,虽然自由是人的属性和追求,但是只有自主的人才能真正享有自由。在当时的语境中,这种说法带有强烈的种族偏见和性别歧视的意蕴。不过,我们如果借用这种观点来看问题,就会加深对学术自由的理解。学术共同体如果要主导学术评价,学者如果要享有学术自由,必须首先具备自律( 自主) 性。 学术评价关乎学术的前途,关乎学者的处境,关乎学术机构的生存,其利其弊都能产生很大的后果,因而不可等闲视之。我们思考和讨论学术评价机制的创新,虽然不一定能收到立竿见影的功效,更不可能解决所有的问题,但终归是有必要和有意义的事情。如果我们止于沉默和安于现状,后世的学者也许会大为惊诧: 居然有这么一代学人,在如此重要的问题上,曾经是如此的浑浑噩噩,无所建树! 本文原载《清华大学学报》(哲社版)2014年第4期,原标题为“自律的学术共同体与合理的学术评价”。注释从略,如需引用,请查阅原文。 作者:李剑鸣,湖南常德人,历史学博士,曾任教于湘潭大学、南开大学和北京大学,现为复旦大学历史学系教授,著有《历史学家的修养和技艺》(备注:此书不知何故,已绝版)、《美国的奠基时代1585-1775》和《文化的边疆:美国印第安人与白人文化关系史论》等。 |