王学典:将评估学术的权力还给学术界

王学典:将评估学术的权力还给学术界
将评估学术的权力还给学术界作者:王学典(山东大学儒学高等研究院执行院长、国际儒学联合会副会长)原载于《澳门理工学报》(人文社会科学版)2020年第2期2020年2月 , 教育部、科技部联合发文 , 紧急叫停科技领域已泛滥成灾的SCI论文至上的做法 , 强力纠正学术评价中的不良导向 。 这既是对当前突发事件的应激反应 , 更是对近年来学术界、期刊界相关呼吁的有力回应 , 这一举动值得赞赏 。 官学两界坐下来郑重思考与讨论学术评价问题的机会终于到来 。01只有深谙学术研究之道方能担当学术评价之责一段时间以来 , 对以SCI论文为代表的量化工具的盲目滥用败坏了自然科学研究的学术风气 , 已成为我国科学事业发展的一种桎梏、一个陷阱 。 尤其是 , 对所谓权威刊物、顶级刊物的崇拜已经到了无以复加的地步 , 发表一篇高级别刊物论文形同加冕 , 若干著名编辑部因此已成无冕之王 。 而且 , 这种SCI论文至上的做法业已蔓延到人文社科领域 , SSCI成为学术评价指标中的新宠 。 我们人文社科研究也正在走上片面迎合量化标准的道路 。 唐德刚先生早就指出:美国学界的规则是 , 不出版就死亡 , 只有那些读三本书能写五本书的人才能生存下去 。 当下中国学界已有过之而无不及 。 由于舍本逐末 , 买椟还珠 , 结果只能是指标越亮丽 , 学术越平庸 , 表面的繁荣掩盖了内在的匮乏 。 文件的发布实际上提出了一个至为重大的问题:学术究竟如何评价、由谁来评价?这一问题的提出 , 将为拯救病入膏肓的科研评价体制带来希望 。 当然我们也清醒地认识到 , 科研评价体制的改革是一项系统工程 , 肯定要经历一个漫长的过程 , 无法指望一纸文件就能一举解决目前丛生的乱象 。在笔者看来 , 学术评价归根结底是学术界内部的事情 , 是一项专业性极强、具有较高门槛的工作 , 具有一定学术资质是从事学术评价活动的前提 。 它实质上是学术共同体内的一种自我认定、自我调控 。 学术评价不能独立于学术研究之外 , 二者是连体共生的 。 学术评价必须遵循学术研究自身的逻辑和行规 , 只有深谙学术研究之道方能担当学术评价之责 。 学术评价被期刊等级牵着鼻子走的状况 , 再也不能继续下去了!另外 , 一个认识上的误区也加剧了量化标准的滥用 。 即为了减少主观因素的干扰 , 人们试图寻找一个考量学术水平的客观标准 。 这种标准还最好能够量化为若干指标 , 进而依据这些指标的高低排序来评定学术和学者 。 实践证明 , 这一做法是失败的 , 定量分析不能代替定性分析 , 复杂的价值判断终究无法化约为简单的事实判断 。 严格意义上 , 学术评价是无法量化、指标化和客观化的 。 学术评价的主要途径应该是软性的同行评议 , 这本质上是一种主观性很强的活动 。 笔者相信 , 只要在一定的制度保障和约束下 , 主观性的评价是有望能达到结果上的客观公正的 。学术共同体内部的学术评价究竟如何进行 , 离开了量化指标 , 是否就会随心所欲 , 无章可循?答案当然是否定的 。 学术界对什么样的学术成果是有价值的 , 其实是有公认的原则和标准的 , 只不过这些原则和标准外行人难以把握和操作罢了 。 当然这些标准也并非完全不足为外人道也 。02选题质量高低关乎学术价值大小著名史学家何炳棣先生说 , 清华学人有一种傲人的自我期待:不管搞哪一行 , 绝不做第二等的题目 , 要做就做“头等大题目” , 第一流的大学问 。 研究选题的意义于此可见 。 我们现在的项目评审一般都将选题价值放在首位 , 这无疑是正确的 。 选题处于科研工作的起点 , 寻找到一个好的选题就意味着成功了一半 。 填补空白的题目自然不必多说 , 但这样的题目少之又少 。 一般说来 , 研究选题是否具有学术价值 , 取决于在本学科领域是否具有公认的重要性 。 以中国近现代学术史为例 , 有关梁启超、胡适、郭沫若等学术名家的研究就具有重要性 , 不过 , 这一方面的研究成果车载斗量 , 必须从新的角度切入 。 这当然并不意味著名不见经传的小人物就完全不重要 , 不值得研究 , 但关于小人物的研究应当与学术史上的重要现象、重要问题相关联才能凸显其意义 。 民国学者张荫麟曾就中国通史编纂提出取材的四种标准:“新异性的标准”、“实效的标准”、“文化价值的标准”、“现状渊源的标准” 。 这些标准同样可以移用于学术选题 。 满足一种或几种标准的选题才称得上是优秀的选题 。这里需要特别指出 , 目前史学领域存在一种“碎片化”倾向 。 一些学者以小为美 , 沉醉于细枝末节、边缘角落的发掘而不可自拔 , 明察秋毫之末而不见舆薪 。 “宏大”与“碎片”的关系当然是辩证的 , 是互补的 , 当下的问题是 , 在浩瀚的史学海洋上 , 已看不见泰坦尼克号 , 到处都是小舢板云集 。 在“碎片化”的视野中 , 历史像一颗摔碎的油珠 , 再也无法聚拢起来 。 这种缺少“宏大”关怀的碎片式研究题目的重要性当然要大打折扣 。 所有的碎片固然都值得研究 , 但它们对本学科领域的意义却无法与那些攸关全域的中心题目相提并论 。 还有一些学者专找冷门、偏门的题目去做 , 恃为独门绝学 , 以此为成功的终南捷径 。 冷门、偏门的题目当然需要有人来研究 , 但其价值也不应高估 。 尽管目前是专题治学的时代 , 但一味地以小为尚、唯冷是崇则是一种偏颇 。选题的前沿性、新颖性也非常重要 。 一个选题应当追踪学科发展的新动向 , 甚至预示未来学术发展的趋势 , 具有开拓性和前瞻性 。 前沿研究往往提出前人所未提出的新问题 , 涉足尚待开发的处女地 。 前沿性的题目对学科发展具有较大推动作用 , 提供新视角 , 开辟新领域 , 应用新方法 , 找到新的增长点 , 甚至能为后学“开无数新门径” , “开许多新生路” 。 前沿性题目常常来自学科交叉地带 , 由不同学科的碰撞产生火花 。 如近年来出现的性别史、概念史以及新文化史 , 都属于前沿性研究 。 相对于传统题目 , 前沿性题目优势明显 , 它给人带来耳目一新的感觉 , 更容易引起研究者和阅读者的兴趣 。 但学术研究也不能一味趋新求异 , 随波逐流 , 新课题也同样必须兼具相当的重要性 。 传统题目当然也不是可以完全弃之不顾 , 置之于新的视角下也有可能转化为前沿性题目 。03功力与见识含量的多少决定学术分量的厚薄体现在具体学术成果中研究者的功力与见识的深浅 , 无疑是判断学术价值高下的另一重要标准 。 对人文学科而言 , 论文和专著是两种最基本的呈现形式 , 因此成为学术评价的主要对象 。 评判一篇论文或一部专著时 , 人们往往从两个角度着眼:一是看是否有功力;再就是看是否有见识、思想、洞察力 , 见解是否深刻 , 是否能揭示现象背后隐藏的事理 。 功力和见识同时达到炉火纯青、高度互动的 , 比较少见 。 多数论著 , 要么长于功力 , 要么以见解取胜 。 功力与见识同臻极境者堪称大师 , 而对大多数人而言 , 则必有一偏 。 这反映的是人们治学路数的偏好和追求 。著名历史学家翦伯赞曾提出过史学研究的“三基” , 即基本理论、基本知识和基本技能 。 这都属于学术功力 。 功力体现出一个人在读书治学上所下功夫的多少深浅 。 所谓“真积力久则入 , 学至乎没而后止也” , “人之于文学也 , 犹玉之于琢磨也” , 等等 , 强调的都是学问的积累问题 , 在某一领域某一方向用功多少的问题 。 以季羡林先生的糖史研究为例 , 他十余年里一直关注着“糖”的问题 , 遨游书海 , 力求在史料上做到涸泽而渔 , 其展现的功力令人叹为观止 。 除了收集材料的能力之外 , 功力还指你对治学工具和相关辅助学科掌握的多少 , 这是能否在某一领域做出成就的必备条件 。 当然 , 功力也指对专业基本典籍的掌握程度 。 所有成功的学者对本方向的基本典籍无不烂熟于心 。 为陈寅恪所推重的黄庭坚早就告诫人们“读书欲精不欲博 , 用心欲纯不欲杂” , 带有经典性质的书必须溶化到血液里 。 绕过基本典籍不读而企图走捷径速成 , 内行人一眼就能看出破绽 。就目前的学术规范而言 , 功力还要包括对相关研究现状的了解和把握 。 学术研究是一个不断累积的过程 , 充分消化前人成果才能站在巨人的肩膀上 , 才能推陈出新、后来居上 。 对前人的既有成果视而不见 , 对当前学术行情茫然无知 , 完全从个人兴趣出发自抒胸臆 , 难以形成与学术界的有效对话 , 这类研究很难说有多大的学术价值 , 往往只能得到差评 。至于见识 , 昔贤有言:“才须学也 , 学贵识也” , 说的就是见识对于学问的重要 。 具有深刻、独到的见识才称得上是上乘之作 , 才能列为优等 。 学者好比是蚕 , 蚕吃桑叶 , 吐出丝来 , 然后用丝来编织出锦绣文章 , 而不是吃桑叶吐桑叶 , 把桑叶大量堆积在文章当中 。 论著中必须体现作者的见解和思想 。 真正有价值的作品 , 必然闪耀着思想的光芒 。 目前许多论文中普遍存在有学无识的弊端 , 通篇只是堆砌材料、转录材料 , 靠材料膨胀篇幅 , 用大段引文来注水 , 通过炫耀表面上的博学来掩饰思想的贫弱 。 文章自始至终 , 只能感受到前人在哪里 , 别人在哪里 , 而感受不到作者自己在哪里 , 找不到作者自己的分析和判断 。 这种以罗列材料为主的论著充其量是概述性的、笼统的 , 缺乏明确的问题意识和核心概念支撑 , 这是没有见识的结果 , 是创造力、洞察力与思维穿透力短缺的表现 。 当然 , 对见识的有无或高低的判断带有很强的主观性 , 可谓见仁见智 , 在具体的学术评价中是最难把握的 。 不得不承认 , 见解越独到、越犀利、越超前 , 就有可能越难以被大多数人所认可 。 这是对学术评价者的一种挑战和考验 , 需要具有能够容忍异见甚至异端的气度和胸怀 。04能否进入学术史是估量科学研究价值的最终尺度学术成果是否具有学术史的价值 , 应该成为学术评价的终极尺度 。 学术评价必须引入学术史的维度 。 学术研究通常是一种长线的事业 , 应当具有长远的眼光 , 学术评价同样如此 。 学术评价不能只关注短期效应 , 而要从整个学术史的长河中进行观察 。 真正有价值的学术成果必将被写入学术史而为后来者所铭记 。 所谓具有学术史意义的成果 , 大致包括两类:一类是具有范式革命的意义 , 比如胡适的《中国哲学史大纲》、郭沫若的《中国古代社会研究》 , “足以转移一时之风气 , 而示来者以轨则”;一类是具有局部突破意义 , 或是在某个问题上推翻前人结论提出新的认识 , 或是通过发现新材料、应用新方法将某一问题的研究推进一步 。 二者的学术史意义当然不能等量齐观 , 前者引发学术研究的突变 , 后者带来学术研究的渐变 。 前者通常出自大家手笔 , 因缘际会而成经典 , 可遇而不可求;后者来自辛勤耕耘者的常规研究 , 是经常出现的 , 也是学术评价中最常见的情形 。 我们当然不必用衡量经典的标准苛求全部学术成果 。若涉及对某位学者的评价 , 也需要具备一种学术史的视野 , 进行学术史的定位 。 一位优秀的学者应当是有资格进入学术史的 。 他通常是在某一具有重要性或前沿性的领域或方向从事研究 , 沉潜积淀有年 , 而且取得实际的建树 , 占领了学术制高点 , 具有一定的声望和良好的口碑 。 他是某一领域的佼佼者或代表性人物 , 他的名字是与某个领域联系在一起的 , 一涉及这个领域就想到他的名字 , 这就说明他在学术史上占有了一席之地 , 就像周汝昌先生之于红楼梦研究 , 陈寅恪先生之于魏晋隋唐史研究 , 吴晗先生之于明史研究 , 罗尔纲先生之于太平天国史研究 , 童书业先生之于春秋史研究 , 杨宽先生之于战国史研究等等 。 在对学者进行评价时 , 应当将这类学者优先选拔出来 。近来 , 作为“以质为主”评价标准的代表作制度 , 呼声很高 。 这里需要强调的是 , 代表作绝不只是学者个人的代表作 , 同时更应是本领域、本方向或某一问题研究上的代表作 。 是不是代表作关键在于其有无学术史的价值 。 我们现在的评价标准中还有所谓衡量学者学术贡献度的提议 。 学术贡献度的评判不能只通过横向比较完成 , 更离不开学术史的标准 。 其实 , 早在1932年傅斯年在谈到大学教授资格评定时即已提出 , “此学人更有一种重要著作 , 成为一种不可忽略之贡献者 , 由此会审定其有大学教授资格” 。 1947年出台的《中央研究院组织法》中规定评选院士的资格之一为“对于所专习之学术有特殊之著作发明或贡献者” 。 其中所说的“不可忽略之贡献”、“特殊之著作发明或贡献”均含有一种学术史价值的意味 。 总之 , 学术史的评价是学术评价中不可或缺的一种尺度 , 一种终极尺度 。 只有依据学术史标准 , 才能真正实现淘汰庸才 , 优中选优 , 形成一种正向的激励效应 。05学术管理必须尊重学术的本性如何处理好学者治学与科研管理之间的矛盾 , 是当下学术评价之所以成为问题的关键 。 管理者总是喜欢一刀切 , 喜欢用指标、数据、统计、报表、量化等工具来考核学术 。 而上述几乎所有考核手段和措施 , 均违背学术的本性 , 而且在相当大的程度上戕害着学术 , 乃至摧残着学术!在这里 , 有必要澄清下面几点认识:第一 , 能力与成果之间是不能画等号的 , 也就是说 , 有能力取得某种成果绝不能与最终成果本身画等号 。 譬如说 , 现在上上下下都以项目多少论英雄 , 实际上 , 项目包括国家社科基金重大项目和教育部重大攻关项目 , 仅仅是能力的标志之一 , 任何项目都绝不能与已有成果画等号 , 尤其不能高于已有成果 , 出水才看两腿泥 , 货色才是最重要的 。 项目仅仅是创造成果的条件 , 不是成果本身!第二 , 出版物也不等于成果 。 成果包括SCI论文和所谓顶级期刊论文都是出版物 , 但并非所有的出版物都是成果 , 并非所有的铅字都是学术 , 只有那些在知识增长中有意义的出版物 , 只有那些要么有功力、要么有见识的出版物 , 才是成果 , 才是学术 。 所以 , 出版物的多少 , 严格地讲 , 与学术无关 。 第三 , 学术业绩与学术水平是不能画等号的 。 在晋升职称、评聘博导和岗位定级等学术评价活动中 , 我们常常用业绩评估代替了水平鉴定 , 更看重的是项目多少、论文篇数、著作若干和获奖等级 , 这些充其量只是学术业绩 , 不是学术本身 。 应该看到 , 那些有影响力、有代表性、有地位的学者本身才是最大的成果 , 学术业绩绝不能与学术声望相提并论 。 声望与地位才是一个学者最根本的标志 。 一个在各方面都达标、符合种种数量要求、除了学术之外什么都有的学者 , 有可能是一个没有任何学术声望或声望很差、在学术上没有任何贡献的教授 。从血管里流出来的都是血 , 从水管里流出来的都是水 , 而任何“一刀切”的简单量化考核 , 都不足以辨认学术上的“血”与“水” , 尤其辨认不出哪个是“血管” , 哪个是“水管”!因此 , 学术管理尤其必须回到学术的本性上来 。 应该看到 , 学术研究的质量在任何时候都高于名分、高于项目、高于出版物的数量 。 最后能否进入学术史 , 才应该是衡量一个学者是否成功以及地位高低的最终标尺 。必须指出 , 此次教育部、科技部联合发文纠正“SCI崇拜” , 具有重要的意义 。 要深刻认识论文“SCI崇拜”带来的负面影响 。 相比一刀割除这一“病灶” , 科研管理者更应该反思造成“SCI崇拜”泛滥的深层次原因 , 尤其需要对这些年科研管理的价值观、目标、方法进行反思 。 只有管理者进行深刻的自我反思 , 并在此基础上对科研管理体制进行系统的根本的改革 , 这次的“断腕”之举才能显示其真正的意义 。 否者 , 它所引起的只是一个孤立的物理变化 , 而不是整体上发生质变的化学变化 。 我们必须大声疾呼:科研管理再也不能继续那种以简简单单的条条框框来衡量高度复杂的科研活动的局面了 。06寄希望于一个独立与成熟的学术共同体的形成从根本上说 , 科研评价机制的健全和完善最终有赖于学术共同体的独立和成熟 。 学术评价的主体应该是学术共同体 。 一个自治、自由的学术共同体 , 是学术评价达到最大限度的客观公正的前提和基础 。 一个真正的学术共同体完全可以维持自身的新陈代谢和生态平衡 。 我们以往的失误在于过度依赖行政管理部门的调节和干预 , 一切服从于行政权力的指挥棒 , 学术共同体的能动性未能充分发挥出来 。 行政力量介入和干预越多 , 则学术乱象和学术腐败越多 , 异化越严重 , 从而陷入越管越乱、越乱越管的恶性循环之中 。 行政管理部门不妨以退为进 , 做出必要的权力让渡 , 让学术共同体行使学术活动的立法权 , 让学术领域成为一个相对的公共空间 , 方为明智之举 。 培育和维护一个以学术至上为价值基础的学术共同体乃是根本大计和长久之策 。 因此 , 在目前科研评价体制的改革中 , 我们应当让学术评价回归学术本性 , 逐步将学术权力交付学界 , 尊重专家、相信专家、依靠专家 , 发挥同行评议的主体性作用 , 还学术界一片蓝天 。当前最重要的是建立一个良性的学术研究生态 。 学术评价的前提是先要有学术 , 然后才能建立与之契合的评价体系 。 没有良性的学术研究生态 , 根本不可能大规模生产有价值有意义的学术成果 。 在这种情况下 , 要建立有公信力的学术评价体系只能是一种奢望 , 甚至是一种本末倒置 。 在优秀学术成果匮乏的前提下 , 即使有再发达、再完善的学术评价体系 , 也毫无意义 。 当前 , 要提倡“致良知”的研究作风 , 要提倡高度的专业主义 , 要把学术研究从各种庸俗的实用主义束缚下解放出来 。 每当基金发布的时候各种“掮客”四处兜售投标“秘籍”、研究人员挖空心思“投其所好”的各种丑态已经沦为世界笑谈 。 在这种“泛八股主义”的生态下 , 要想生产出值得评价的学术产品谈何容易!而真正的专业主义则要求足够的研究空间和强烈的关注现实的情怀 , 并使学术研究最大限度地遵守学术发展的规律 。 只有这样 , 才能改变劣币驱逐良币的现实 , 建立一个运转机制充满活力的学术共同体 。学术界苦“SCI崇拜”久矣 , 叫停“唯SCI是崇”仅仅是第一步 , 接下来最关键的是制订新的评价指标及体系 。 本文上面仅就学术评价的方向性原则性问题做了探讨 , 如何把这些方向性原则性体现在具体的评价尺度上才是要务 。 极端机械套用某一指标不可取 , 没有考核指标将会引起更大的混乱 。 在某种程度上 , SCI指标设立的初衷也是为了强调一种硬约束 , 甚至是一种没有办法的办法 , 遗憾的是这一办法在应用过程中走向歧途了 。 撤掉SCI指挥棒之后 , 整个学术评价需要重新定向 , 这关乎着未来中国科学研究和学术发展的方向 , 关乎着中国在未来科技舞台上以什么姿态参与竞争 。 这就需要整个学术共同体就此展开充分的讨论 , 形成新的共识 。 要言之 , 制定一个科学的科研评价体系 , 决定着21世纪中国的科研事业能否健康有序地向前发展 , 也决定着能否实现建设名副其实的科研大国、学术强国的宏伟目标 。 中国的科学研究 , 又到了一个重要的关口!


推荐阅读