首页 > 读刊·中国学派 > 《中国社会科学评价》 > 2022年第3期

智库研究人员评价模型构建的质化研究

2022-12-27 作者：王传毅段戒备来源：《中国社会科学评价》2022年第3期

摘要：建设中国特色新型智库离不开评价的支撑。智库研究人员评价模型立足智库研究的供给者和需求者之间的互动关系，利用对多名政府部门人员、智库研究人员的访谈资料构建而成。该模型包含能力导向和成果导向的两种评价方式。在实际工作中，智库对研究人员评价的指标以成果导向为主，且政府智库、高校智库和社会智库对成果的要求呈现出多样化的特征。政府智库和高校智库均高度重视成果被高级别领导批示和采纳的情况，但在成果形式上政府智库更重视委托研究，高校智库更重视自主性较强的政策研究和论著发表，而企业智库更重视带来“流量”的媒体传播。不同类型智库可按需选择适切指标开展智库研究人员评价。

关键词：智库;研究人员;评价模型;质化研究

作者王传毅，清华大学教育研究院副教授；段戒备，清华大学教育研究院博士生。（北京100084）

　　党的十八大以来，习近平总书记围绕建设中国特色新型智库作出一系列重要论述，为智库建设提供了根本依据。2015年1月20日，中共中央办公厅、国务院办公厅印发了《关于加强中国特色新型智库建设的意见》，提出要“造就一支坚持正确政治方向、德才兼备、富于创新精神的公共政策研究和决策咨询队伍”。智库研究人员的遴选、培养与成长离不开评价的支撑。特别是如何正确发挥评价的导向功能、以评促建、评建结合，依据智库研究特色，制定有针对性的评价体系，引导智库研究人员发挥优势，做出显著特色,产出高水平成果，以科学咨询支撑科学决策，以科学决策引领科学发展，是亟待解决的重要问题。

　　本研究聚焦智库研究人员评价，着力于探讨四个方面：第一部分从已有研究的视角出发，回顾当前评价智库研究人员的主要方法；第二部分立足于智库研究的供给者和需求者（政府）之间的互动关系，讨论如何将已有研究视角形成一个整合的分析框架，既兼顾智库研究人员内隐能力的考察，又关注建立在能力基础之上的成果表达；第三部分依据《关于加强中国特色新型智库建设的意见》对智库的分类，着力考察政府智库、高校智库和社会智库在其研究人员评价上的不同特点；最后对上述讨论进行总结，并尝试提出智库研究人员评价模型。

　　本研究的数据来源有三：（1）对国家三个部委（标记为R1—R2、F1—F2、J1—J2）6位同志的访谈，6位同志均具有回应领导批示、委托研究以及起草部委及以上层次文件的经历；（2）对智库人员的访谈，笔者对5个政府智库（标记为G1—G5）、6所高校智库（其中包含2个国家高端智库，标记为H1—H6）以及5个社会智库（含3个企业智库,标记为B1—B5）相关研究人员和管理人员进行深度访谈，受访者的选择除了基于便利性原则，还均具有典型的智库研究经历，发表过3篇以上和政策研究相关的论文，或参与1次以上政府委托研究课题，或获得过司局级以上的批示或采纳证明；（3）获取相关智库人员年度考核或职称评聘的制度文本资料。本研究共计访谈16个智库、32位受访者，满足贝尔托的建议（样本量应为15个以上），也达到梅森所提供的质性研究样本量的平均水平（32个）。

　　编码分析之前，基于文献梳理以及搜集的各类智库的评价文件，明确了关键概念，包括：与政策相关的各项能力，委托研究、政策研究、论文、专著等成果，成果认定方式以及绩效奖励等。随后，本研究编码分为三步：第一步，基于已形成的关键概念，对访谈记录进行开放编码，形成智库成果的不同形式（委托研究、政策咨询等）、智库成果面向的主体（政府、高校、企业）、智库研究人员不同能力（政策分析能力、政策反应能力等）等主题；第二步，将形成的主题归并为智库成果形式、智库研究能力、成果类型、智库成果重视程度等；第三步，按照“服务面向主体—智库研究能力—智库成果性质（理论导向或实践导向）—智库成果重视程度”的关联，形成四个维度，将不同形式的智库成果纳入不同的维度之中，形成评价的框架。限于篇幅，本研究直接呈现形成的框架及支撑性的访谈资料。

　　一、能力与成果：当前智库研究人员的评价指标

　　智库研究人员是构成智库的核心，他们“投身于政治，运用其专业知识和思想来影响政策制定”，承担着“边界工作”（boundary work），即在政策过程中横跨学界和政界之间的知识与政策互动。从整体来看，霍普将智库研究人员喻为“边界工作者”，大致可以分为七种类型：（1）理性的协调人（rational facilitators of accommodation），科学家和政策执行者应该在密切接触和相互信任的气氛中进行合理、良好的沟通，其任务在于促进学术研究者和决策者进行协商与对话，以促进双方认识趋于一致、决策更加科学化；（2）知识经纪人（knowledge brokers），即处于政府和学者之间的中间人，能够引入学术知识解决政策制定中的相关问题；（3）大型政策战略家（mega policy strategists），设计政府的远景规划及发展战略的研究人员；（4）政策分析者（policy analysts）,基于客观证据为政府决策者提供决策建议；（5）政策顾问（policy advisors），为政府决策专门提供咨询服务的专家；（6）非常规科学家（post-normal scientists）,即因“旋转门”才从事“边界工作”的研究人员，他们或由学者进入政界，或从政府部门进入研究部门；（7）慎重的程序主义者（deliberative proceduralists），主要致力于为政府决策提供清晰透明的议事程序和标准的研究人员。王运红等人则按技术类型将“边界工作者”分为三类，从事基础理论研究为主的“基础研究”型人才、从事技术和数据分析的“技术分析”型人才、从事宏观和战略性问题研究及提供决策依据和方案的“政策研究”型人才。

　　尽管智库研究人员存在着多种类型，也承担着不同的工作任务，但学者们仍尝试探索相对统一的方法对智库研究人员进行评价，以用于招聘、考核、晋升等人才评价环节。大致来看，评价指标可分为内在的能力和显性的成果两个维度。

　　在能力维度上，主要从胜任智库相关工作的角度提出应然的能力水平。例如，王文认为，优秀的智库学者要有浓厚的家国情怀与现实关怀，能够长期保持对改变社会与改善国家政策的欲望；要有极强的政策研判力与全球视野感，应善于研读各类政策文本，再结合现实问题，从国内与国外全方位的视野寻求政策改善的各类方案；要有统合组织与传播能力，既能够通过广泛调研和深入访谈获取一手资料，又拥有社会人脉与政府关系，将研究成果在适当的时机予以呈现。庆海涛等提出智库专家胜任力模型，包括知识、能力、个性特征三个维度，其中知识维度包括专业领域知识、政策理论、研究方法、研究工具；能力维度包含国际视野、政策洞察力、政策解读能力、成果说服能力、学习能力、组织协调能力、社交能力、沟通表达能力；个性特征维度则囊括价值观、责任心、成就动机、独立思考、宣传意识、客户意识、主动性方面的要素。在成果维度上，主要以实际产出的智库成果为观测点，对智库人员开展评价。如李蒙等对湖北省52所智库人才评价基地的调研显示，咨询决策贡献（领导批示、政策研究采纳证明、政策咨询会参与）、学术贡献（论文发表、科研项目、著作出版）、社会传播（网络媒体传播、报纸发表）是重要指标。金志峰等人认为，不同类型的智库应当在评价指标中予以侧重，对于学术型智库人员的评价主要聚焦论文、专著、科研项目、教学、政策研究等方面的成果，其中政策研究成果按政策成果批示、采纳级别与不同级别的学术论文相对应，参照科研和教学转换的方式进行成果换算；对于咨政型智库人员的考察主要聚焦研究成果服务并影响决策的质量与贡献，同时将学术成果、教学成果、承担课题等也列入考评内容。

　　从实践来看，“以成果论英雄”的做法广泛存在于智库研究人员的年度考核和职称评聘之中。如：H2智库规定，职称评聘指标包括学术论文、研究报告和著作，其中要求必须有省部级及以上单位采纳的研究报告；G3智库规定，研究人员每年至少参与1项决策服务项目和1项实践指导任务，并取得1项科研成果。

　　二、能力与成果的对应：一个整合性的评价框架

　　本研究认为，隐性能力与显性成果并非割裂的两个维度。能力是成果产生的基础，成果是能力的外显。一个整合性的评价框架应当能够将隐性的能力维度与显性的成果维度建立起相对清晰的映射关系。

　　第一步，本研究尝试对智库研究人员产出的成果类型进行细分。

　　按照成果的功能，可分为理论阐释类成果（解决为何做的问题）和实践指导类成果（解决如何做的问题）。（有的研究是为决策提供支撑，告诉我们为什么要这样做；有的研究是为决策提供指南，告诉我们怎么做［R1］）理论阐释类成果往往强调论证实施某一改革举措的原因。（我们有时候确实无法判断究竟如何做，例如，如果延长X年限，究竟是纳入A还是纳入B，无论哪种方案，都需要讲出充分的理由［J1］）实践指导类成果更加具有实用主义导向，需要对具体改革路径、方案和举措提出翔实的建议。（我们（政府）需要的成果不仅是给我们提问题、讲道理，更重要的是给我们实实在在提建议，特别是在弄清楚现有改革精神基础上给我们提建议［J2］；我们(智库研究人员)经常给政府写报告，除了要把问题分析透彻，更重要的是提出建设性建议，不能只破不立［H2-1］）

　　按照智库成果的服务面向，即成果为谁服务，可分为政府、学者以及公众三个群体。（不能狭义地理解政策研究就是给政府提供咨政参考，政策研究也属于社会科学研究，必须符合学术规范和质量要求，而且有时也需要面对公众的质疑［H3-1］）智库成果既包括为政府提供的改革方案，也包括在既定领域开展政策科学研究的知识增值，还包括对更大范围的公众的政策“科普”。（一个政策从产生到公布，都要面对不同人的质疑。政策出台之前学者们会讨论各种可能的方案；进入领导视野以后，要有专家替我们把脉判断，哪个方案更好，这些方案分别会产生哪些后果；政策出台以后，还得有人去解读，把为什么改、怎么改、改成什么样讲清楚［J1］）

　　第二步，本研究按照不同类型成果，分析其各自所需要的能力素养。

　　一是，在“事”的维度，产出不同类型的智库成果需要不同的能力素养。

　　产出理论阐释类成果至少需要三个方面的能力：信息搜集能力（做政策研究必须要看历史、看现状、看国内、看国外，只有全面把握信息，才知道为什么要这样做，有哪些方法［H3-2］）、学理研究能力（政策研究必须要把道理讲透，为什么X政策要对A和B放权，而不对其他单位放权，这和C规律有关［H1-1］）以及设计稳健性研究的能力（基于研究形成的结论，一定要禁得起领导问，而且应当具有较强的稳定性，不是换一个情景，就不适用［J1］）。

　　产出实践指导类成果至少需要包括四个方面的能力：政策反应能力（要及时学习中央精神和国家领导人的重要讲话，这些都是政策制定的重要依据［R1］）、政策洞察能力（中央一个全局性的政策出台，就应该立即去思考具体的落实办法建议，例如“双循环”究竟怎么落实，企业创新能力如何提升，有什么制约性的因素等［H52］）、政策分析能力（应给领导提供多种方案，让领导选［G3-1］;应该在政策出台前，就能够对政策影响有预判［G5-1］）;应追踪政策实施进展，监测实施成效，更好地发现问题，为政策改进提供思路［G3-1］）以及政策预见能力（要抽身出来，跳出现有的制度框架，站在10年、20年以后来看今天最应该做的改革是什么［G4-2］）;一个好的政策往往可以管10年、20年甚至50年［G3-2］）。

　　二是，在“人”的维度，与不同群体打交道应当融入群体所在的场域中，按照场域规则开展智库研究，场景依赖性决定了智库研究人员所具有的能力也有所不同。

　　对于面向政府的智库研究人员，应当具有良好的政治素养（要坚持“四个自信”，要在制度框架下提出建设性意见［G1-1］）、保密意识（有的研究和我们的工作结合比较紧密，很多材料都是过程中的版本，千万不能外传，更不能上网［G2-2］）、大局意识（政策研究本身不是简单的学术研究，必须提高站位，把基于局部分析的成果放到整个社会主义现代化建设的进程中看［G2-1］；有的问题具有时代性，在发展中就可以解决，例如特定年份的毕业生分配问题，有的问题具有长期性，需要持续思考，例如教育供给结构与人才需求结构的衔接问题［H5-1］）。

　　对于面向学者的智库研究人员，应当具有团队合作能力（每一个学科都有局限性，政策研究的问题往往是综合性的，必须要协同攻关［H4-2］）、对话讨论能力（政策研究者和纯理论研究者应当有一个交流的过程，有时候理论限于各种现实因素，可能并非一个最有效的方案，有时候实际工作中形成了惯例，但不符合既定的理论，就需要更多的视角来全面分析［G2-2］）以及辩证思考的能力（不同理论都有各自的主张，一定要统筹兼顾、辩证思考［R1］）。

　　对于面向公众的智库研究人员，应当具有换位思考的能力（能够站在老百姓的角度去思考什么话题更值得关注［B3-1］）、共情能力（能够与政策目标群体感同身受，这样才能更客观公允地对政策进行评估［G3］）以及感染力（政策分析要吸引眼球，必须要让读过的人有共鸣，唤起他们自己的经验［B2-1］）。

　　此外，多位受访者均表示智库人员还应具有三项通用型能力：全球视野（能够在关注的政策领域内对发达国家的情况有深入了解［R1］）、实践经验（有一线经历、熟悉基层情况［J1］）以及政策表达（能够将学术话语转化为政策话语、能够将政策话语转化为日常用语［R2］）。正如詹姆斯·麦甘所言，智库的意义在于服务公众，在学术界和决策者之间搭建桥梁，通过简单易懂且切实可靠的表达方式将研究传达给决策者和普罗大众。

　　第三步，整合能力与成果维度，形成评价框架(见图1)。

　　在服务政府、提供实践指导象限，包含委托研究、政策咨询和政策起草三类。委托研究是围绕政府特定的研究任务，开展目标导向的政策分析。（每年我们都会结合工作需要，委托很多课题给高校老师，调动他们的力量帮我们从学术角度做做分析［J1］;委托研究的成果我们会仔细看，有的能够直接成为我们未来的政策设计，我们还会把做得好的政策建议和正在制定政策的条目进行对比［F2］）政策咨询往往是邀请智库研究人员参与专题性研讨会，并作会议发言。（我们召开专题研讨会很多，有的是调研问题的，有的是对政策征求意见的，还有的完全是头脑风暴，为下一步改革启发思想［R2］;有重要领导参加的时候，我们会要求参会专家提前准备发言稿，会后提供给我们消化［J2］）政策起草则是智库研究人员为相关政策文本拟定初稿，直接参与政策文件的撰写工作。

　　在服务政府、理论阐释维度，包含委托研究和政策研究。从广义来说，委托研究也属于政策研究，但此处将二者进行区分，其标志是委托研究往往是政府授意开展的研究，研究结果往往是政策意图的改良品或工具包，不会产生颠覆性意见，但政策研究往往并非政府授意，而是智库研究人员针对特定政策，从不同方面广泛提出研究问题及改革建议，意见可能更加尖锐。（我们学校有专门的向上报送渠道，大多针对社会热点问题，每年上报几百份政策研究报告［H4-1］;虽然我们会对报出的政策研究报告进行审稿，但基本都尊重专家观点［H3-2］）

　　在服务学者、理论阐释维度，主要体现为科研立项和论著发表。这两方面都是智库研究人员专业水平的体现。（即使是专门的智库研究人员，我们也希望他能够在其所在领域的顶级刊物发表文章，这是学识和专业性的体现，这也会增加他们智库成果的权威性［H3-2］；我们也鼓励他们去申请国家自科、社科等方面的基金，这也是科研能力的重要体现［H5-2］）

　　在服务公众、实践指导维度，主要体现为在公共媒体及权威报刊上的政策解读或政策评论。政策解读既有自发行为,也有政府的安排。（每次我们发布重要文件后，都会请相关专家撰文解读，帮助大家理解文件精神［J1］）政策评论更多是智库研究人员的自发行为，与政府关联不大，更加追求公众的关注度。（通常会对微信浏览量达到10万以上的作者进行奖励［B2］）

　　三、趋同存异：不同类型智库的评价指标

　　（一）政府智库的评价指标

　　正如里奇指出，智库的概念“在一些描述中，它们与政府研究机构，如美国审计局和美国国会研究服务处没有什么不同。有时，它们等同于附属于大学的研究中心和研究所。有时，它们相当于以利益集团为基础的研究性组织，例如美国退休人员协会的政策研究所”。

　　当然，政府智库是否属于智库，不同学者的认知存在着显著不同。例如保罗·迪克森认为“智库应是独立于政府而存在的相对稳定的政策研究和咨询机构”，即应当在知识提供者之间和实践决策者之间划出明显的界限，至少不存在明显的依附属性，政府内部的政策研究人员或是隶属于政府的研究机构不应视为智库。不仅独立于政府，里奇还认为智库应当独立于利益群体，是“独立、无利益诉求的非营利组织”。

　　政府智库对政府有较强的依附性，这对智库研究人员评价产生了显著影响，其中最重要的指标就是为决策服务的委托研究。G3智库的年度考核办法中，明确要求“重点考核决策服务工作、实践指导工作以及科研成果情况”。在实际工作中，智库研究人员感受到为政府决策服务的压力更大。（每年都要“交账”，至少得司局级以上的采纳证明才管用［G3-1］;部里随时一个任务下来，领导接了，我们就得开始忙，在最后的成果上还不一定能体现出来［G2-2］）在智库的管理人员看来，集团作战是承接政策研究，特别是应急性政策研究的唯一方法。（很多时候任务又重又急，只能大家分分，然后规定时间节点让大家完成［G3-3］）在成果评价上，具有一定的柔性，不会像学术论文或专著规定仅看第一署名。（我们考核的时候，只需要证明参与即可，若采纳证明上明确注明了核心成员，我们也认可［G3-3］）对于决策服务成果质量，主要以采纳单位的级别以及批示级别作为区分。（因为决策服务成果的可比性较弱，很难说谁比谁的决策服务更重要，因此将采纳单位的级别或是批示领导的级别作为评价和奖励的标准［G1-1］）当然，也会根据实际情况做详细区分。（有的工作是配合上级部门的处室开展的，最后形成了中央文件，我们也会重点考虑［G3-3］）

　　参与政策起草与承担委托研究类似，也需要上级主管部门的采纳认可。（有时司里会出具一个工作证明，做得好的时候，特别是中央领导高度认可的时候，还会给我们出具感谢信［G1-1］）政策起草的级别是认定工作贡献大小的主要标志。（起草政策的级别主要从发文机构来看，有时也从文件最终通过的会议级别来看［G2-1］）

　　论著发表在政府智库对研究人员的评价中，属于必要而非重要。（我们还是要求发表论文，论文也是他们学术思维的体现，日常考评中必须得有，职称晋升也肯定会看，但最后大家投票的时候，并不是最主要的因素［G3-3］;有的年轻老师刚来，还不太了解工作要求，就一个人自己发论文，也不承担政策研究任务，以为可以很快上职称，结果在年度考核的时候就有领导对此有看法［G3-3］）较之于委托研究，论著在署名要求方面则要严格很多。（我们认定的要求必须是第一作者或通讯作者，而且单位必须为第一单位［G1-1］、［G2-1］、［G3-2］、［G4-1］）

　　参与各级领导主持的政策咨询会，属于政府智库关注的范围，但在评价指标上，受访智库并未有一致的设计。列入指标的智库主要依据咨询会主办方与参与领导的级别来进行评价。（我们主要看是谁主持召开的，至于发言发的好不好，在评价中没有体现，也不好评价［G2-1］）

　　政策解读也属于政府智库关注的要点，但既不必要，也不重要，属于“锦上添花”，而非“雪中送炭”。同时，政策解读在一定程度上还存在风险。（最怕出去解读政策的人，“把经念歪了”，上级部门还找过来［G3-1］）当然，作为解读专家参加政府主持的政策文件新闻发布会，认可度还是较高，但由于参与机会较少，且往往集中于少部分学者，因此评价指标并未纳入。（能参加新闻发布会解读当然是非常好的事，但我们很少有人能参与，感觉在评价中区分度不大，因此没有纳入［G4-1］）

　　政策评论的依托载体主要是各类媒体，其中以《人民日报》《光明日报》认可度最高。当然，各领域的重要报刊也在不同程度予以关注，例如《经济日报》《中国教育报》等。至于微信、社会媒体，政府智库并不关注。（我们主要关注在主流媒体的发声，至于网评热文、微信热文，我们会看，但一般不会纳入评价指标体系［G2-1］、［G3-3］、［G5-1］）

　　（二）高校智库的评价指标

　　作为重要的智库平台，高校智库具有鲜明的实用主义导向。杜威认为，社会科学家必须毫不犹豫地应用实验方法来分析和解决社会问题。真理的评价标准以众多个体在社会中的感受为依据，思想观点和社会制度的有效性由它们对于沉重社会状况的改善的贡献程度来判断。然而，正如莫里斯·科根所注意到的，高校智库与政府之间并非“志同道合”，时常存在着三个方面的张力：一方面，二者地位并不平等，也不可能平等，研究者类似“商人”，决策者类似“顾客”，“买卖”并不公平，这是垄断性的“买方市场”；另一方面，二者看问题具有不同的角度，决策者以政治需要来衡量智库研究的价值，研究者往往以学术同行评议的结果作为其价值的衡量，决策者更具有渐进主义和利益平衡的考量，其大部分决策是植根于现实复杂政治行为和行政活动的综合实践，而研究者往往是乐观的理性主义者，较少考虑决策内容之外的因素。此外，决策者认为，研究成为制定政策的工具，是智库研究的必然要求，学术自由是“研究者的自负”，一些研究者却认为，研究主要对科学性负责，社会影响难以做到百分之百准确。

　　高校与政府之间的张力决定了高校智库研究人员的评价与政府智库可能存在显著的不同。智库之所以为智库，关键在于能否为决策者的政策制定提供基于科学、理性的支撑。正如纳德·阿贝尔森认为，“智库是一个保护伞的概念，智库意在将提供政策咨询服务的学者们聚在一起，聚焦于某个公共政策关注的特定问题，从而形成具有创新性思想的政策文本以影响政府的决策”。

　　因此，论著发表在高校智库看来是必需的指标。一方面，论著可以成为学术研究产生政策影响的“启蒙模式”（Enlighten Model）的集中体现。（发表论文虽然和政策看似没有关联，但针对政策开展的独立研究往往更能够切中时弊，提出真问题和解决方案［H1-1］）另一方面，能够发表论文也是从事智库研究的基本资质，只有那些在学术上获得认可的学者，其从事的智库研究才具有较高的科学性。H1智库在智库人员各级职称评聘中，均要求智库人员在其专业领域的A+期刊发表至少2篇论文。（政策制定要有信服力，必须要有最科学的研究做支撑，因此我们要求智库人员必须具备同行公认的研究能力，能够在其所在领域的顶级期刊发表论文［H1-2］）但是，在年度考核中，论文并不是绩效的主要体现。（发顶刊是能力的证明，但绩效是贡献的证明［H2-2］）

　　政策研究是高校认为最重要的指标。相较于委托研究，政策研究兼具服务的属性和自由的风格。学者可以自由地对感兴趣的政策问题开展系统研究，提出独立的政策建议，并通过各类途径影响决策。（我们鼓励老师们结合自己的研究领域，向我们（国家高端智库）投稿，我们请专家审定后，会向上级部门报出，每年都有很多报告被采纳或被领导批示［G1-2］）政策研究的评价标准与政府智库一致，均以采纳单位的级别或是批示领导的级别作为主要标识。对于没有“反响”的政策研究，往往得不到制度上的肯定。H1智库、H2智库、H3智库和H4智库均针对不同级别的采纳和批示制定了对应的绩效奖励办法，实行“计件工资”。

　　委托研究也是非常重要的指标，但整体上认可度略低于政策研究。一方面，委托研究往往是非竞争性的，获得途径具有多样性。（有的委托项目是政府主动找过来，但有的委托项目可能是学者对此领域熟悉才拿到的［H1-1］、［H2-2］、［H3-1］、［H4-2］、［H6-2］）另一方面，委托研究并不完全是基于学术的研究。（有的纯属借助我们的力量去查查国外的相关做法，研究性不强［H1-1］、［H2-1］、［H3-1］、［H4-1］）此外，委托研究在研究话题甚至研究结论上往往具有诸多限制，一位访谈者将其喻为“戴着脚铐的舞蹈”。委托研究的成果表现形式有两种:一是外部的反馈，即采纳证明或批示；二是科研经费。（每年我们都会统计政府部门到账的科研经费，并作为年终绩效分配的重要参考［H2-2］、［H4-2］）

　　以媒体报刊发表的方式进行政策评论和政策解读，是高校智库对智库人员评价的指标之一。其中，特别是在《人民日报》和《光明日报》上的评论，会具有更高的认可度。但在具体认定的标准上，除第一署名的要求在各智库保持一致以外，各智库也有一些差异，部分智库仅认定在《人民日报》和《光明日报》（理论版）所发表的评论或解读。（一般别的版块字数很少，1000字出头［H4-1］、［H5-1］，部分智库规定评论或解读不少于3000字［H2-1］、［H3-1］，政策评论和政策解读也须具有鲜明的学术性，必须发在学术性强的理论版或用一定的篇幅阐明学理［H2-1］、［H3-1］、［H4-1］、［H5-1］）此外，H2智库也将微信浏览量超过10万的政策评论或解读纳入评价范围。

　　参加政策咨询会或以现场方式（新闻发布会或培训）进行政策解读，在所调研的高校中是被鼓励的，但在评价中既不是充分指标，也不是必要指标。

　　（三）社会智库的评价指标

　　广义的社会智库是指除高校和政府以外的智库机构，既包括非营利组织（如各类协会）性质的智库，也包括企业智库；狭义的社会智库则仅指前者。本研究采取广义的界定，当然被访智库也呈现出较大的差异性，在智库人员评价上呈现非常不同的特征。社会智库往往具有一种理想而超脱的色彩，产生耳目一新的思想以及相应的政策影响是社会智库的一致追求。

　　在部分企业智库，产生政策影响只是第一步，最终还要看政策影响是否为企业的主营业务增值作出贡献。B1智库研究人员评价在其产品业务相关指标的基础上，设置了社会影响这一指标，这一指标以上级领导主观评议的方式来进行。（智库研究人员需要“讲好一个故事”，“故事”里委托研究、政策研究、政策咨询、论文发表等都可列入，没有硬性规定，但必须将“故事”落到为公司所创造的价值上，包括无形价值［B1-1］）B2智库的研究人员主要承担委托研究和自主撰写政策研究报告，其考核指标有二：委托研究报告的优秀率（由用户评价）、代表性公共报告成果。（这个没有量化考核指标，比如去年编写的XXX报告受到了大范围好评,主要参与编写的同事绩效会增加［B2-1］）

　　在一些依托兼职人员的社会智库中，重点关注研究成果的政策影响。B3智库非常重视政策影响，但由于其智库研究人员主要为相关高校教师兼任，因此对智库研究人员的评价相对较弱，且以定性为主。由于B3智库的负责人具有在高校、政府任高层领导的经历，虽然是企业所办智库，但不像B1智库和B2智库关注利润，而是在年度评价中更加注重研究成果的政策影响，如是否被政府部门采纳以及被领导人（特别是国家领导人）批示。B3智库也高度重视参加各类政策咨询会，每年也会自发组织高端论坛和政策研究成果发布会，但未将其作为评价指标。B4智库和B5智库也没有专职的智库研究人员，主要是以委托研究的方式组织高校教师参与智库研究，并向上级部门提供政策研究报告。委托研究的经费主要来源于会费收入和政府拨款。委托研究成果获得政府部门采纳或被领导人（特别是国家领导人）批示，均成为B4智库和B5智库自身的业绩，但对承担委托研究任务的人员，没有额外奖励。由于B3智库、B4智库和B5智库主要依托兼职的智库研究人员，也不对兼职人员的工作绩效进行评价。

　　此外，社会智库的影响力也是智库人员评价中关心的重点。拉勃、苏珊将经济智库及其研究人员的新闻能见度作为智库评价的重要指标，测度智库的影响力。美国全球发展中心（Center for Global Development）在2013年所采用的智库绩效评价指标中，也将衡量智库社会影响的指标作为核心指标，其数据来源于智库网站、社交媒体以及新闻媒体等。受访的社会智库同样也看重社会影响，但仅有B2智库明确将媒体阅读数量作为智库人员评价的指标之一。（我们有专门的媒体部老师负责撰写政策解读、评论，并通过微信推送，他们的考核指标主要为10万以上阅读量的文章数［B21］）

　　余论

　　本研究基于对16个智库、32位受访者的访谈，初步构建起智库研究人员的评价模型，该模型在理论探讨上，呈现出能力导向和成果导向的两种评价方式，但在实际工作中，智库对研究人员评价的指标，主要是成果导向，且不同类型智库对成果要求有所不同。总结本研究的基本内容，智库研究人员评价模型可以操作化，如下表所示。不同类型智库可依据其重视程度选择适切指标加以测度。

　　本研究尚有四个方面的问题需要进一步探讨：

　　第一，本研究所构建的智库研究人员评价指标体系能否充分反映研究与政策之间互动的模式。如果没有完全反映，则本研究提出的评价模型是不完备的。威尔斯认为，研究与政策间的关系体现为七种模式：线性模式（基础研究—应用研究—发展—应用）、问题解决模式（为既定问题解决提供基于研究的备选方案）、相互作用模式（研究者与决策者相互启发）、政治模式（有明确目的的政府授意研究）、战术性模式（决策者“辩证”地使用研究成果）、启蒙模式（研究成果通过知识界或舆论界渗透到政策制定过程中）以及逆向创新模式（政策对既定领域的关注促进该领域的研究）。论著发表、自主科研往往会通过线性模式和启蒙模式对政策产生重要影响，政策研究介于问题模式和启蒙模式之间，有的政策研究可直接为既定社会问题的解决提供多种备选方案，而有的政策研究可能更多是头脑风暴式的启发，媒体发声更多是以启蒙模式对决策产生影响，但有时候媒体发声也会通过特定方式对政策直接产生影响。（领导也经常浏览相关新闻，有时会将相关评论批（示）给我们，请我们认真研究［R2］）委托研究是问题解决模式、政治模式以及逆向创新模式的重要体现，委托研究中研究者很难保持完全的中立，在研究问题的选择、解决方案的选择上，都至少会在一定程度考虑委托方的观点与诉求，同时，委托研究也在很大程度上提高了研究者对既定领域的关注程度。政策解读可视为战术性模式，解读政策的研究者已经明确选择了立场及观点，会更加站在政策合法性的一端进行宣扬和捍卫。而相互作用模式，则体现在各种成果的综合作用之中。综上，该模型能够较好地反映研究与政策之间的互动模式，可作为智库研究人员评价的核心观测点。

　　第二，本研究所选取的样本能否符合理论饱和度的要求。从数量上看，本研究达到了质性研究学者所建议的标准及平均水平，可归于“数据饱和”。如图2，从被访者人数与编码主题数的增长趋势来看，有几个显著特征。当访谈完政府部门及政府智库后，编码主题呈现快速增长的趋势，当访谈完高校智库前6名被访者（主要是科研部门管理人员）之后，剩下的6名被访者所提供的信息未能提供更新的编码，同时基于前6名被访者访谈新增的编码主题仅有6条，当访谈完企业智库研究人员，企业智库人员对编码的主题数仍有所贡献，但仅有3条，其原因在于政府部门和政府智库贡献了较好的编码主题基础，高校和企业被访者对编码主题的贡献主要是增加了反映不同机构智库研究差异的主题。该趋势也反映出，本研究的评价模型已具饱和趋势。为进一步检验模型饱和度，本研究开展了饱和度检验，在每个同类机构中再次选取了8位新的受访者（政府1位，政府智库、高校智库、企业智库各2位，学会智库1位），请他们提出智库研究人员评价方法，经多次询问是否还有信息补充后，受访者提供的信息基本能够被本研究的观点所覆盖，这表明本研究具有较好的理论饱和度。但也有企业智库的受访者提出，为政府提供技术开发（如建立一个数据监测平台），应当也算评价智库研究人员的指标，也有企业智库将模型中所有指标均纳入考虑，除直接带来经费收入的委托研究（重要性更高），其他指标重要性不大。鉴于企业智库具有较大的异质性，需要在未来进一步研究。

　　第三，评价模型在应然与实然之间的协调。从方法论角度，本研究所提出的评价模型属于实然的模型，即当前智库所采用的评价方法集合。但是否应该以此模型去评价智库研究人员，貌似是本研究难以回答的问题。本研究致力于在事实层面去回应“应当怎么评”，在样本选择中纳入了智库成果的需求者——不同领域政府同志的观点。从供给侧与需求侧的反馈来看，二者并无显著的冲突，与莫里斯·科根所关注到的研究者与决策者之间的张力有显著不同。本研究认为，这源于智库场域所形成的规范，即当研究机构定位于智库，且以智库研究标准招募研究人员时，就已经按照需求侧的要求在挑选心仪的理论供给者，而智库研究人员，也会在规范的作用下表现出适切的称许性，以满足政府决策者的期待（至少在成果形式上）。

　　第四，本研究发现，同一类型智库对评价指标和指标的重要性认识趋同；而不同类型智库在评价指标上趋同，在指标的重要性上趋异。这应该与不同智库的性质及其制度环境有关。对于政府智库而言，资源依赖性所导致的强制性同构，使得政府智库更加倾向于按照政府所需来制定评价方式（评价是智库内部的规范）；高校智库处于一个理性主义主导的场域，更加受到规范性同构的影响，即使是专职的智库研究人员，评价方式也带有象牙塔独有的色彩，对智库成果的学术表达和无功利性更加重视；企业智库在一个高度竞争性的环境中生存，市场机制所导致的竞争性同构在很大程度上决定了诸多企业智库在评价上呈现趋同的特性，能带来“流量”的智库成果是其生存之道。

（本文注释内容略）

原文责任编辑：陈凌霄

转载请注明来源：中国社会科学网（责编：常畅）

扫码在手机上查看

社科推荐

学科体系

新媒体矩阵

智库研究人员评价模型构建的质化研究