第七章 政策评估
政策评估是政策过程的一个重要环节。只有通过政策评估,人们才能够判断一项政策是否收到了预期效果,从而决定这项政策是应该继续、调整还是终结;同时,通过政策评估,还可以总结政策执行的经验教训。本章讨论政策评估的几个基本理论问题。
第一节 政策评估概述
政策评估是政策分析的重要方面,是一种具有特定标准、方法和程序的专门研究活动。
在相当长的时间里,政策评估并为引起人们的重视。作为公共政策分析过程中不可或缺的一环,政策评估在政策分析过程中有着重要意义。
一、政策评估的概念尽管目前对政策评估的研究已越来越多,但对于政策评估这个概念却没有一个统一的,能被绝大多数学者、专家普遍认同的定义。先看看几种有代表性的定义:
安德森:“如果把政策过程看作某种有序的活动的话,那么,它的最后一个阶段便是政策评价。总的说来,政策评价与政策(包括它的内容、实施及后果)的估计、评价和鉴定相关。作为某种功能活动,政策评价能够而且确定发生在整个政策过程中,而不能简单地将其作为最后的阶段。”依这种看法,政策评估的目的是评价人们所执行的政策在实现其预定目标上的效果,该政策在多大程度上解决了政策所指向的问题,以及该效果的取得是政策本身的作用还是政策以外其它因素所导致的等等。
那格尔:政策评价“主要关心的是解析和预测,它依靠经验性证据和分析,强调建立和检验中期理论,关心是否对政策有用,而主要关心的是把评价看成一种科学研究活动”。在这里,政策评估被看作一种分析的过程,评估者通过搜集相关信息,运用定性与定量分析方法和技术,对各政策方案进行分析,确定各种方案的现实可行性及优缺点,以供决策者参考。
林水波、张世贤:政策评价是“有系统地应用各种社会研究程序,搜集有关资讯,用以论断政策概念与设计是否周全完整,知悉政策实际执行情形、遭遇的困难,有无偏离既定的政策方向;指明社会干预政策的效用。”在他们看来,政策评估不仅是对政策方案的评估,而且包括对执行情况和政策结果的评估。政策评估被看作是一种着眼于整个公共政策全过程的广博的收集资料、论证评价的过程。
朱志宏:“就一项公共政策而言,发现误差、修正误差就是政策评估,换言之,政策评估的工作就是发现并修正政策的误差。”按照朱志宏等人的观点,公共政策过程是未来取向的,评估者凭借自己已具备的知识和经验,对公共政策全程跟踪观察,发现问题并随时纠正。在某种程度上,类似于引领航行的导航员。
可见,学者们对于政策评估概念的界定见仁见智,归纳起来主要有四种观点政策评估含义的四种观点:(1)政策评估的着眼点应是政策效果;(2)政策评估主要是对政策方案的评估,属于政策评估中预测评估的范畴;(3)政策评估是对政策全过程的评估,既包括对政策方案的评估,还强调对政策执行以及政策结果的评估;(4)政策评估就是发现误差,修正误差。这些定义各有千秋,但后面三种定义的不足之处较为明显的。我们倾向于第一种观点,将政策评估主要看作是对政策结果的评估。
因此,可以给政策评估下这样的定义:政策评估是依据一定的标准和程序,对政策的效益、效率及价值进行判断的一种政治行为,目的在于取得有关这些方面的信息,作为决定政策变化、政策改进和制定新政策的依据。
二、政策评估的类型
随着政府活动的日益复杂化和影响的深广化,政策评估也日益呈现出多样化的特点。国内外学者依据不同的标准,从不同的角度对政策评估进行了分类。不同的分类显示了学者们研究重点的不同。
在国外评估研究的文献中,有不少关于政策评估的分类方法:美国评估研究协会根据工作程式把方案评估分为六类,即前端分析、评估性测定、过程评价、效力评估或称影响力评估、方案和问题监控以及元评估(或称综合评估),这六种评估类型构成了方案评估的日常内容。美国社区服务管理局曾提出三种类型:方案影响评估、方案策略评估和方案监控。 而学者R?M?克朗赞同R?施赖德的看法,认为评估是一种循环的问题过程并将评估分为五类:系统评估、投入评估、过程评估、总结评估和测评估。德尔金斯(D.N.T.Derkins)则根据政策发展过程建立了六种评估类别,分别是策略评估、顺服评估、政策设计评估、管理评估、干预效果评估和影响评估。
在国内评估研究的文献中,政策评估的分类表现为两个大的趋势:一是认为政策评估应分为三类,即正式评估和非正式评估;内部评估与外部评估;事前、执行和事后评估。二是赞同从政策影响的角度对政策评估做诸如效益、效率、效果等方面的分类。台湾学者林水波、张世贤则把政策评估分为四类:第一类是政策执行评估,包括内容摘要、政策的背景环境、原定政策主要特征总述、执行评价描述、总结与考虑;第二类是影响评估;第三类是经济效率分析;第四类是推测评估。
从不同的角度,依据不同的标准,我们也可将多样化的政策评估分为不同的种类。从评估组织活动形式上看,可分为正式评估和非正式评估;从评估机构的地位看,可分为内部评估和外部评估;从政策评估在政策过程所处的阶段来看,政策评估又可分为事前评估、执行评估和事后评估。
1.正式评估和非正式评估从评估组织活动形式上看,可分为正式评估和非正式评估。非正式评估指对评估者、评估形式、评估内容没有严格规定,对评估的最后结论也不作严格的要求,人们根据自己掌握的情况对政策做出评鉴的评估。正式评估指事先制定完整的评估方案,并严格按规定的程序和内容执行,并由确定的评估者进行的评估。它在政策评估中占据主导地位,其结论是政府部门考察政策的主要依据。
2.内部评估和外部评估从评估机构的地位看,政策评估可分为内部评估和外部评估。内部评估是由行政机构内部的评估者所完成的评估。它可分为由操作人员自己实施的评估和由专职评估人员实施的评估。外部评估是由行政机构外的评估者所完成的评估。它可以是由行政机构委托营利性或非营利性的研究机构、学术团体,专业性的咨询公司,大专院校进行的,也可以是由投资或立法机构组织的或由报纸、电视、民间团体等其他各种外部评估者自己组织的。内部评估和外部评估各有其利弊,因此,在实践中,应把内、外评估结合起来,取长补短。
3.事前评估、执行评估和事后评估从政策评估在政策过程所处的阶段来看,政策评估又可分为事前评估、执行评估和事后评估。事前评估是在政策执行之前进行的一种带有预测性质的评估。事前评估的内容包含三方面:对政策实施对象发展趋势的预测,政策可行性的评估,对政策效果进行评估。 执行评估就是对在执行过程中的政策实施情况的评估,就是具体分析政策在实际执行过程中的情况,以确认政策是否得到严格地贯彻执行。事后评估是政策执行完成后对政策效果的评估,旨在鉴定人们执行的政策对所确认问题确定达到的解决程度和影响程度,辨识政策效果成因,以求通过优化政策运行机制的方式,强化和扩大政策效果的一种行为。它在政策执行完成以后发生,是最主要的一种评估方式。
三、政策评估的标准政策的评估过程是一种紧紧围绕着政策效果而展开的活动。为了弄清楚一项政策的效果究竟是好是坏,是否实现了预期的目标,就必须首先建立一套评估的标准,即进行价值判断的尺度。没有标准将无法对一项政策进行正确客观的评估。而且这些标准是“所要分析问题的核心所在”。由此可见标准在评估中的重要地位。此外,“较早说明评估标准也有助于日后避免出现选择个人偏好的方案的倾向”。但是,在现实的政策活动过程中,由于政策涉及面广,参与人数众多,政策过程中的变量因素很多,因此难以设定一个统一的,能被绝大多数学者共同认可的标准。
国内外学者在这个问题上也是各有自己的见解。例如,帕顿和大卫·沙维奇说:“我们将运用巴尔达奇的类型学方法来组织我们对通常使用的评估标准进行一次回顾。巴尔达奇界定了对政策设计目标会产生较大影响并会如期发挥作用的四种主要制约因素:技术可行性、政治可行性、经济和财政可能性以及行政可操作性。我们相信,大部分的评估标准都可归入这四种综合类型,而且分析人员应当在每一种类型中为每一个政策问题确定相关标准。” 威廉·N·邓恩在其所著的《公共政策分析导轮》一书中,将评估标准分为七类,分别是:效果、效率、充足性、公平性、回应性和适宜性。
台湾学者林水波、张世贤认为,评价标准大致有八个方面:第一,投入工作量。在政策执行过程中所投入的各项资源的质与量以及分配状况;第二,绩效。依据具体明确的目标,分析政策对客观事物与政策环境所造成的实际影响。绩效既包括政策推动的结果,又含有民众心目中认定的满意程度;第三,效率。投入工作量与绩效之间的比例关系;第四,充足性。满足人们需求、价值或机会的有效程度,反映了绩效的高低;第五,公平性。政策所投入的工作量,以及产生的绩效在社会不同群体间公平分配的程度。政策的类型不一样,所反映的公平性的角度与观点也不一样;第六,适当性。政策目标和所表现的价值偏好,以及所依据的该假设是否合适。第七,执行力。探求影响政策成败的原因,进而导致因果模型性的构建。第八,社会发展总指标。对社会状态与发展的数量描述与分析。既反映过去的动向,又可作为社会现状的说明,其特征是以描述性指标为主。
张国庆在《现代公共政策导论》一书中,从一个较独特的视角提出了评估的首要标准和次要标准的概念。他认为,对于一项政策的整体评估是建立在若干单元评估基础上的。所以,他把用于整体评估的标准称为首要标准,把用于单元评估的标准称为次要标准。在这个意义上,他得出的结论是:总量评估和首要标准是自变量,而单元评估和次要标准就成了因变量。但他对首要标准和次要标准的具体内容没有进行阐释。这样,他就从立体的角度构建了一个评估标准的架构。台湾学者朱志宏也提出了“次级标准”的概念。
在公共决策过程中,由于客观条件所限,找到最优决策方案是相当困难的,所以,人们往往退而求其次,在现有条件下,选定一种较为满意的方案,做出一种“满意决策”。同理,在进行政策评估的实践过程中,要寻求一种近乎完美的、放之四海而皆准的评估标准也是相当困难的。因为“选择什么样的评估标准,不仅取决于评估目的、评价者,而且还决定于评价的技术与方法”。因此,在大多数的情况下,人们在评估实践中所依据的也仅仅是一种在此时此地较为满意的评估标准。
我们认为,一般而言,政策评估有如下五个标准:生产力标准、效益标准、效率标准、公正标准和政策回应度(我们将“政策分析过程各步中常用的方法”一章中对这个问题加以讨论)。
四、政策评估的意义政策评估作为一种对政策的效益、效率、效果及价值进行判断的一种政治行为,是政策运行过程这一有机链条中的重要一环。但是,长期以来,人们只顾无休止地制定、颁布这样或那样的政策,对政策的效果如何,所知甚少,缺乏关心。这种只问耕耘,不问收获的态度固然有体制的原因,但是也与人缺乏对政策评估重要性认识有密切关系。事实上,政策评估对于改进政策制定系统,克服政策运行中的弊端和障碍,增强政策的活力和效益,提高政策水平具有重要作用,意义深远。概括地讲主要表现于以下几个方面:
1.政策评估是检验政策的效果、效益和效率的基本途径
任何政策,如果投入运行后,就再没有人去做相关的评估反馈工作,那它的效果如何我们就不得而知。尤其是一项构思精良,经多方论证认定是无懈可击的政策投入运行以后,究竟有没有达到预期目标,产生预期效果,或产生了哪些非预期的连带的效果,这都需要我们进行科学的评估工作。也就是说,评估人员要密切关注政策执行的动向,搜集相关的资料和信息,再加以科学的分析、论证,得出可靠的结论,以确定该项政策是否有好的效果,执行过程是否效率很高以及其效益所在。比如计划生育这一作为我国基本国策的全国性政策,在执行过程中,就需要我们密切关注它的发展状况,以便了解该项政策执行的情况。我们可以通过定期的人口普查以及年度的人口统计资料来确定,通过实行计划生育政策,我国在几年内少增加多少人口,与原始人口数据进行对比,从而可以判定计划生育政策是否被有效执行,哪些地区执行得较好,哪些地区稍差一些。
2.政策评估是决定政策去向的重要依据
一项政策在执行过程中总会呈现出一定的走向。伴随着政策目标实现程度的不断推进,该项政策是应该继续、调整、革新还是终止?这都必须依据一定的客观资料。能够提供这种客观资料的有效活动,只有政策评估。政策的走向一般分为三种情况:第一,政策继续,即通过科学的评估,发现该政策所指向的问题还未得到解决,其政策环境也没有发生大的变化。基于这种情况,还适宜用原来的政策继续指导这个问题的解决。如上面我们提到的计划生育政策,目前我国通过第五次人口普查,确定该项政策的执行已经取得了显著效果,但我国人口多,基数大,所以要继续执行该项政策。第二,政策调整,或称政策革新。如果一项政策在执行过程中,遇到了新情况、新变化,原来的政策已明显不适应新的政策情况,那我们必须对原有政策进行调整或者革新,以适应新变化,更好地实现政策目标。第三,政策终结,也就是完全终止原来的政策。政策终结分为两种情况:一种是政策目标已经实现,原有政策的存在已经没有意义,完成了一个政策周期,自然终结;另一种情况是政策环境或问题本身发生了非常大的变化,原有政策已明显不能解决问题,甚至会使问题变得更为严重,而且通过调整已无济于事,这时就需要终结旧政策,代之以新的,更为有效的政策。为了避免终结旧政策带来的混乱,最好旧政策的终结与新政策的出台能够同步。由此可见,无论是政策的继续、调整还是终结,都必须建立在科学、系统、全面的政策评估基础上。
3.政策评估是合理配置资源的有效手段
在政策实践中,政府的政策资源是有限的,但政府部门却要同时执行多项政策,如经济政策、政治政策、环境政策、教育政策等等。那么,究竟哪项政策该投入多少政策资源,也就是说政策资源要怎样配置才最为合理呢?这就体现出了评估的重要意义。只有通过政策评估,才能确认每项政策的价值,并决定投入各项政策的资源的优先顺序和比例,以寻求最佳的整体效果,以便有效推动政府各个方面的活动。同时,通过政策评估,也可以对照以往的政策资源分配情况,看其是否合理,总结经验,吸取教训,使政策活动优质高效进行。
4.政策评估是公共决策科学化、民主化的必由之路在现代社会,国家管理活动中重要的一环就是政府利用政策来调整、组织社会生产和社会生活。随着社会的发展,各种新情况和新变化层出不穷,单靠传统的经验来决策已经日益应付不了复杂的决策问题。实践证明,经验决策必须向科学决策转变;而政策评估正是使决策迈向科学化的必由之路。通过政策评估,不仅可以检验政策的效果、效益和效率,更合理地配置政策资源,形成一种优先顺序和比例,而且可以与时俱进,随时抓住情况的变化,对政策做出继续、调整或终止的决定。从另一个角度来看,通过评估得出的结论体现了科学性,为下一步的民主决策奠定了坚实的基础。因此,政策评估对于公共决策的科学化民主化是不可或缺的。
第二节 政策评估的过程和模式
政策评估是一种有计划、按步骤进行的活动,是一个有规律可循的系统过程。虽然评估活动步骤会因为评估类型的不同而不尽相同。但是,只要是正规的、科学的政策评估,一般都要经过准备、实施和结束三个阶段。
一、政策评估过程的三个阶段
1.准备阶段作为一项复杂的、系统的工作,政策评估在实施以前必须进行周密的组织准备工作,这是评估工作的基础和起点,也是评估政策得于顺利进行和卓有成效的前提条件。组织准备比较充分,才能保证评估工作有计划、按步骤展开实施,避免评估工作盲目性。组织准备阶段的主要任务包括:
(1)确定评估对象。确定评估对象实质上是解决评估什么的问题。政策具有相关性,某一结果的产生往往是多项政策共同作用的产物,要清楚地划出一项政策作用范围的边界并不容易。同时,并不是任何政策在任何时候都可以而且有必要进行评估。比如,某些政策仅具有象征性意义或者尚未完全发生作用,评估的时机尚未成熟,则暂时没有必要进行评估。因此,根据理论研究与实际工作需要,遵循有效性与可行性相结合的原则精选评估对象(特别是那些比较成熟的、政策效果与环境变化之因果关系比较明显己评估结论比较有推广价值的政策),才能是评估收到最佳效果。
(2)制定评估方案。这是政策评估准备阶段最为重要的一项工作。评估方案是评估实施的依据和内容,评估方案设计的合理程度直接关系到评估质量高低和评估活动的成败。评估方案必须以书面的形式系统、详细地说明以下内容:第一,阐述评估对象,明确指出评估什么;第二,明确评估的目的、意义和要求。评估目的决定评估的基本方向,解决的是为什么进行评估的问题;第三,确定评估标准。事实分析和价值分析以及它们的有机结合是评估标准的基本内容,评估标准通常体现为评估指标体系,它决定评估类型和评估方法;第四,提出评估的基本设想,根据评估目标确定评估的内容、范围,制定出评估方案;第五,评估方案还要说明评估的场所、时间和工作进度,以及评估经费的筹措和使用等问题。简言之,评估方案应将评估的五个基本要素,即评估者(主体)、评估对象(客体)、评估目的(出发点)、评估标准(准则)和评估方法(手段)都包括在内,使它们共同构成一个完整的政策评估系统。
(3)挑选和培训人员。评估的过程实际上是一种理论研究过程,它对评估人员的理论素养要求很高。换句话说,评估人员自身素质和理论水平将直接影响评估的质量。因此,必须选择适当的评估人员,提高他们的理论分析水平和实际操作能力,构建具有较高水准的评估队伍。
2.实施阶段实施评估是整个政策评估活动中最为重要的阶段,实施评估工作的好坏于评估活动的成败紧密相关。实施评估阶段关键是一些具体调查方法和评估方法的运用,该阶段的主要任务有:
(1)利用各种调查手段,全面收集政策制定、政策执行、政策影响和政策效益等方面的信息。信息是政策评估的基础,评估政策的过程其实也是收集信息、处理信息的过程。为了保证所获信息具有全面性、系统性和准确性,需要综合采用各种科学方法来收集信息,常用的方法有:观察法;查阅资料法;调查发;个案法;实验法等。
(2)综合分析政策信息。就是要在收集信息的基础上对那些有关政策的原始数据和信息资料进行系统的整理、归类、统计和分析。
(3)综合运用适合的评估方法,对政策进行评估,得出评估结论。在实施评估的过程中,评估者应该坚持评估材料的完整性和具体分析的科学性两个原则,客观、公正地反映出政策的实际效果。
3.结束阶段结束阶段是处理评估结果、撰写评估报告的阶段。政策评估离不开价值判断,个人的价值判断受客观条件和一些非理性因素的影响,难免有疏漏。因此,当我们收集评估信息,得出评估后,还必须善加处理。首先,要自我检验统计分析评估信息所得出的结果的可信度和有效度。其次,让评估结论与政策设计者、决策者、执行者、参与者会面,以便发挥评估的诊断、监督、反馈、完善和开发功能,提高政策的科学性。为此,必须做好两个方面的工作:撰写评估报告和总结评估。结束阶段政策评估者须形成书面形式的评估报告,提交给有关领导和实际部门,使之了解一项政策实施的最终情形,及时根据情形决定政策的继续、修改、中止等。评估报告除了对政策效果进行客观陈述、对政策进行价值判断、提出政策建议以外,还应包括对评估过程、评估方法和评估中一些重要问题进行必要说明,对评估工作的优缺点进行总结,为提高今后政策活动水平服务。此外,结束阶段还要注意妥善处理决策者与评估者之间的分歧,实现决策者与评估者之间对评估报告的最大限度的协调。
二、政策评估的八种模式
在西方政策评估实践中,有各种各样的模式。如何对这些模式进行分类,这是政策评估学者一直研究的问题。有些学者,如古巴(Guba)和林肯(Lincoln),提出以“组织者”(organizer)作为焦点来进行分类。通常,所选择的价值标准就是评估的“组织者”,这样根据“组织者”的不同就形成不同的评估模式(evaluation model)。以古巴和林肯的观点为基础,德国学者韦唐(Evert Vedung)在《公共政策和项目评估》(1997)一书中,从社会科学更广阔的视角出发,赋予了“组织者”更抽象的含义,从而提出了一个关于政策评估模式的系统分类框架。
韦唐博士从政府干预的实质结果入手,按“组织者”的不同将评估模式分为三大类:效果模式(effectiveness models)、经济模式(economic models)、和职业化模式(professional models)。“效果模式由一个相当大的、各不相同的团体组成。除了传统的目标达成评估(goal-attainment evaluation)外,效果模式还包括附带效果模式(side-effects evaluation)、无目标评估(goal-free evaluation)、综合评估(comprehensive evaluation)、顾客导向评估(client-oriented evaluation)和利益相关者模式(stakeholder model)。”经济模式与效果模式的不同在于前者总是关心成本,而后者是忽略成本的。经济模式的两个基本变种是生产率模式(productivity model)和效率模式(efficiency model)。职业化模式并不直截了当地关心评估的内容,因为它把重点放在了执行评估的人身上。最著名的职业化模式是同行评议模式(peer review model),用这种方法,举个例子来说,就是教授评估教授、工程师评估工程师、外科医生评估外科医生。按照韦唐的概括,政策评估模式的分类如下图所示:
图1 政策评估模式的分类
1.目标达成模式目标达成模式是探讨评估问题的传统方法,它主要由两部分组成:(1)目标达成评价。关注的是结果与由政策(项目)目标是否一致;(2)影响评价。关注的是结果是不是由政策(项目)所造成。应用目标达成模式要按三个步骤进行:第一,明确政策(项目)目标政策(目标)及它们的真正含义,并将它们按重要程度加以排序,再把它们转变成可以测量的客体;第二,测定这些预定目标实际上可在多大程度上实现;第三,弄清楚政策(项目)促使或阻碍目标实现的程度。可见,该模式是以预定的政策(目标)作为评估的标准和组织者,评估的主要任务是判断预定的政策(项目)目标是否已经实现,以及项目在多大程度上有利于目标的实现。
同任何方法一样,目标达成模式有它无可替代的优点,也有它鲜明的缺陷。韦唐对此作了具体的阐述。在韦唐看来,存在三个主要理由去推崇目标达成评估:一是体现了民主。目标达成模式是以预定的政府政策目标作为评估的组织者,政府预定的政策目标是公开而法定地被人民代表在政治议会上所采纳,体现了政治过程中的民主。同时,政治目标是在责任感之下制定的,政治官员在制定目标时会更多地考虑民众利益和可利用的资源。二是提供客观的评估标准。目标达成模式以既定的政策(目标)作为组织者,以项目目标来判断项目结果,所以可以避免评估者在评估项目的价值问题上持个人的主观标准。三是具有简单性。这个模式只包含两个主要的问题,即结果是否与目标一致?结果是否由政策(项目)所引起?
韦唐认为,目标达成模式的缺陷表现在五个方面:第一,忽略了成本。政策过程中需要投入大量的人力、财力、物力和时间等各种资源,这些资源在目标达成模式中完全被忽略了。第二,在目标不清的情况下难以运用。而政策目标的不确定性又是政策分析中常常碰到的问题。第三,不考虑意料之外的结果。目标达成评估只考虑预定的项目目标的结果,而忽视那些偶然发现的结果或意料之外的结果,这是片面的做法。第四,忽视了公共政策制定中的隐秘议程的作用。目标达成评估将官方宣布的、表面的预定目标作为评估的“组织者”,而忽视政治游戏现实中的一些重要东西。比如,官方宣布的目标可能仅有象征性意义,并不打算真正去实现。在这种情况下,目标达成评估往往是无效的。第五,忽视实施过程。目标达成模式只关心项目结果,而实施过程则被看作是一个黑箱。
2.附带效果模式附带效果模式正好解决了目标达成模式的“困境”,即关注非预期的、预料之外的政策效果。附带效果是指项目目标范围之外的影响,与主要效果——政策制定者有意识地想要得到的主要实质性影响——相区别。附带效果模式的特征是预定目标仍然是基本的“组织者”,但是要充分考虑到附带效果的存在。
要认识附带效果,应该把它政策活动中可能出现的反常效果和零效果相区别。反常效果是指产生的与预期目标完全相反的结果;零效果是指政策在目标范围内没有产生任何影响;反常效果和零效果都是产生在目标范围之内,而附带效果则是产生在目标范围之外。
在人们的印象中,附带效果似乎带有贬义,但它并非总是有害的,也可能是有利的。附带效果可以是预期的,也可能是非预期的。一些政策分析家甚至认为大部分政策效果在决策做出时是非预期的。附带效果不管是否有利,都是综合评价政策活动的关键因素,因此必须受到重视。项目可能产生副产品,副产品反过来组成或产生新问题,从而又产生新的政策(项目)。韦达夫斯基写道:“越开越多的公共政策是关于解决过去政策的结果。”因此,有关附带效果的信息对于任何一个政府政策的综合性评价来说都是不容忽视的,不及时发现与及时解决将可能导致更复杂的问题的出现。
附带效果评估遭遇的主要挑战是判断价值时应用的什么样标准。对此,韦唐也没有明确的分析。但他指出,应勾划出主要效果并由委员们和其他评估的使用者去明确它们的价值,计算全部价值的方法是将知道的每一个单独附带效果的价值与主要效果价值相加或者相减。
3.无目标模式无目标模式最初是由米歇尔·斯克里文设计出的,他猛烈抨击评估者沉迷于预定的干预目标,被牵着鼻子走。无目标模式的“组织者”是结果——不管是计划内还是计划外的结果。评估者的主要任务是全面观察政策实施,然后找出所有相关的效果。无目标模式对政策效果持广阔的视角,它帮助评估者全面关注结果,尤其是一些可能被忽视的结果。无目标模式与政策效果模式的主要区别是:附带效果模式仍然是“基于目标”之上的,同时辅之于对各种附带效果的考察评估;而无目标模式则完全抛开政策的预定目标和其他事前标准,只分析研究结果,单纯判断结果的价值。
可见,无目标模式是针对目标达成模式忽视附带效果,在目标模糊时束手无策的弊端而提出的。因此,其应用领域也十分广泛。但是,它完全忽视评估标准和预定目标,只依赖于决策者和权力使用者的公正判断,这显然容易导致主观因素的介入,影响评估的客观公正性。此外,这种模式在实践中还存在难于操作上的困难。斯克里文认为,项目的效果要和顾客以及受影响的人们的需要相比较,但评估者如何查明需求呢?从方法论上来说,找出需要比描述结果更困难。
4.综合模式综合模式的评估范围比目标达成模式广泛得多。该模式认为,评估不应只局限在已得到的结果上,而至少应包括执行,甚至还包括计划。综合模式与目标达成模式的主要区别在于目标达成模式关心的是预定的和实际的结果是否相符,而综合模式除了关心结果,也包括判断政府干预的计划、决策和执行阶段。
从系统论的观点看,公共政策可分为“投入”、“转换”和“产出”三个阶段。综合模式又在每个阶段中区分了描述和判断两个范畴。描述范畴又细分为意图和观察;判断则分成标准和判断。整个干预过程被分成了12个单元,如表1所示:
投入阶段
描述:
① 意图(目标是什么样的,希望得到什么样的效果)
② 观察(发生在这一阶段的活动的相关数据;对现状的描述)
判断:
标准(作为比较基础而使用的价值准则)
判断(比较意图、观察和标准的过程)
转换阶段
描述:
① 意图(项目如它所计划的那样执行吗)
② 观察(实际的执行和项目交付)
判断:
① 标准(作为比较基础而使用的价值准则)
② 判断(比较意图、观察和标准的过程)
产出阶段
描述:
意图(项目所预期的结果)
观察(项目结束后所收集的与实际结果相关的数据)
判断:
① 标准(作为比较基础而使用的价值准则)
② 判断(比较意图、观察和标准的过程)
表1 综合评估模式框架
从表中我们可以看出,综合模式将整个评估活动划分得细致而全面。每一阶段全面而细致的描述为评估工作提供了丰富的信息。从信息到判断,步步递进,使主观判断建立在客观描述基础之上。而且,在每个阶段,政策价值的实现都被衡量到了。因此,这种评估模式是相当完整的。但是,综合模式也存在一些缺陷,如只关注官方的具体目标,不重视成本等。此外,模式的12个单元的设计在实践中很难理解,也很难操作,因而使综合模式在实际应用中受到阻碍。
5.顾客导向模式顾客导向模式将政策干预对象的目标、期望、关心甚至需要作为评估的组织原则和价值准则。顾客导向评估的核心是项目是否使顾客的关心、需要和期望得到满足。
什么是顾客导向?奥斯本和盖特勒在《改革政府》中指出:“顾客导向的政府”向顾客提供选择,“把各种资源直接交到顾客手中,让他们选择服务的提供者,从而开始让顾客坐到驾驶的座位上”,并且“为顾客建立后果负责机制”。可见,顾客导向评估正是基于这样一种观点:公共行政在市场领域为顾客提供物品与服务,顾客表明对服务供应的态度会导致服务交付的改进和顾客满意度的提高。应用顾客导向评估的关键是定位政策(项目)的顾客,得出顾客对项目的看法。顾客导向模式没有明确规定项目的哪些部分应该被评估,它允许进行广泛的、多样的评估。价值的多元化是顾客导向模式的一个显著特征。评估者会要求顾客对服务的某些方面做出判断和发表看法,而不同的顾客的需要和对公共服务的满意度肯定是不同的,顾客可以在评估中表达不同的意见,甚至是相互冲突的观点。
顾客导向模式的最大优点在于体现了民主和参与。由顾客根据自己的价值观评估公共服务,使顾客处在主动的位置上,而不是被动地接受服务;通过参与评估,顾客可以对服务的供应者表达他们的需求和不满,这必然在一定程度上影响服务供应者,并使之提供更加符合顾客需要的服务。这种模式也使得评估更容易为政策制定者或服务提供者所使用,并使他们清楚地了解顾客的需求和不满,从而最终提高公共服务的水平。
至于顾客导向模式的应用领域,韦唐指出:“顾客的价值标准在公共服务方面的评价,比在受规章限制的政府干预的评估中扮演更占统治地位的角色。”也就是说,顾客导向评估主要应用于公共物品和服务的提供领域。但是,顾客的价值标准是以个人利益倾向为准,顾客个人价值的多元化难于形成对政策总的看法。而且,顾客导向模式要获取顾客的看法和需要,则要花费很多的时间。因此,顾客导向模式不能成为评估的唯一模式,而只能起补充作用。
6.利益相关者模式利益相关者是指所有对政策(项目)的目标和执行感兴趣,并对其具有影响的团体和个人。它和顾客导向模式相似,它们的主要区别是顾客导向模式关心的对象是受影响的一组利益群体,而利益相关者模式关心的是所有对象。应用利益相关者模式首先要找出卷入或对项目的出台、执行和结果感兴趣的主要团体和个人。
利益相关者是一个范围及广的概念,这一模式也没有明确界定其范围。下面我们借助联合国开发计划署(UNDP)在对其开发合作项目所作的评估中对重要的利益相关者的界定,来帮助我们对利益相关者的理解。重要的利益相关者包括:(1)目标群体:从计划/项目的结果中最终收益的那部分目标人群;(2)直接收益者:一般是指在承担由特定目标群体所指导的开发任务的同时,可加强其能力的、直接的收益人群;(3)直接管理者:指那些负责保证按计划产生结果的计划管理者及政府职员或联合国执行机构的雇员;(4)资源提供者:负责向计划/项目提供资源的国家政策制定者及预算部门、UNDP、投资人以及其他开发合作伙伴;(5)外部咨询顾问、供应商以及其他对计划/项目提供支持的人或机构;(6)在本计划/项目环境中可能受到计划/项目结果影响或对其感兴趣的其他机构(私人实体机构、社会组织)。
利益相关者模式有许多优点,归纳起来主要表现在三个方面:(1)知识性。利益相关者养成对附带效果和执行障碍的看法为评估者提供进一步研究的知识。(2)应用性。传统的目标达成模式的评估结果往往产生不了什么影响,因为评估者处于孤立地位。而利益相关者模式提高了被关心团体的真正利益被评价的机会,使信息更符合不同利益相关者的真正需要,提高了评估结果应用于实践的可能性。(3)目标管理性。利益相关者模式为没有目标或目标不清楚的政策评估提供了解决问题的策略。在利益相关者模式中评估者应描述各个不同利益相关者的价值观而无需作任何评判,而最好把其留给。利益相关者去做。利益相关者模式的缺陷有忽视评估成本、耗费资源、缺乏对利益相关者的明确界定、信奉实用主义理论等。
7.经济模式同效果评估模式相反,经济模式最典型的特征是关注成本。经济模式可以分为生产率模式和效率模式。
(1)生产率模式。生产率,简单地讲就是产出与投入的比率。如何判断生产率的高低?韦唐在以色列政治学家德洛尔(Y,Dror)提出的政策评估常用价值准则的基础上进一步研究,形成了以下10条准则:①过去——已经取得的生产率和过去的相比较?②国内比较——同一国家或行政区域相似组织间生产率的比较?③国际比价——不同国家相似组织已得到的生产率的比较?④水准基点——和过去最好的经验相比已取得的生产率如何?⑤目标——已取得的生产率符合政治主体的目标吗?这个结果与市政府的目标一致吗?⑥顾客期望——满足顾客的需要吗?⑦利益相关者期望——满足利益相关者的需要吗?⑧职业准则——生产率满足已被接受的职业准则吗?⑨最小化——生产率是否满足最小化的要求?⑩最优化——生产率是否与最优化模式一致?
(2)效率模式。效率通常被当作公共行政的价值。西蒙在他的《行政行为》(Administrative Behavior)一书中说道:行政人员应用实际问题的标准之一是效率。资源、投入、在行政人员的支配下受严格限制……他的功能是有效地应用提供给他的有限的资源使政府项目的产出最大化。
效率可以从两个方面来测量:成本-利益分析和成本-效益分析。在成本-利益分析中,项目的投入与产出都用货币单位测量;而在成本-效益分析中,投入用货币单位而产出则根据真实效果计算。
经济模式是在经济学方法被引进到政策科学领域后迅速形成并广泛应用的一种模式。它克服了所有效果模式的共同缺陷:忽视成本,从而把成本即政策投入作为一个重要指标纳入评估范畴。经济模式在现代政策评估中因为数字的精确性而广受推崇。但是,必须注意,经济模式不是万能的,它在对政策的社会影响、象征性的效果和软目标等无法用数字精确表达的项目的评估是无能为力的。此外,它忽视了民主社会政府干预的其他价值准则,比如公正、公平、民主等。
8.职业化模式职业化模式指职业人员根据他自己的价值准则和执行的质量标准来评估其他人员的执行情况,主要是同行评议,如律师评估律师、教授评估教授、外科医生评估外科医生等。同行评议特别着力于对评估对象作一个全面的质量判断,在一些技术性领域,政治官员们把规划和讨论专业性的技术问题留给受过良好教育的专业人员去完成。实施同行评议首先要选定同行。这个同行应该是具有比被评估的同事具有更专业的知识的专家,并且他们是独立的,并没有实施这一领域的工作;其次,评估者于被评估者应相互作用,评估者应认真考虑被评估者的观点,而被评估者要提供相关的资料。职业化模式主要应用于公共生活中的一些目标较复杂、技术难度较大的领域。
三、政策失败的一般原因尽管人们总是试图制定并实施最有效率、最能解决问题的政策,但现实的情况是,政策失败的现象却屡见不鲜。无疑,进行政策分析与论证,促进政策的科学化民主化是政策评估的重要任务之一,但分析政策失败的原因,从反面吸取教训,从而减少政策失败,提高政策水平,也是政策评估的核心内容之一。从某种意义上来讲,分析政策失败的原因,可以使人们警惕在政策过程中避免类似失败发生,正所谓“吃一堑,长一智”。概括起来,政策失败的一般原因主要有以下几个方面:
1.政策投入不够
一项政策制定出来,在实施过程中,要想获得成功,必须投入相应的人力、物力、财力。如果没有必要的物质投入作保证,那很难想象该项政策该如何贯彻执行下去。投入不够首先表现为资金短缺。财政问题一直是我国政策执行中遇到的一项常见的难题。进行现代化建设,用钱的地方很多。从中央到地方,各级财政都不同程度地存在紧张状况。而政治、经济、军事、教育等各个领域都需要投入相当的资金去实施有关政策。在这种情况下,每项政策所能分得的“蛋糕”就很小,往往不足以支持政策的实施。比如,我国三令五申不能拖欠农村中、小学教师工资,并制定出不少相关政策,但在某些贫困地区有限的财政状况下,这一政策也不能够不打折扣地得到执行。
其次,政策投入不足还表现为执行不力。如缺乏称职的执行人员,缺乏必要的设备或设备达不到执行政策的要求,或执行的方法不够科学等等。执行中投入的时间、精力等资源的不足势必会导致政策不能有效被执行,以至无法实现预期目标,甚至更导致政策失败。就拿我国政府机构精简来说,从建国到现在,精简缩编的政策几度制定并执行,但未能最终跳出“精简——膨胀——再精简——再膨胀”的怪圈。究其原因,诚然影响因素很多,但执行不力应该是一个重要原因。
因此,在今后的政策实践过程中,既然要下大力气执行某项政策,首当其冲的任务就是要保证它的投入。这是政策被有效执行的重要条件之一。
2.目标团体不配合
每项政策都有其固定的指向对象,即便目标团体(或称为政策对象或政策相对人)。目标团体的态度对政策的有效执行也起着至关重要的作用。如果目标团体积极配合,政策就会被顺利执行,并体现出一种优质高效的趋势。而如果目标团体不配合,即使政策执行者投入了足够人力、物力、财力,倾注了很多精力,政策也很难被有效执行,甚至在目标团体的强烈抵制下,政策会惨遭失败。我国许多政策失败的原因就在于此。
以我国的计划生育政策来说,尽管总体上取得了可喜成绩,可以算做是一项成功的政策。但如果我们把目光投向那些活跃在全国的一小部分“超生游击队”,就这部分人来说,该项政策也不是完全成功的。这些人由于传统“传宗接代”、“男尊女卑”等思想在脑海中根深蒂固,所以采取一切可以采取的方法来抵制国家的计划生育政策,甚至不惜背井离乡,到处漂泊。
在这种情况下,政策执行必须找准问题的深层原因所在,通过各种办法,灵活巧妙地做通目标团体的思想工作,转变其旧观念,形成对政策的正确理解。这样,问题也就迎刃而解了。
3.政策本身的问题
政策本身存在的一些问题也是造成政策难以被有效执行的原因。政策本身的原因包括:政策在目标、内容、管理上彼此冲突;有些政策问题纷繁复杂,解决难度大以及外在因素的干扰。
(1)政策在目标、内容和管理上彼此冲突。在经济生活中,不同部门出于不同的考虑制定并执行适合本领域的政策。但不同部门制定的有关涉及同一个问题的政策却常常彼此在目标、内容等方面相互冲突。就象《后现代公共行政》一书所言:“政策是一种自相矛盾的反论,在那里,可能同时存在几种依赖于同一观点的矛盾的真理。”在这种情况下,人们无所适从,政策效果大打折扣。
例如,共同富裕是我们社会主义建设的一条基本原则。为了达到共同富裕的目的,我国又制定了优先发展东南沿海地区的政策。这项政策实际上造成了沿海与内地、东南与西北地区差距拉大的现实。而且这种差距不仅难以在短期内填平,还有越拉越大的趋势。这就与共同富裕的目标存在矛盾冲突,也埋下了社会不稳定的隐患。
又如,为了人民的身体健康,政府利用媒体等形式宣传吸烟有害健康,号召大家不要吸烟。但另一方面,一些大型的卷烟厂却承担着地方经济支柱的重任。为了地方经济的稳定与繁荣,国家又对生产香烟的企业采取了鼓励和保护的态度。同样是围绕香烟,政策上却存在着很大的矛盾。
(2)有些问题纷繁复杂,解决难度大。这包括两种情况:第一,“公共问题是由多种因素引起的,而政策却可能只是要解决其中的一个或数个问题”。如针对某路段交通事故率较高的情况,政府制定出拓宽路面的政策。这在一定程度上有助于减少因路窄造成的交通事故,但对于因人为因素造成的交通事故,如交通法规意识淡薄,该项政策则无济于事。该项政策只能解决问题的一个方面,而不能解决由其他原因造成的交通事故。第二,许多公共问题因其所涉及的复杂环境,难以解决或难以彻底解决。这些问题一般都涉及到人性或国家利益。“它们往往另人难以抗拒地、顽强地支配着人和国家,使彼此争斗或关系紧张,这就不是某项福利政策或和平外交政策所能解决的。”
(3)政策超前或滞后。有些政策虽然反映了人们良好的愿望,但在实际执行过程中也惨遭失败。因为该项政策不符合现实的基本情况,更多地是基于某种观念而制定的,而这种观念在目前还不能被广大群众所接受。比如,目前正在热烈讨论的关于“脑死亡”问题。基于全人类人道的角度来考虑,改变传统的死亡判断标准,承认脑死亡,可以为需要器官移植的人带来莫大的福音。但对于脑死亡家属个体来讲,由于传统、亲情等种种复杂因素的影响,绝大多数人无法认可在病人尚有呼吸的情况下就移植他(她)的器官。观念的转变还需要很长的时间。如果我们现在就制定出允许移植脑死亡者器官的政策,可能会遭到失败。因为在目前来讲,这个政策是超前的。
还有些政策的失败是因其滞后性。政策的形成总是需要时间的,再加上有些时候政府某些环节的低效率,当政策制定出来并准备执行时,政策意在解决的问题已发生了性质的变化,该项政策已明显不适宜当前的情况,若继续执行,那政策自然要失败。
4.解决某些问题的代价大于利益
有些问题的彻底解决代价高昂,所以难以执行相关政策。以美国为例。“如果我们付大得多的代价去加强警察监视,个人的约束,宵禁等诸如此类的活动,那么,就有可能完全消除‘大街上的犯罪活动’。但是,这对个人自由的影响是巨大的,而且,个人自由的缺乏将成为某种问题”。在我国类似的例子也有很多。黄色书刊、光盘屡禁不止,经数次扫黄打非也难以彻底杜绝。如果我们加强出版界的管理,严格控制和审查出版物,甚至限制相当数量的出版物,那这个问题就会得到很好的解决。但同时,公民言论自由就会受到很大程度的限制,文艺界“百花齐放”、“百家争鸣”的局面也不再存在。这又势必是一种历史的倒退。因此,我们难以彻底有效地解决这个问题。
5.外在因素的干扰人类生活总不会平淡如水。随着经济生活的快速发展,新问题越来越多地出现在。其中一些又是非常紧急的。这时,政府的注意力不得不转向新问题,从而冲淡了对原由问题的关注程度。比如国内政治环境的突变、大的自然灾害的发生、战争或经济形式的骤变,这些都可以使原有政策付之东流。例如,美国“9·11”事件发生后,全国上下立即抛开其它各类问题,而把“反恐”提到了首要位置上,数量众多的关于“反恐”的政策被制定出来,原有的政策在一定程度上受到忽视。而当反恐进行了一年多之后,相关政策又被“打击伊拉克”这个新问题冲淡。政府和全国民众,不管其持何种态度,但其关注的热点都是有关“打击伊拉克”的。
并非所有的政策都能被高效地执行,其中的原因多种多样。有些原因是人力所无法预料和控制的,但由于人为因素造成的政策失败是更为多见的情形。在执行这种政策时,不但不能解决问题,还浪费了资源,甚至会使情况恶化。因此,对政策进行科学评估,找出政策失败的原因,就显得更为重要了。增强评估意识,提高评估人员素质,利用科学的评估方法和技术进行评估工作,是目前政策活动中急需加强的环节。
第三节 推进中国政策评估事业的思考
作为是政策过程的重要环节之一,政策评估已成为政策科学的理论与实践的一个基本主题。政策评估是我国政策过程中的薄弱环节之一,研究我国政策评估事业的现状,认识我国政策评估事业的不足,从而推进我国政策评估事业的发展对我国加快实现决策科学化民主化具有不可替代的作用。
政策评估面临的困难对公共政策做出系统和全面的评估,面临着重重困难与障碍,这突出地表现在下列几个方面:
1.政策评估的不确定性政策评估的一项重要任务就是衡量政策是否达到预定目标,这要求政策本身具有明确的、可测定的目标。但是,由于政策问题的复杂性以及政策制定者的一些主观因素,使政策目标难免出现分散和不确定的情况:(1)许多政策目标不可能量化,比如一些政治类和文化类的政策;(2)多数政策都具有多重目标,有些目标之间还存在着矛盾;(3)在政策执行过程中,政策目标还可能发生变更而被修正;(4)有时,决策者还有意用含糊的、不太确定的形式来表达政策目标,以此增加某种应变的能力。 所有的这些情况将可能导致政策评估主要价值标准的选择和价值标准序列的排列出现混乱,从而给政策评估造成很大的困难。
2.政策效果的不确定性由于政策活动涉及面广、参与者多,政策执行后产生的影响往往涉及到社会生活的方方面面,既有预期的影响,也有非预期的影响;既有显性的、一目了然的影响,也包括潜在的、不易感知的影响;既有短期的影响,也有长期的影响。例如,我国的计划生育政策的基本目标是控制人口数量,提高人口的素质。但是,计划生育政策执行的效果却不仅仅是对人口数量产生影响,它还带来了一系列其他效果,这些效果有正有反、有利有弊。比如,它使人们逐渐改变“多子多福”、“养儿防老”等传统的婚育观念,逐渐形成“晚婚晚育,少生优生”的婚育观念;有利于妇女的身体健康,增加了妇女参加社会工作的机会,提高了妇女的社会地位等等。但是,这项政策的实施也带来一系列负面影响:我国人口老龄化趋势加快,出生婴儿性别比失衡,独生子女户的后顾之忧,干群关系紧张等。正是政策效果的多样性和影响的广泛性,再加上许多影响政策的因素难于测定,这就给评估带来了很大的困难。此外,政策效果的不确定性还使某些反对评估的人有了借口,也为某些不科学的评估的出现创造了条件。例如,有些受局部利益影响的政策评估只从政策广泛影响中选取对本部门有利的因素进行评估,从而影响了评估的全面性和客观性。
3.政策资源的混合和政策行为的重叠政策资源的混合指的是投入不同政策的资源彼此纠结在一起,分不清某项资源的支出究竟是属于哪一个政策,或某项政策的总投入到底是多少。政策资源的混合使政策的成本难以核定,而其“纯效果”更是无从测定。政策行为的重叠指的是针对相同的或相似的政策问题和政策目标群体,不同的机构和部门都制定并执行各自的政策。各种不同的政策效果混杂在 一起,很难将某项政策的实际效果从总体效果中区分出来。
4.政策行动与环境改变之间的因果关系不易确定除了政策行动的影响外,实际社会情况的改变还会受到政策行动以外其他因素的影响,这就使得政策行动与环境改变之间的因果关系不易确定。比如,犯罪预防政策的目标是以威慑的方式防止犯罪的发生,而问题是:犯罪行为若没有发生,是否一定是犯罪政策所发生的作用呢?这个问题很难回答。或许某人曾经有过犯罪的念头,但是害怕受到惩罚,从而没有付诸行动;或许是受到亲人朋友的及时劝阻;也可能是尚在寻找合适的下手机会。
5.评估信息和评估经费缺乏获取真实而全面的第一手资料和各种数据,是进行政策评估的基础和前提。如果没有足够的统计资料和其他方面的信息,政策评估就成了无本之木和无源之水。在我国,政策信息工作还比较落后,许多政策机关不重视信息管理,信息收集系统尚未形成,政策评估所获得的数据往往是残缺不全、杂乱无章的。再加上一些抵制评估的工作人员拒绝提供关键性资料,这大大增加了政策评估的难度。
政策评估是一项复杂、系统的工作,需要投入相当的经费、设备和人力。但在现实中,评估工作及其价值尚未引起人们的足够重视和认同,很难指望人们从现行政策资源中拿出成本作为评估之用,政策评估常常处于经费短缺状态。即使有的政策机构愿意提供评估经费,他们也总是千方百计地试图影响评估的结论。因此,评估资料欠缺和评估经费不足始终是困扰政策评估的两大难题。
6.有关机构和人员的抵制所有政策评估最终都不可避免地涉及政策功绩的评判,而政策是由人来制定并执行的,所以,政策评估实质上是对有关人员行为的一种价值判断,政策评估本身就具有批判性,是借助批判手段实现建设性目的的活动。有关机构和人员既可以是政策评估最坚强、有力的支持者,也可以是最坚强有力的反对者,而他们的态度取决于其对政策评估价值判断倾向的认同程度。
在许多情况下,尤其在评估主体来自政府体制之外时,作为“组织”的政府经常会持有怀疑的态度,因为他们害怕评估会打破现有的秩序,或者带来利益损害。这种怀疑和担心常常使他们最终对评估持反对、抵制的态度。评估通常意味着变革,而“惰性”正是官僚组织的特性之一。组织的“惰性”和实为明显的抵抗形式一起成为评估的一种障碍。
有关人员的抵触主要来自三方面原因:一是担心评估会得出不利于他们的结论;二是对政策过程的独占心理驱使他们反对他人进入,以免影响他们的行动计划;三是人的本能的支配心理,有关人员的抵触主要表现为拒绝提供评估经费和资料,藐视、贬低和否定评估结论等。在政策评估面临的所有困难中,人为的抵制是最直接的、也是最严重的困难。
二、我国政策评估的现状我国公共政策评估的现状可以概括为:刚刚起步,问题重重。在我国,随着政策科学理论与实践的发展,科学政策对经济发展和行政效能的巨大推动作用,党和政府已经日益重视政策评估对决策科学化、民主化的重要作用,并在实践过程中鼓励政策评估,开展政策评估。特别是中央出台的一些重大的基本政策,比如国企改革、政府机构改革、金融制度改革等,无一不是经过专家和权威人士无数次调查研究、评估论证才最终出台。我国从中央到地方各级政府内部都设有专门的政策研究机构,在最高层次设有中共中央政策研究室,国务院发展研究中心等;在各高校和科研单位也都有专门进行政策研究的机构和人员。我国的新闻媒体、报刊杂志、人民大众等社会舆论也开始呈现参与政策评估的热情,这是我国政策评估相对喜人的一面。
但是,另一方面,我国的政策评估还相当不规范、不完善,而且受到较多人为因素的影响,存在种种问题与困难。尤其是地方政府层次,虽然设立了相关政策研究和评估机构,但是这些机构参差不齐,它们的主要工作是进行调查研究、分析预测和指导政策执行,很少对一项政策进行独立、正式和全面的评估。即使有进行政策评估,其目的多半是被动的,评估往往是形式主义的,评估在很多时候成为对政府欲出台的政策的可行性论证。目前在我国,严格遵循政策评估规律,按照系统的政策评估程序进行的正式和规范的政策评估基本上不存在。因此,政策评估可以说是我国政策过程中最为薄弱,最为苍白的一个环节,甚至可以说是政策过程的一个瓶颈。具体来说,当前我国政策评估工作存在的主要问题有:
1.评估者缺乏对政策评估的科学认识和认真态度我国还没有形成科学的政策评估机制,决策主体(评估者)往往视政策评估为可有可无的工作,能不评估的尽量不评估;迫于需要进行评估的,往往缺乏科学的态度和方法,甚至经常夹杂着种种不良的动机,有意识地夸大或缩小,掩盖或曲解评估中的某些事实,以求实现某种特殊目的。我们把这种有意识歪曲评估的行为称为政策评估的“主观误区”,这种“主观误区”在我国政策评估过程中主要表现为五种形式:
一是以研究取代服务。这在实践中表现为评估者借科学评估之名,故意拖延时间,使政策决定或政策终结迟迟不能完成。在此,评估研究是虚,不愿提供服务是实。
二是以好恶取代科学。这在评估实践表现为有些评估者进行政策评估的意图在于使效果不佳,绩效不良的政策合理化;有些评估者则以评估来掩饰决策的失败或错失;有些评估者甚至运用不正当的评估来地达到抵毁对手的目的。这种政策评估的目的不在于政策,而在于政策背后的利益。
三是以评估为沽名钓誉的手段。有些政策评估的目的在于证明政策的正面效果,对政策的负效应则避而不谈。这种做法实质上是把主体当作炫耀,工作绩效的手段和歌功颂德的工具。
四是以形式取代研究,有些时候,政策决定实际上早已做出,或者对某项政策的实践效果已经形成定见,却要借政策评估的形式肯定其合法性。
五是以获取资源取代政策目的。这在评估实践中表现为有些政策主体借政策评估来证明政策的重要性,同时证明客观资源不只是影响政策的主要原因,从而要求更多地获取政策资源,尤其是评估经费等经济性资源。
2.评估标准以价值判断为主,评估方法以定性分析为主评估标准是衡量政策质量高低的尺度,是政策评估的“准参照物”。科学的评估源于正确、合理的标准,评估标准的确定本身就是政策评估的一大难题。除了以价值判断为主的主观标准之外,不同类型的公共政策各有其专门的、特殊的评估标准。特别是价值标准由于主观性较强,容易受评估主体因素的影响,因此加强政策事实分析,把事实分析与价值判断相结合是科学,准确评估的客观要求。然而,由于我国的传统与现实十分重视意识形态以及道德是非,这就助长了评估者用原则判断取代事实分析的思维习惯。此外,当前我国从事官方政策评估工作的人士绝大部分都非“内行”,从事政策研究的专家、学者大多数是研究社会科学出身的,很少有人兼备自然科学和社会科学知识,其知识结构和思维方式比较单一,难以兼有思辨和公理化思维方式的长处,他们在政策评估时不可避免地偏好用价值判断取代事实分析。
政策评估方法与政策评估标准一样,是政策评估不可缺少的工具和手段。与政策评估准不同的是,评估方法较具操作性和具体性。政策分析学科已经探索出一系列科学的政策评估方法,特别是定量分析的方法。但是,当前我国政策评估实践中使用的仍然是定性分析方法多,定量分析方法少;政策评估实践中用价值判断取代事实分析,用定性评估取代的行为导致我国政策评估的“主观误区”频频发生,也为某些具有不良动机的评估人员提供了实现私利的可能性。
3.缺乏独立的政策评估组织政策评估组织一般包括官方评估组织和非官方政策评估组织,我国政策过程的显著特征是“行政的双轨结构功能系统”,即从中央到地方的各级党委与各级人民政府。我国从中央到地方各级政府内部均设有相关的政策评估组织,但在实际运行中,这些机构往往摆脱不了对政府的依赖性,处于附属地位。这些机构在政策评估过程中常常受到来自上级领导的压力,无法独立、自主、客观和公正地展开工作,导致这些官方评估机构往往名存实亡,成为论证上级政策可行性的傀儡工具。非官方政策评估组织,主要是民间政策研究组织和社会中介评估组织,这在我国当前仍然是相当缺乏的。目前我国各级政府的政策研究组织承担了政府政策评估的大部分工作,而由专业人员组成的专业政策评估机构在我国的很多地方尚未建立起来。
4.评估对象以政策输出为主,忽视对政策影响的评估当前我国政策评估在很大程度上停留在对政府行为的检测,或者对政策实现预定目标的程度的检测,而对于更深层面的政策影响的评估却很少涉及或根本不涉及。这种对政策效果的片面认识导致了我国政策评估很不全面,而其对政策方案制定的影响力也因而大大缩小。
5.资料和评估经费的欠缺评估资料和评估经费的欠缺是困扰我国政策评估的两大难题。充足的,准确的资料和信息是进行政策评估的基础,这有赖于完备的资讯管理系统的建立。然而我国相当部分政府机关不重视信息管理,资料记录残缺不全,统计数据不准确,信息处理零乱,再加上很多不对外公开的内部资料,使得评估人员获取信息存在重重困难。此外,有些相关人员抵制政策评估,他们或者拒绝提供关键性资料,或者只提供对他们有利的资料,这进一步增大了获取准确信息的难度。
至于评估经费,我国的唯一来源就是上级部门拨款,但在政策实践过程中常常存在拨款不到位,拨款不充足,下级部门没有做到专款专用,人为减少政策评估款项等问题。因此,评估费用短缺是我国政策评估的又一大难题。
6.公众未能广泛参与政策评估在当前我国,人民群众参与政策评估的热情高涨,他们通过各种途径对公共政策进行评议,主要有:一是通过“领导接待日”、“市长电话”、“来信来访”等信访渠道;二是通过上访渠道;三是通过广播、电视等舆论性机构;四是通过街头巷尾的议论。人民群众是政策的直接作用对象,他们对政策执行效果有着最真实,最深刻的体会。人民群众参与政策评估,可以使政府提供的公共服务符合他们的需要,改善和提高公共服务的质量。但是,传统行政管理的自上而下的金字塔型的等级模式限制了公民广泛参与政策评估,公民参与评估常常被当作是负担和费力不讨好的事。再加上我国政治生活中还较普遍存在着的人治现象,公众参与政策的热情未得得到充分的关注与重视,这是我国政策评估过程的又一个缺陷。
三、发展我国政策评估事业的思考针对中国政策评估工作缺陷,必须下功夫,从思想、组织、制度和手段等方面推进政策评估事业,使其要向纵深发展、日益成熟。这不仅是一项富有意义的工作,也是一项紧迫的任务。应从以下几个方面着手推进我国政策评估事业:
1.提高对政策评估工作重要性的认识要推进政策评估工作的发展,必须在思想上进行建设。首先让全社会,尤其是政策部门充分认识到政策评估的意义。这需要加强政策科学的研究和传播,使人们认识到政策评估对于政策过程而言不是无关痛痒、可有可无的环节,而是必不可少的一环,它不仅有助于政策部门认识政策的特点、优劣和成效,监督政策的执行过程,补充、修正和完善政策,而且还有助于开发政策资源,增强政策效益,从而在思想上予以重视并采取相应的行动。其次,必须端正政策评估的指导思想,改变视“评估”为“评优”、为“歌功颂德”的错误观念,正视评估的“批判性”功能,本着发现问题,解决问题,提高决策质量的评估态度,坚持全面客观、公正公平地开展评估工作,以求最大限度地发挥评估的“建设性”功能,为实现决策的科学化和民主化服务。再次,要认识到评估工作的改进与发展是一个循序渐进的探索过程,推进我国政策评估事业的发展既不能“裹足不前”,也不能“鲁莽激进”。政策评估由于受到各种主客观因素的影响在世界各国都是政策过程中的一个薄弱环节,评估工作的开展也面临重重困难。因此,想要一夜之间取得重大突破是不现实的。
2.建立独立政策评估组织缺乏专职独立的政策评估组织和政策评估人员是我国公共政策评估实践停滞不前,有名无实的一个要原因。纵观政策评估开展得比较好的西方国家,无不有相对完善的评估组织,政府和民间有许多评估机构,这些机构拥有大批职业的政策评估人员,他们独立地开展政策评估工作。针对我国政策评估组织的现状,我们可以考虑从以下三个方面进行建设:
一是规范、健全官方的政策评估组织。目前我国党政部门已存在不少的政策研究组织,必须强化这些机构的政策评估职能。必须改变现存的政策制定、评估两者合一的状况,把政策制定和政策执行分别交由两个相互分开的机构独立履行,使其各司其职,各负其责。
二是大力发展民间的政策评估组织,并使之逐渐成为政策评估的重点。只要存在官僚等级制,官方的评估人员必然会或多或少受到上级的压力,这在我国更是一时半刻改变不了的事实。因此,要保证政策评估的客观和公正,必须辅之以外部的、独立的政策评估组织,主要是要发展民间的政策评估组织。民间的政策评估组织具有专门知识和社会关系广泛两大优势,更容易进行社会沟通,了解民意,因而可以获得官方评估组织无法获得的信息。民间评估人员地位中立,更能够保持公正、客观态度。除了专门性的政策研究机构,报刊、杂志和电视等新闻传媒也都非常积极地参与公共问题的发掘与公共政策的评估。我国建立民间评估组织首先需要政府的大力支持,重视民间评估结论,设立优秀评估奖励制度等配套措施,鼓励社会大众积极参与。特别要注意赋予民间评估机构超然、独立的地位,保证其工作免受政府干扰。
三是专业评估人员队伍建设。必须加强对政府决策人员和评估人员的教育、培训,使其掌握政策评估的科学理论和相关技术方法,尽快从“外行”转到“内行”;必须采取有效措施,鼓励和吸引政策分析专业人士到政策评估组织任职工作;加强官方政策评估人员与非官方政策评估人员的交流和合作,最大限度地实现信息共享,把理论评估与决策现实有机统一起来。
3.政策评估的制度化发展政策评估事业除了思想上的软约束之外,还需要辅以制度法规的“硬约束”。制度意味着减少弹性,增加规范,这是使政策评估工作真正成为政策过程的一部分的必要保障。政策评估的制度化主要包含三个方面内容:首先,实现政策评估的程序化。把评估列入政策过程之中,通过制度规定除象征性或符号性的公共政策外,每项政策最终都要进行程度不一的评估。其次,建立政策评估基金,解决评估经费来源问题。政策评估是一项庞大而复杂的系统工程,需要异乎寻常的财政支持,以便组织各方面专门人才,收集大量信息,开展评估工作。最后,重视评估信息的反馈和评估结论的消化、吸收。政策评估的结论必须与相关人员的奖惩直接联系起来,真正实现政策过程中的责、权、利相统一。评估结论不仅提供有关政策的长处和改善的机会的信息,而且提供政策的弱点和不足的信息。这些信息应该用于为重新评价、调整政策目标和后续政策的制定服务,使评估真正起到促进决策科学化和合理化的作用。
4.明确政策目标、精选评估对象要使政策评估富有成效,就必须努力明确政策目标,这当然首先是政策规划阶段的任务。进行政策评估时必须回顾、审视当时的政策目标,了解某项政策的初衷,尽可明确政策目标。同时要精心选择评估对象。在从事评估工作时,就必须慎选评估对象。选择评估对象一般要遵循两个原则:第一,可行性。即选择那些条件比较成熟,比较容易进行评估的政策进行评估,包括政策目标比较明确,评估资源较充足的政策;优点和局限性已经显露的政策;效果显而易见、比较好测定的政策等等。第二,有效性。即选择那些较具效益和价值的政策进行评估。如具有重要价值和显著效益的政策;决定政策效益因素可以得到控制的政策;评估的结论具有推广价值的政策;评估成本较低的政策等等。根据以上两个原则,选定评估对象,力争较好的评估效果。
5.建立健全政策评估的信息系统这项工作是收集、整理、加工和使用政策信息,为政策评估服务。这是政策评估的基础工作之一。没有足够质量的信息,不能进行科学决策;同样,也无法进行科学评估。但是由于政策资源的多元性、政策重叠现象的存在、政策影响的广泛性,要全面收集政策信息又是一件复杂而困难的事。因此,要在政策过程的开始阶段就建立政策信息系统,对政策信息的收集、加工、交流和使用进行理论研究和总体设计,以便于改进评估系统,使评估活动更科学有效。政策信息系统的核心任务是系统地记录有关政策问题、政策投入、产出和外部环境变化等方面的信息资料。
必须建立覆盖全社会的,快速的信息反馈网络。政府部门除了法律规定应予保密的信息之外,其它一切有关公共政策制度背景、执行情况、评估结论等信息均应该通过网络及时向社会传播,最大程度地避免信息截留、失真。建立信息网络系统可以最大限度地实现决策中心,评估组织和社会公众之间的有效沟通,加快决策的科学化与民主化。
5.引入科学的评估理论、方法和技术长期以来,我国的政策评估工作主要是判断政策实施后的效果是否与制定政策时的目标相一致,缺乏先进的评估理论、方法和技术。要克服这一问题,应该借鉴国外先进的评估理论和实践经验,引入科学的评估方法和技术。有如学者所言:现在中国最大的问题不是在于是不是应该引进西方先进的公共政策理论,现在的问题是如何使这些理论本土化,并迅速地普及这些先进的理论。”
总之,在我国,由于政策评估发展的历史短暂,其工作又不易开展,政策评估事业尚处于起步阶段。政策评估是一项涉及面广、操作复杂的系统工程,加强和推进我国的政策评估事业需要做很多方面的工作,因此需要社会各有关部门和人士广泛支持,在实践中不断摸索,不懈努力。
案 例高雄市社会发展评估*
1979年7月高雄市制订“高雄市社区发展实施办法”,企图以社区发展之工作方式,发挥各地居民之自助精神,以配合高雄市之都市建设与工业建设,可是近年来高雄人口剧增,工业快速成长、社会急剧变迁、各种社会问题随之产生。为此,高雄市政府研究发展考核委员会为检视该市推行社区发展之得失,并研究如何加强社区精神伦理建设,遂于1983年委托台湾东海大学社会学系教授兼主任徐震对该市社会发展实施评估,现将徐震刊于其专著《社会发展——方法与研究》的部分内容摘录如下,
鉴于该市发展项目实施前后的资料欠缺,此项评估无法著重于时间上前后的比较,乃采用问卷调查方式,从各社区接受服务者与从事服务者等对于发展工作上之满意程度、贡献评价及意见,以归纳而评估既往工作之得失,作为未来发展的凭借。
1.评估研究目标。从既往社会发展工作中评定:社区建设各项目是否切合居民需要?其工作方法是否符合地区工作目的?现有社区发展之组织是否能发挥社区的自助功能?已有的精神伦理建设是否能发挥社区的教育功能?
2.研究范围。根据上述目标,确定评估研究的范围,其主要项目为:该市社区发展组织、社区发展规划、机构配合、工作项目、工作方法、经费资源、工作人员、成果维护,其它社区居民反映等。
3.研究结构。根据上述目标范围,其研究指标可归纳如下:(1)对社区发展工作中三大建设的成效评估,其指标为,居民对各项工作及活动的满意程度;居民认为各项工作及活动的贡献程度;行政人员认为居民对社区各项工作的欢迎程度。(2)对社区发展工作运作过程之评估,其指标为:社区组织的功能是否发挥;机构是否协调;居民参与积极否;经费运用适当否;专业资源是否运用。(3)对其它影响社区发展因素及其成效的探究,其指标为:居民对社区内之公共问题严重程度之评估,如环境卫生问题,交通秩序问题,青少年犯罪问题,盗窃问题等;居民对社区内生活环境满意程度之评估,如教育、医疗设施,水电、交通设施,治安休闲娱乐设施等。
4.研究架构、方法和步骤(从略)
5.研究结论。根据各项研究所得各类资料,加以统计分析,综合研究,并依照高雄市当前社会发展实况与都市发展之趋势,就社区工作的立场,加以解释与推断,作成结论并提出检讨与建议,如下列四项。
1.对于以往社区发展各项建设之评估
(1)对于三大建设的评估
指标之一,满意程度,依原报告各种统计资料,简化如下表(表一)
满意程度分项
相当满意
普通
不甚满意
合 计
基础工程建设
68.4
22.3
9.3
100.0
生产福利建设
62.1
21.8
16.1
100.0
精神伦理建设
63.9
20.3
15.8
100.0
指标之二是贡献程度,依资料简化如下表(表二)
满意程度分项
相当满意
普通
不甚满意
合 计
基础工程建设
73.5
17.7
8.8
100.0
生产福利建设
69.1
15.0
15.9
100.0
精神伦理建设
62.5
21.3
16.2
100.0
从以上表一和表二所得观察,可见多数社区居民对于以往历年来社区发展工作之评估,均表示相当满意与颇有贡献。惟在满意与贡献的程度上,以
a.基础工程建设之评价为最高。
b.生产福利建设之评价次之。
c.精神伦理建设之评价为最低。
基于居民对于社区发展三项建设在满意、贡献与需求三方面之评估,作者曾建议高雄市政府对于此三项社区发展工作,均应予以继续加强,而对于生产福利建设与精神伦理建设,尤应视各社区之未来需要,予以特别加强。
(2)对于分项工作之评估
依据此项研究综合评估之资料,其社区居民与行政人员对于三大建设中,各分项工作在改善社区生活之贡献方面,其评定之次序,如下表,
对改善社区生活最有贡献之工作项目
社区居民认为最有贡献之工作及次序
行政人员认为最贡献之工作及次序
基础工程建设
1改善巷道铺设水泥柏油路面
2.兴建社区活动中心
3.改善照明设备
4.兴建排水沟
1.兴建排水沟改善巷道铺设水泥柏油路面
3.兴建社区活动中心
4.改善照明设备
生产福利建设
1.成立社区生产建设基金
2.办理社区卫生保健班
3.设立社区托儿所
4.提供家庭副业
5.推行家庭计划
6.办理就业辅导
1.设立社区托儿所
2.办理就业辅导
3.家庭卫生指导与医疗服务
4.改善家庭卫生
5.举办技术训练
6.提供家副业
精神伦理建设
1.设置社区精神堡垒
2.社区妈妈教室
3.设置蓝球场
4.社区童子军团
5.社区志愿服务队
6.设置国乐社活动
1.设置社区小型公园
2.设置社区儿童乐园
3.社区全民运动
4.设置花坛美化环境
5.设置兰球场
6.早觉会活动
从上表可见:a.在基础工程建设方面,社区居民认为最有贡献之工作项目与行政人员之看法大致相同,惟次序不一。b.在生产福利建设方面,两者之选择有一半项目不同,且次序不一。c.在精神伦理建设方面,两者之选择有六分之五的项目俱不相同,且次序标准,极不一致。
以上除基础工程建设,工作比较具体,看法容易一致外,其余两项社区居民与行政人员所持之标准与看法多不一致,行政人员认为对社区最有贡献之项目并不被社区居民所接受。
由于社区发展工作得以社区居民之需要为主体。因此,作者曾建议,对于社区发展之工作项目,应视不同社区之不同需要,采用多元模式,尽量让社区理事会依照居民之意见,自行规划、自行选择。
[思考题]
1.什么是政策评估?政策评估的意义何在?
2.政策评估有哪些基本类型?如何看待评估标准?
3.简述政策评估的过程及方法。
4.政策评有哪些基本模式?
5.政策评估面临哪些困难?如何推进政策评估事业?
6.分析上述案例,说明“高雄市社区发展项目”的评估过程。
政策评估是政策过程的一个重要环节。只有通过政策评估,人们才能够判断一项政策是否收到了预期效果,从而决定这项政策是应该继续、调整还是终结;同时,通过政策评估,还可以总结政策执行的经验教训。本章讨论政策评估的几个基本理论问题。
第一节 政策评估概述
政策评估是政策分析的重要方面,是一种具有特定标准、方法和程序的专门研究活动。
在相当长的时间里,政策评估并为引起人们的重视。作为公共政策分析过程中不可或缺的一环,政策评估在政策分析过程中有着重要意义。
一、政策评估的概念尽管目前对政策评估的研究已越来越多,但对于政策评估这个概念却没有一个统一的,能被绝大多数学者、专家普遍认同的定义。先看看几种有代表性的定义:
安德森:“如果把政策过程看作某种有序的活动的话,那么,它的最后一个阶段便是政策评价。总的说来,政策评价与政策(包括它的内容、实施及后果)的估计、评价和鉴定相关。作为某种功能活动,政策评价能够而且确定发生在整个政策过程中,而不能简单地将其作为最后的阶段。”依这种看法,政策评估的目的是评价人们所执行的政策在实现其预定目标上的效果,该政策在多大程度上解决了政策所指向的问题,以及该效果的取得是政策本身的作用还是政策以外其它因素所导致的等等。
那格尔:政策评价“主要关心的是解析和预测,它依靠经验性证据和分析,强调建立和检验中期理论,关心是否对政策有用,而主要关心的是把评价看成一种科学研究活动”。在这里,政策评估被看作一种分析的过程,评估者通过搜集相关信息,运用定性与定量分析方法和技术,对各政策方案进行分析,确定各种方案的现实可行性及优缺点,以供决策者参考。
林水波、张世贤:政策评价是“有系统地应用各种社会研究程序,搜集有关资讯,用以论断政策概念与设计是否周全完整,知悉政策实际执行情形、遭遇的困难,有无偏离既定的政策方向;指明社会干预政策的效用。”在他们看来,政策评估不仅是对政策方案的评估,而且包括对执行情况和政策结果的评估。政策评估被看作是一种着眼于整个公共政策全过程的广博的收集资料、论证评价的过程。
朱志宏:“就一项公共政策而言,发现误差、修正误差就是政策评估,换言之,政策评估的工作就是发现并修正政策的误差。”按照朱志宏等人的观点,公共政策过程是未来取向的,评估者凭借自己已具备的知识和经验,对公共政策全程跟踪观察,发现问题并随时纠正。在某种程度上,类似于引领航行的导航员。
可见,学者们对于政策评估概念的界定见仁见智,归纳起来主要有四种观点政策评估含义的四种观点:(1)政策评估的着眼点应是政策效果;(2)政策评估主要是对政策方案的评估,属于政策评估中预测评估的范畴;(3)政策评估是对政策全过程的评估,既包括对政策方案的评估,还强调对政策执行以及政策结果的评估;(4)政策评估就是发现误差,修正误差。这些定义各有千秋,但后面三种定义的不足之处较为明显的。我们倾向于第一种观点,将政策评估主要看作是对政策结果的评估。
因此,可以给政策评估下这样的定义:政策评估是依据一定的标准和程序,对政策的效益、效率及价值进行判断的一种政治行为,目的在于取得有关这些方面的信息,作为决定政策变化、政策改进和制定新政策的依据。
二、政策评估的类型
随着政府活动的日益复杂化和影响的深广化,政策评估也日益呈现出多样化的特点。国内外学者依据不同的标准,从不同的角度对政策评估进行了分类。不同的分类显示了学者们研究重点的不同。
在国外评估研究的文献中,有不少关于政策评估的分类方法:美国评估研究协会根据工作程式把方案评估分为六类,即前端分析、评估性测定、过程评价、效力评估或称影响力评估、方案和问题监控以及元评估(或称综合评估),这六种评估类型构成了方案评估的日常内容。美国社区服务管理局曾提出三种类型:方案影响评估、方案策略评估和方案监控。 而学者R?M?克朗赞同R?施赖德的看法,认为评估是一种循环的问题过程并将评估分为五类:系统评估、投入评估、过程评估、总结评估和测评估。德尔金斯(D.N.T.Derkins)则根据政策发展过程建立了六种评估类别,分别是策略评估、顺服评估、政策设计评估、管理评估、干预效果评估和影响评估。
在国内评估研究的文献中,政策评估的分类表现为两个大的趋势:一是认为政策评估应分为三类,即正式评估和非正式评估;内部评估与外部评估;事前、执行和事后评估。二是赞同从政策影响的角度对政策评估做诸如效益、效率、效果等方面的分类。台湾学者林水波、张世贤则把政策评估分为四类:第一类是政策执行评估,包括内容摘要、政策的背景环境、原定政策主要特征总述、执行评价描述、总结与考虑;第二类是影响评估;第三类是经济效率分析;第四类是推测评估。
从不同的角度,依据不同的标准,我们也可将多样化的政策评估分为不同的种类。从评估组织活动形式上看,可分为正式评估和非正式评估;从评估机构的地位看,可分为内部评估和外部评估;从政策评估在政策过程所处的阶段来看,政策评估又可分为事前评估、执行评估和事后评估。
1.正式评估和非正式评估从评估组织活动形式上看,可分为正式评估和非正式评估。非正式评估指对评估者、评估形式、评估内容没有严格规定,对评估的最后结论也不作严格的要求,人们根据自己掌握的情况对政策做出评鉴的评估。正式评估指事先制定完整的评估方案,并严格按规定的程序和内容执行,并由确定的评估者进行的评估。它在政策评估中占据主导地位,其结论是政府部门考察政策的主要依据。
2.内部评估和外部评估从评估机构的地位看,政策评估可分为内部评估和外部评估。内部评估是由行政机构内部的评估者所完成的评估。它可分为由操作人员自己实施的评估和由专职评估人员实施的评估。外部评估是由行政机构外的评估者所完成的评估。它可以是由行政机构委托营利性或非营利性的研究机构、学术团体,专业性的咨询公司,大专院校进行的,也可以是由投资或立法机构组织的或由报纸、电视、民间团体等其他各种外部评估者自己组织的。内部评估和外部评估各有其利弊,因此,在实践中,应把内、外评估结合起来,取长补短。
3.事前评估、执行评估和事后评估从政策评估在政策过程所处的阶段来看,政策评估又可分为事前评估、执行评估和事后评估。事前评估是在政策执行之前进行的一种带有预测性质的评估。事前评估的内容包含三方面:对政策实施对象发展趋势的预测,政策可行性的评估,对政策效果进行评估。 执行评估就是对在执行过程中的政策实施情况的评估,就是具体分析政策在实际执行过程中的情况,以确认政策是否得到严格地贯彻执行。事后评估是政策执行完成后对政策效果的评估,旨在鉴定人们执行的政策对所确认问题确定达到的解决程度和影响程度,辨识政策效果成因,以求通过优化政策运行机制的方式,强化和扩大政策效果的一种行为。它在政策执行完成以后发生,是最主要的一种评估方式。
三、政策评估的标准政策的评估过程是一种紧紧围绕着政策效果而展开的活动。为了弄清楚一项政策的效果究竟是好是坏,是否实现了预期的目标,就必须首先建立一套评估的标准,即进行价值判断的尺度。没有标准将无法对一项政策进行正确客观的评估。而且这些标准是“所要分析问题的核心所在”。由此可见标准在评估中的重要地位。此外,“较早说明评估标准也有助于日后避免出现选择个人偏好的方案的倾向”。但是,在现实的政策活动过程中,由于政策涉及面广,参与人数众多,政策过程中的变量因素很多,因此难以设定一个统一的,能被绝大多数学者共同认可的标准。
国内外学者在这个问题上也是各有自己的见解。例如,帕顿和大卫·沙维奇说:“我们将运用巴尔达奇的类型学方法来组织我们对通常使用的评估标准进行一次回顾。巴尔达奇界定了对政策设计目标会产生较大影响并会如期发挥作用的四种主要制约因素:技术可行性、政治可行性、经济和财政可能性以及行政可操作性。我们相信,大部分的评估标准都可归入这四种综合类型,而且分析人员应当在每一种类型中为每一个政策问题确定相关标准。” 威廉·N·邓恩在其所著的《公共政策分析导轮》一书中,将评估标准分为七类,分别是:效果、效率、充足性、公平性、回应性和适宜性。
台湾学者林水波、张世贤认为,评价标准大致有八个方面:第一,投入工作量。在政策执行过程中所投入的各项资源的质与量以及分配状况;第二,绩效。依据具体明确的目标,分析政策对客观事物与政策环境所造成的实际影响。绩效既包括政策推动的结果,又含有民众心目中认定的满意程度;第三,效率。投入工作量与绩效之间的比例关系;第四,充足性。满足人们需求、价值或机会的有效程度,反映了绩效的高低;第五,公平性。政策所投入的工作量,以及产生的绩效在社会不同群体间公平分配的程度。政策的类型不一样,所反映的公平性的角度与观点也不一样;第六,适当性。政策目标和所表现的价值偏好,以及所依据的该假设是否合适。第七,执行力。探求影响政策成败的原因,进而导致因果模型性的构建。第八,社会发展总指标。对社会状态与发展的数量描述与分析。既反映过去的动向,又可作为社会现状的说明,其特征是以描述性指标为主。
张国庆在《现代公共政策导论》一书中,从一个较独特的视角提出了评估的首要标准和次要标准的概念。他认为,对于一项政策的整体评估是建立在若干单元评估基础上的。所以,他把用于整体评估的标准称为首要标准,把用于单元评估的标准称为次要标准。在这个意义上,他得出的结论是:总量评估和首要标准是自变量,而单元评估和次要标准就成了因变量。但他对首要标准和次要标准的具体内容没有进行阐释。这样,他就从立体的角度构建了一个评估标准的架构。台湾学者朱志宏也提出了“次级标准”的概念。
在公共决策过程中,由于客观条件所限,找到最优决策方案是相当困难的,所以,人们往往退而求其次,在现有条件下,选定一种较为满意的方案,做出一种“满意决策”。同理,在进行政策评估的实践过程中,要寻求一种近乎完美的、放之四海而皆准的评估标准也是相当困难的。因为“选择什么样的评估标准,不仅取决于评估目的、评价者,而且还决定于评价的技术与方法”。因此,在大多数的情况下,人们在评估实践中所依据的也仅仅是一种在此时此地较为满意的评估标准。
我们认为,一般而言,政策评估有如下五个标准:生产力标准、效益标准、效率标准、公正标准和政策回应度(我们将“政策分析过程各步中常用的方法”一章中对这个问题加以讨论)。
四、政策评估的意义政策评估作为一种对政策的效益、效率、效果及价值进行判断的一种政治行为,是政策运行过程这一有机链条中的重要一环。但是,长期以来,人们只顾无休止地制定、颁布这样或那样的政策,对政策的效果如何,所知甚少,缺乏关心。这种只问耕耘,不问收获的态度固然有体制的原因,但是也与人缺乏对政策评估重要性认识有密切关系。事实上,政策评估对于改进政策制定系统,克服政策运行中的弊端和障碍,增强政策的活力和效益,提高政策水平具有重要作用,意义深远。概括地讲主要表现于以下几个方面:
1.政策评估是检验政策的效果、效益和效率的基本途径
任何政策,如果投入运行后,就再没有人去做相关的评估反馈工作,那它的效果如何我们就不得而知。尤其是一项构思精良,经多方论证认定是无懈可击的政策投入运行以后,究竟有没有达到预期目标,产生预期效果,或产生了哪些非预期的连带的效果,这都需要我们进行科学的评估工作。也就是说,评估人员要密切关注政策执行的动向,搜集相关的资料和信息,再加以科学的分析、论证,得出可靠的结论,以确定该项政策是否有好的效果,执行过程是否效率很高以及其效益所在。比如计划生育这一作为我国基本国策的全国性政策,在执行过程中,就需要我们密切关注它的发展状况,以便了解该项政策执行的情况。我们可以通过定期的人口普查以及年度的人口统计资料来确定,通过实行计划生育政策,我国在几年内少增加多少人口,与原始人口数据进行对比,从而可以判定计划生育政策是否被有效执行,哪些地区执行得较好,哪些地区稍差一些。
2.政策评估是决定政策去向的重要依据
一项政策在执行过程中总会呈现出一定的走向。伴随着政策目标实现程度的不断推进,该项政策是应该继续、调整、革新还是终止?这都必须依据一定的客观资料。能够提供这种客观资料的有效活动,只有政策评估。政策的走向一般分为三种情况:第一,政策继续,即通过科学的评估,发现该政策所指向的问题还未得到解决,其政策环境也没有发生大的变化。基于这种情况,还适宜用原来的政策继续指导这个问题的解决。如上面我们提到的计划生育政策,目前我国通过第五次人口普查,确定该项政策的执行已经取得了显著效果,但我国人口多,基数大,所以要继续执行该项政策。第二,政策调整,或称政策革新。如果一项政策在执行过程中,遇到了新情况、新变化,原来的政策已明显不适应新的政策情况,那我们必须对原有政策进行调整或者革新,以适应新变化,更好地实现政策目标。第三,政策终结,也就是完全终止原来的政策。政策终结分为两种情况:一种是政策目标已经实现,原有政策的存在已经没有意义,完成了一个政策周期,自然终结;另一种情况是政策环境或问题本身发生了非常大的变化,原有政策已明显不能解决问题,甚至会使问题变得更为严重,而且通过调整已无济于事,这时就需要终结旧政策,代之以新的,更为有效的政策。为了避免终结旧政策带来的混乱,最好旧政策的终结与新政策的出台能够同步。由此可见,无论是政策的继续、调整还是终结,都必须建立在科学、系统、全面的政策评估基础上。
3.政策评估是合理配置资源的有效手段
在政策实践中,政府的政策资源是有限的,但政府部门却要同时执行多项政策,如经济政策、政治政策、环境政策、教育政策等等。那么,究竟哪项政策该投入多少政策资源,也就是说政策资源要怎样配置才最为合理呢?这就体现出了评估的重要意义。只有通过政策评估,才能确认每项政策的价值,并决定投入各项政策的资源的优先顺序和比例,以寻求最佳的整体效果,以便有效推动政府各个方面的活动。同时,通过政策评估,也可以对照以往的政策资源分配情况,看其是否合理,总结经验,吸取教训,使政策活动优质高效进行。
4.政策评估是公共决策科学化、民主化的必由之路在现代社会,国家管理活动中重要的一环就是政府利用政策来调整、组织社会生产和社会生活。随着社会的发展,各种新情况和新变化层出不穷,单靠传统的经验来决策已经日益应付不了复杂的决策问题。实践证明,经验决策必须向科学决策转变;而政策评估正是使决策迈向科学化的必由之路。通过政策评估,不仅可以检验政策的效果、效益和效率,更合理地配置政策资源,形成一种优先顺序和比例,而且可以与时俱进,随时抓住情况的变化,对政策做出继续、调整或终止的决定。从另一个角度来看,通过评估得出的结论体现了科学性,为下一步的民主决策奠定了坚实的基础。因此,政策评估对于公共决策的科学化民主化是不可或缺的。
第二节 政策评估的过程和模式
政策评估是一种有计划、按步骤进行的活动,是一个有规律可循的系统过程。虽然评估活动步骤会因为评估类型的不同而不尽相同。但是,只要是正规的、科学的政策评估,一般都要经过准备、实施和结束三个阶段。
一、政策评估过程的三个阶段
1.准备阶段作为一项复杂的、系统的工作,政策评估在实施以前必须进行周密的组织准备工作,这是评估工作的基础和起点,也是评估政策得于顺利进行和卓有成效的前提条件。组织准备比较充分,才能保证评估工作有计划、按步骤展开实施,避免评估工作盲目性。组织准备阶段的主要任务包括:
(1)确定评估对象。确定评估对象实质上是解决评估什么的问题。政策具有相关性,某一结果的产生往往是多项政策共同作用的产物,要清楚地划出一项政策作用范围的边界并不容易。同时,并不是任何政策在任何时候都可以而且有必要进行评估。比如,某些政策仅具有象征性意义或者尚未完全发生作用,评估的时机尚未成熟,则暂时没有必要进行评估。因此,根据理论研究与实际工作需要,遵循有效性与可行性相结合的原则精选评估对象(特别是那些比较成熟的、政策效果与环境变化之因果关系比较明显己评估结论比较有推广价值的政策),才能是评估收到最佳效果。
(2)制定评估方案。这是政策评估准备阶段最为重要的一项工作。评估方案是评估实施的依据和内容,评估方案设计的合理程度直接关系到评估质量高低和评估活动的成败。评估方案必须以书面的形式系统、详细地说明以下内容:第一,阐述评估对象,明确指出评估什么;第二,明确评估的目的、意义和要求。评估目的决定评估的基本方向,解决的是为什么进行评估的问题;第三,确定评估标准。事实分析和价值分析以及它们的有机结合是评估标准的基本内容,评估标准通常体现为评估指标体系,它决定评估类型和评估方法;第四,提出评估的基本设想,根据评估目标确定评估的内容、范围,制定出评估方案;第五,评估方案还要说明评估的场所、时间和工作进度,以及评估经费的筹措和使用等问题。简言之,评估方案应将评估的五个基本要素,即评估者(主体)、评估对象(客体)、评估目的(出发点)、评估标准(准则)和评估方法(手段)都包括在内,使它们共同构成一个完整的政策评估系统。
(3)挑选和培训人员。评估的过程实际上是一种理论研究过程,它对评估人员的理论素养要求很高。换句话说,评估人员自身素质和理论水平将直接影响评估的质量。因此,必须选择适当的评估人员,提高他们的理论分析水平和实际操作能力,构建具有较高水准的评估队伍。
2.实施阶段实施评估是整个政策评估活动中最为重要的阶段,实施评估工作的好坏于评估活动的成败紧密相关。实施评估阶段关键是一些具体调查方法和评估方法的运用,该阶段的主要任务有:
(1)利用各种调查手段,全面收集政策制定、政策执行、政策影响和政策效益等方面的信息。信息是政策评估的基础,评估政策的过程其实也是收集信息、处理信息的过程。为了保证所获信息具有全面性、系统性和准确性,需要综合采用各种科学方法来收集信息,常用的方法有:观察法;查阅资料法;调查发;个案法;实验法等。
(2)综合分析政策信息。就是要在收集信息的基础上对那些有关政策的原始数据和信息资料进行系统的整理、归类、统计和分析。
(3)综合运用适合的评估方法,对政策进行评估,得出评估结论。在实施评估的过程中,评估者应该坚持评估材料的完整性和具体分析的科学性两个原则,客观、公正地反映出政策的实际效果。
3.结束阶段结束阶段是处理评估结果、撰写评估报告的阶段。政策评估离不开价值判断,个人的价值判断受客观条件和一些非理性因素的影响,难免有疏漏。因此,当我们收集评估信息,得出评估后,还必须善加处理。首先,要自我检验统计分析评估信息所得出的结果的可信度和有效度。其次,让评估结论与政策设计者、决策者、执行者、参与者会面,以便发挥评估的诊断、监督、反馈、完善和开发功能,提高政策的科学性。为此,必须做好两个方面的工作:撰写评估报告和总结评估。结束阶段政策评估者须形成书面形式的评估报告,提交给有关领导和实际部门,使之了解一项政策实施的最终情形,及时根据情形决定政策的继续、修改、中止等。评估报告除了对政策效果进行客观陈述、对政策进行价值判断、提出政策建议以外,还应包括对评估过程、评估方法和评估中一些重要问题进行必要说明,对评估工作的优缺点进行总结,为提高今后政策活动水平服务。此外,结束阶段还要注意妥善处理决策者与评估者之间的分歧,实现决策者与评估者之间对评估报告的最大限度的协调。
二、政策评估的八种模式
在西方政策评估实践中,有各种各样的模式。如何对这些模式进行分类,这是政策评估学者一直研究的问题。有些学者,如古巴(Guba)和林肯(Lincoln),提出以“组织者”(organizer)作为焦点来进行分类。通常,所选择的价值标准就是评估的“组织者”,这样根据“组织者”的不同就形成不同的评估模式(evaluation model)。以古巴和林肯的观点为基础,德国学者韦唐(Evert Vedung)在《公共政策和项目评估》(1997)一书中,从社会科学更广阔的视角出发,赋予了“组织者”更抽象的含义,从而提出了一个关于政策评估模式的系统分类框架。
韦唐博士从政府干预的实质结果入手,按“组织者”的不同将评估模式分为三大类:效果模式(effectiveness models)、经济模式(economic models)、和职业化模式(professional models)。“效果模式由一个相当大的、各不相同的团体组成。除了传统的目标达成评估(goal-attainment evaluation)外,效果模式还包括附带效果模式(side-effects evaluation)、无目标评估(goal-free evaluation)、综合评估(comprehensive evaluation)、顾客导向评估(client-oriented evaluation)和利益相关者模式(stakeholder model)。”经济模式与效果模式的不同在于前者总是关心成本,而后者是忽略成本的。经济模式的两个基本变种是生产率模式(productivity model)和效率模式(efficiency model)。职业化模式并不直截了当地关心评估的内容,因为它把重点放在了执行评估的人身上。最著名的职业化模式是同行评议模式(peer review model),用这种方法,举个例子来说,就是教授评估教授、工程师评估工程师、外科医生评估外科医生。按照韦唐的概括,政策评估模式的分类如下图所示:
图1 政策评估模式的分类
1.目标达成模式目标达成模式是探讨评估问题的传统方法,它主要由两部分组成:(1)目标达成评价。关注的是结果与由政策(项目)目标是否一致;(2)影响评价。关注的是结果是不是由政策(项目)所造成。应用目标达成模式要按三个步骤进行:第一,明确政策(项目)目标政策(目标)及它们的真正含义,并将它们按重要程度加以排序,再把它们转变成可以测量的客体;第二,测定这些预定目标实际上可在多大程度上实现;第三,弄清楚政策(项目)促使或阻碍目标实现的程度。可见,该模式是以预定的政策(目标)作为评估的标准和组织者,评估的主要任务是判断预定的政策(项目)目标是否已经实现,以及项目在多大程度上有利于目标的实现。
同任何方法一样,目标达成模式有它无可替代的优点,也有它鲜明的缺陷。韦唐对此作了具体的阐述。在韦唐看来,存在三个主要理由去推崇目标达成评估:一是体现了民主。目标达成模式是以预定的政府政策目标作为评估的组织者,政府预定的政策目标是公开而法定地被人民代表在政治议会上所采纳,体现了政治过程中的民主。同时,政治目标是在责任感之下制定的,政治官员在制定目标时会更多地考虑民众利益和可利用的资源。二是提供客观的评估标准。目标达成模式以既定的政策(目标)作为组织者,以项目目标来判断项目结果,所以可以避免评估者在评估项目的价值问题上持个人的主观标准。三是具有简单性。这个模式只包含两个主要的问题,即结果是否与目标一致?结果是否由政策(项目)所引起?
韦唐认为,目标达成模式的缺陷表现在五个方面:第一,忽略了成本。政策过程中需要投入大量的人力、财力、物力和时间等各种资源,这些资源在目标达成模式中完全被忽略了。第二,在目标不清的情况下难以运用。而政策目标的不确定性又是政策分析中常常碰到的问题。第三,不考虑意料之外的结果。目标达成评估只考虑预定的项目目标的结果,而忽视那些偶然发现的结果或意料之外的结果,这是片面的做法。第四,忽视了公共政策制定中的隐秘议程的作用。目标达成评估将官方宣布的、表面的预定目标作为评估的“组织者”,而忽视政治游戏现实中的一些重要东西。比如,官方宣布的目标可能仅有象征性意义,并不打算真正去实现。在这种情况下,目标达成评估往往是无效的。第五,忽视实施过程。目标达成模式只关心项目结果,而实施过程则被看作是一个黑箱。
2.附带效果模式附带效果模式正好解决了目标达成模式的“困境”,即关注非预期的、预料之外的政策效果。附带效果是指项目目标范围之外的影响,与主要效果——政策制定者有意识地想要得到的主要实质性影响——相区别。附带效果模式的特征是预定目标仍然是基本的“组织者”,但是要充分考虑到附带效果的存在。
要认识附带效果,应该把它政策活动中可能出现的反常效果和零效果相区别。反常效果是指产生的与预期目标完全相反的结果;零效果是指政策在目标范围内没有产生任何影响;反常效果和零效果都是产生在目标范围之内,而附带效果则是产生在目标范围之外。
在人们的印象中,附带效果似乎带有贬义,但它并非总是有害的,也可能是有利的。附带效果可以是预期的,也可能是非预期的。一些政策分析家甚至认为大部分政策效果在决策做出时是非预期的。附带效果不管是否有利,都是综合评价政策活动的关键因素,因此必须受到重视。项目可能产生副产品,副产品反过来组成或产生新问题,从而又产生新的政策(项目)。韦达夫斯基写道:“越开越多的公共政策是关于解决过去政策的结果。”因此,有关附带效果的信息对于任何一个政府政策的综合性评价来说都是不容忽视的,不及时发现与及时解决将可能导致更复杂的问题的出现。
附带效果评估遭遇的主要挑战是判断价值时应用的什么样标准。对此,韦唐也没有明确的分析。但他指出,应勾划出主要效果并由委员们和其他评估的使用者去明确它们的价值,计算全部价值的方法是将知道的每一个单独附带效果的价值与主要效果价值相加或者相减。
3.无目标模式无目标模式最初是由米歇尔·斯克里文设计出的,他猛烈抨击评估者沉迷于预定的干预目标,被牵着鼻子走。无目标模式的“组织者”是结果——不管是计划内还是计划外的结果。评估者的主要任务是全面观察政策实施,然后找出所有相关的效果。无目标模式对政策效果持广阔的视角,它帮助评估者全面关注结果,尤其是一些可能被忽视的结果。无目标模式与政策效果模式的主要区别是:附带效果模式仍然是“基于目标”之上的,同时辅之于对各种附带效果的考察评估;而无目标模式则完全抛开政策的预定目标和其他事前标准,只分析研究结果,单纯判断结果的价值。
可见,无目标模式是针对目标达成模式忽视附带效果,在目标模糊时束手无策的弊端而提出的。因此,其应用领域也十分广泛。但是,它完全忽视评估标准和预定目标,只依赖于决策者和权力使用者的公正判断,这显然容易导致主观因素的介入,影响评估的客观公正性。此外,这种模式在实践中还存在难于操作上的困难。斯克里文认为,项目的效果要和顾客以及受影响的人们的需要相比较,但评估者如何查明需求呢?从方法论上来说,找出需要比描述结果更困难。
4.综合模式综合模式的评估范围比目标达成模式广泛得多。该模式认为,评估不应只局限在已得到的结果上,而至少应包括执行,甚至还包括计划。综合模式与目标达成模式的主要区别在于目标达成模式关心的是预定的和实际的结果是否相符,而综合模式除了关心结果,也包括判断政府干预的计划、决策和执行阶段。
从系统论的观点看,公共政策可分为“投入”、“转换”和“产出”三个阶段。综合模式又在每个阶段中区分了描述和判断两个范畴。描述范畴又细分为意图和观察;判断则分成标准和判断。整个干预过程被分成了12个单元,如表1所示:
投入阶段
描述:
① 意图(目标是什么样的,希望得到什么样的效果)
② 观察(发生在这一阶段的活动的相关数据;对现状的描述)
判断:
标准(作为比较基础而使用的价值准则)
判断(比较意图、观察和标准的过程)
转换阶段
描述:
① 意图(项目如它所计划的那样执行吗)
② 观察(实际的执行和项目交付)
判断:
① 标准(作为比较基础而使用的价值准则)
② 判断(比较意图、观察和标准的过程)
产出阶段
描述:
意图(项目所预期的结果)
观察(项目结束后所收集的与实际结果相关的数据)
判断:
① 标准(作为比较基础而使用的价值准则)
② 判断(比较意图、观察和标准的过程)
表1 综合评估模式框架
从表中我们可以看出,综合模式将整个评估活动划分得细致而全面。每一阶段全面而细致的描述为评估工作提供了丰富的信息。从信息到判断,步步递进,使主观判断建立在客观描述基础之上。而且,在每个阶段,政策价值的实现都被衡量到了。因此,这种评估模式是相当完整的。但是,综合模式也存在一些缺陷,如只关注官方的具体目标,不重视成本等。此外,模式的12个单元的设计在实践中很难理解,也很难操作,因而使综合模式在实际应用中受到阻碍。
5.顾客导向模式顾客导向模式将政策干预对象的目标、期望、关心甚至需要作为评估的组织原则和价值准则。顾客导向评估的核心是项目是否使顾客的关心、需要和期望得到满足。
什么是顾客导向?奥斯本和盖特勒在《改革政府》中指出:“顾客导向的政府”向顾客提供选择,“把各种资源直接交到顾客手中,让他们选择服务的提供者,从而开始让顾客坐到驾驶的座位上”,并且“为顾客建立后果负责机制”。可见,顾客导向评估正是基于这样一种观点:公共行政在市场领域为顾客提供物品与服务,顾客表明对服务供应的态度会导致服务交付的改进和顾客满意度的提高。应用顾客导向评估的关键是定位政策(项目)的顾客,得出顾客对项目的看法。顾客导向模式没有明确规定项目的哪些部分应该被评估,它允许进行广泛的、多样的评估。价值的多元化是顾客导向模式的一个显著特征。评估者会要求顾客对服务的某些方面做出判断和发表看法,而不同的顾客的需要和对公共服务的满意度肯定是不同的,顾客可以在评估中表达不同的意见,甚至是相互冲突的观点。
顾客导向模式的最大优点在于体现了民主和参与。由顾客根据自己的价值观评估公共服务,使顾客处在主动的位置上,而不是被动地接受服务;通过参与评估,顾客可以对服务的供应者表达他们的需求和不满,这必然在一定程度上影响服务供应者,并使之提供更加符合顾客需要的服务。这种模式也使得评估更容易为政策制定者或服务提供者所使用,并使他们清楚地了解顾客的需求和不满,从而最终提高公共服务的水平。
至于顾客导向模式的应用领域,韦唐指出:“顾客的价值标准在公共服务方面的评价,比在受规章限制的政府干预的评估中扮演更占统治地位的角色。”也就是说,顾客导向评估主要应用于公共物品和服务的提供领域。但是,顾客的价值标准是以个人利益倾向为准,顾客个人价值的多元化难于形成对政策总的看法。而且,顾客导向模式要获取顾客的看法和需要,则要花费很多的时间。因此,顾客导向模式不能成为评估的唯一模式,而只能起补充作用。
6.利益相关者模式利益相关者是指所有对政策(项目)的目标和执行感兴趣,并对其具有影响的团体和个人。它和顾客导向模式相似,它们的主要区别是顾客导向模式关心的对象是受影响的一组利益群体,而利益相关者模式关心的是所有对象。应用利益相关者模式首先要找出卷入或对项目的出台、执行和结果感兴趣的主要团体和个人。
利益相关者是一个范围及广的概念,这一模式也没有明确界定其范围。下面我们借助联合国开发计划署(UNDP)在对其开发合作项目所作的评估中对重要的利益相关者的界定,来帮助我们对利益相关者的理解。重要的利益相关者包括:(1)目标群体:从计划/项目的结果中最终收益的那部分目标人群;(2)直接收益者:一般是指在承担由特定目标群体所指导的开发任务的同时,可加强其能力的、直接的收益人群;(3)直接管理者:指那些负责保证按计划产生结果的计划管理者及政府职员或联合国执行机构的雇员;(4)资源提供者:负责向计划/项目提供资源的国家政策制定者及预算部门、UNDP、投资人以及其他开发合作伙伴;(5)外部咨询顾问、供应商以及其他对计划/项目提供支持的人或机构;(6)在本计划/项目环境中可能受到计划/项目结果影响或对其感兴趣的其他机构(私人实体机构、社会组织)。
利益相关者模式有许多优点,归纳起来主要表现在三个方面:(1)知识性。利益相关者养成对附带效果和执行障碍的看法为评估者提供进一步研究的知识。(2)应用性。传统的目标达成模式的评估结果往往产生不了什么影响,因为评估者处于孤立地位。而利益相关者模式提高了被关心团体的真正利益被评价的机会,使信息更符合不同利益相关者的真正需要,提高了评估结果应用于实践的可能性。(3)目标管理性。利益相关者模式为没有目标或目标不清楚的政策评估提供了解决问题的策略。在利益相关者模式中评估者应描述各个不同利益相关者的价值观而无需作任何评判,而最好把其留给。利益相关者去做。利益相关者模式的缺陷有忽视评估成本、耗费资源、缺乏对利益相关者的明确界定、信奉实用主义理论等。
7.经济模式同效果评估模式相反,经济模式最典型的特征是关注成本。经济模式可以分为生产率模式和效率模式。
(1)生产率模式。生产率,简单地讲就是产出与投入的比率。如何判断生产率的高低?韦唐在以色列政治学家德洛尔(Y,Dror)提出的政策评估常用价值准则的基础上进一步研究,形成了以下10条准则:①过去——已经取得的生产率和过去的相比较?②国内比较——同一国家或行政区域相似组织间生产率的比较?③国际比价——不同国家相似组织已得到的生产率的比较?④水准基点——和过去最好的经验相比已取得的生产率如何?⑤目标——已取得的生产率符合政治主体的目标吗?这个结果与市政府的目标一致吗?⑥顾客期望——满足顾客的需要吗?⑦利益相关者期望——满足利益相关者的需要吗?⑧职业准则——生产率满足已被接受的职业准则吗?⑨最小化——生产率是否满足最小化的要求?⑩最优化——生产率是否与最优化模式一致?
(2)效率模式。效率通常被当作公共行政的价值。西蒙在他的《行政行为》(Administrative Behavior)一书中说道:行政人员应用实际问题的标准之一是效率。资源、投入、在行政人员的支配下受严格限制……他的功能是有效地应用提供给他的有限的资源使政府项目的产出最大化。
效率可以从两个方面来测量:成本-利益分析和成本-效益分析。在成本-利益分析中,项目的投入与产出都用货币单位测量;而在成本-效益分析中,投入用货币单位而产出则根据真实效果计算。
经济模式是在经济学方法被引进到政策科学领域后迅速形成并广泛应用的一种模式。它克服了所有效果模式的共同缺陷:忽视成本,从而把成本即政策投入作为一个重要指标纳入评估范畴。经济模式在现代政策评估中因为数字的精确性而广受推崇。但是,必须注意,经济模式不是万能的,它在对政策的社会影响、象征性的效果和软目标等无法用数字精确表达的项目的评估是无能为力的。此外,它忽视了民主社会政府干预的其他价值准则,比如公正、公平、民主等。
8.职业化模式职业化模式指职业人员根据他自己的价值准则和执行的质量标准来评估其他人员的执行情况,主要是同行评议,如律师评估律师、教授评估教授、外科医生评估外科医生等。同行评议特别着力于对评估对象作一个全面的质量判断,在一些技术性领域,政治官员们把规划和讨论专业性的技术问题留给受过良好教育的专业人员去完成。实施同行评议首先要选定同行。这个同行应该是具有比被评估的同事具有更专业的知识的专家,并且他们是独立的,并没有实施这一领域的工作;其次,评估者于被评估者应相互作用,评估者应认真考虑被评估者的观点,而被评估者要提供相关的资料。职业化模式主要应用于公共生活中的一些目标较复杂、技术难度较大的领域。
三、政策失败的一般原因尽管人们总是试图制定并实施最有效率、最能解决问题的政策,但现实的情况是,政策失败的现象却屡见不鲜。无疑,进行政策分析与论证,促进政策的科学化民主化是政策评估的重要任务之一,但分析政策失败的原因,从反面吸取教训,从而减少政策失败,提高政策水平,也是政策评估的核心内容之一。从某种意义上来讲,分析政策失败的原因,可以使人们警惕在政策过程中避免类似失败发生,正所谓“吃一堑,长一智”。概括起来,政策失败的一般原因主要有以下几个方面:
1.政策投入不够
一项政策制定出来,在实施过程中,要想获得成功,必须投入相应的人力、物力、财力。如果没有必要的物质投入作保证,那很难想象该项政策该如何贯彻执行下去。投入不够首先表现为资金短缺。财政问题一直是我国政策执行中遇到的一项常见的难题。进行现代化建设,用钱的地方很多。从中央到地方,各级财政都不同程度地存在紧张状况。而政治、经济、军事、教育等各个领域都需要投入相当的资金去实施有关政策。在这种情况下,每项政策所能分得的“蛋糕”就很小,往往不足以支持政策的实施。比如,我国三令五申不能拖欠农村中、小学教师工资,并制定出不少相关政策,但在某些贫困地区有限的财政状况下,这一政策也不能够不打折扣地得到执行。
其次,政策投入不足还表现为执行不力。如缺乏称职的执行人员,缺乏必要的设备或设备达不到执行政策的要求,或执行的方法不够科学等等。执行中投入的时间、精力等资源的不足势必会导致政策不能有效被执行,以至无法实现预期目标,甚至更导致政策失败。就拿我国政府机构精简来说,从建国到现在,精简缩编的政策几度制定并执行,但未能最终跳出“精简——膨胀——再精简——再膨胀”的怪圈。究其原因,诚然影响因素很多,但执行不力应该是一个重要原因。
因此,在今后的政策实践过程中,既然要下大力气执行某项政策,首当其冲的任务就是要保证它的投入。这是政策被有效执行的重要条件之一。
2.目标团体不配合
每项政策都有其固定的指向对象,即便目标团体(或称为政策对象或政策相对人)。目标团体的态度对政策的有效执行也起着至关重要的作用。如果目标团体积极配合,政策就会被顺利执行,并体现出一种优质高效的趋势。而如果目标团体不配合,即使政策执行者投入了足够人力、物力、财力,倾注了很多精力,政策也很难被有效执行,甚至在目标团体的强烈抵制下,政策会惨遭失败。我国许多政策失败的原因就在于此。
以我国的计划生育政策来说,尽管总体上取得了可喜成绩,可以算做是一项成功的政策。但如果我们把目光投向那些活跃在全国的一小部分“超生游击队”,就这部分人来说,该项政策也不是完全成功的。这些人由于传统“传宗接代”、“男尊女卑”等思想在脑海中根深蒂固,所以采取一切可以采取的方法来抵制国家的计划生育政策,甚至不惜背井离乡,到处漂泊。
在这种情况下,政策执行必须找准问题的深层原因所在,通过各种办法,灵活巧妙地做通目标团体的思想工作,转变其旧观念,形成对政策的正确理解。这样,问题也就迎刃而解了。
3.政策本身的问题
政策本身存在的一些问题也是造成政策难以被有效执行的原因。政策本身的原因包括:政策在目标、内容、管理上彼此冲突;有些政策问题纷繁复杂,解决难度大以及外在因素的干扰。
(1)政策在目标、内容和管理上彼此冲突。在经济生活中,不同部门出于不同的考虑制定并执行适合本领域的政策。但不同部门制定的有关涉及同一个问题的政策却常常彼此在目标、内容等方面相互冲突。就象《后现代公共行政》一书所言:“政策是一种自相矛盾的反论,在那里,可能同时存在几种依赖于同一观点的矛盾的真理。”在这种情况下,人们无所适从,政策效果大打折扣。
例如,共同富裕是我们社会主义建设的一条基本原则。为了达到共同富裕的目的,我国又制定了优先发展东南沿海地区的政策。这项政策实际上造成了沿海与内地、东南与西北地区差距拉大的现实。而且这种差距不仅难以在短期内填平,还有越拉越大的趋势。这就与共同富裕的目标存在矛盾冲突,也埋下了社会不稳定的隐患。
又如,为了人民的身体健康,政府利用媒体等形式宣传吸烟有害健康,号召大家不要吸烟。但另一方面,一些大型的卷烟厂却承担着地方经济支柱的重任。为了地方经济的稳定与繁荣,国家又对生产香烟的企业采取了鼓励和保护的态度。同样是围绕香烟,政策上却存在着很大的矛盾。
(2)有些问题纷繁复杂,解决难度大。这包括两种情况:第一,“公共问题是由多种因素引起的,而政策却可能只是要解决其中的一个或数个问题”。如针对某路段交通事故率较高的情况,政府制定出拓宽路面的政策。这在一定程度上有助于减少因路窄造成的交通事故,但对于因人为因素造成的交通事故,如交通法规意识淡薄,该项政策则无济于事。该项政策只能解决问题的一个方面,而不能解决由其他原因造成的交通事故。第二,许多公共问题因其所涉及的复杂环境,难以解决或难以彻底解决。这些问题一般都涉及到人性或国家利益。“它们往往另人难以抗拒地、顽强地支配着人和国家,使彼此争斗或关系紧张,这就不是某项福利政策或和平外交政策所能解决的。”
(3)政策超前或滞后。有些政策虽然反映了人们良好的愿望,但在实际执行过程中也惨遭失败。因为该项政策不符合现实的基本情况,更多地是基于某种观念而制定的,而这种观念在目前还不能被广大群众所接受。比如,目前正在热烈讨论的关于“脑死亡”问题。基于全人类人道的角度来考虑,改变传统的死亡判断标准,承认脑死亡,可以为需要器官移植的人带来莫大的福音。但对于脑死亡家属个体来讲,由于传统、亲情等种种复杂因素的影响,绝大多数人无法认可在病人尚有呼吸的情况下就移植他(她)的器官。观念的转变还需要很长的时间。如果我们现在就制定出允许移植脑死亡者器官的政策,可能会遭到失败。因为在目前来讲,这个政策是超前的。
还有些政策的失败是因其滞后性。政策的形成总是需要时间的,再加上有些时候政府某些环节的低效率,当政策制定出来并准备执行时,政策意在解决的问题已发生了性质的变化,该项政策已明显不适宜当前的情况,若继续执行,那政策自然要失败。
4.解决某些问题的代价大于利益
有些问题的彻底解决代价高昂,所以难以执行相关政策。以美国为例。“如果我们付大得多的代价去加强警察监视,个人的约束,宵禁等诸如此类的活动,那么,就有可能完全消除‘大街上的犯罪活动’。但是,这对个人自由的影响是巨大的,而且,个人自由的缺乏将成为某种问题”。在我国类似的例子也有很多。黄色书刊、光盘屡禁不止,经数次扫黄打非也难以彻底杜绝。如果我们加强出版界的管理,严格控制和审查出版物,甚至限制相当数量的出版物,那这个问题就会得到很好的解决。但同时,公民言论自由就会受到很大程度的限制,文艺界“百花齐放”、“百家争鸣”的局面也不再存在。这又势必是一种历史的倒退。因此,我们难以彻底有效地解决这个问题。
5.外在因素的干扰人类生活总不会平淡如水。随着经济生活的快速发展,新问题越来越多地出现在。其中一些又是非常紧急的。这时,政府的注意力不得不转向新问题,从而冲淡了对原由问题的关注程度。比如国内政治环境的突变、大的自然灾害的发生、战争或经济形式的骤变,这些都可以使原有政策付之东流。例如,美国“9·11”事件发生后,全国上下立即抛开其它各类问题,而把“反恐”提到了首要位置上,数量众多的关于“反恐”的政策被制定出来,原有的政策在一定程度上受到忽视。而当反恐进行了一年多之后,相关政策又被“打击伊拉克”这个新问题冲淡。政府和全国民众,不管其持何种态度,但其关注的热点都是有关“打击伊拉克”的。
并非所有的政策都能被高效地执行,其中的原因多种多样。有些原因是人力所无法预料和控制的,但由于人为因素造成的政策失败是更为多见的情形。在执行这种政策时,不但不能解决问题,还浪费了资源,甚至会使情况恶化。因此,对政策进行科学评估,找出政策失败的原因,就显得更为重要了。增强评估意识,提高评估人员素质,利用科学的评估方法和技术进行评估工作,是目前政策活动中急需加强的环节。
第三节 推进中国政策评估事业的思考
作为是政策过程的重要环节之一,政策评估已成为政策科学的理论与实践的一个基本主题。政策评估是我国政策过程中的薄弱环节之一,研究我国政策评估事业的现状,认识我国政策评估事业的不足,从而推进我国政策评估事业的发展对我国加快实现决策科学化民主化具有不可替代的作用。
政策评估面临的困难对公共政策做出系统和全面的评估,面临着重重困难与障碍,这突出地表现在下列几个方面:
1.政策评估的不确定性政策评估的一项重要任务就是衡量政策是否达到预定目标,这要求政策本身具有明确的、可测定的目标。但是,由于政策问题的复杂性以及政策制定者的一些主观因素,使政策目标难免出现分散和不确定的情况:(1)许多政策目标不可能量化,比如一些政治类和文化类的政策;(2)多数政策都具有多重目标,有些目标之间还存在着矛盾;(3)在政策执行过程中,政策目标还可能发生变更而被修正;(4)有时,决策者还有意用含糊的、不太确定的形式来表达政策目标,以此增加某种应变的能力。 所有的这些情况将可能导致政策评估主要价值标准的选择和价值标准序列的排列出现混乱,从而给政策评估造成很大的困难。
2.政策效果的不确定性由于政策活动涉及面广、参与者多,政策执行后产生的影响往往涉及到社会生活的方方面面,既有预期的影响,也有非预期的影响;既有显性的、一目了然的影响,也包括潜在的、不易感知的影响;既有短期的影响,也有长期的影响。例如,我国的计划生育政策的基本目标是控制人口数量,提高人口的素质。但是,计划生育政策执行的效果却不仅仅是对人口数量产生影响,它还带来了一系列其他效果,这些效果有正有反、有利有弊。比如,它使人们逐渐改变“多子多福”、“养儿防老”等传统的婚育观念,逐渐形成“晚婚晚育,少生优生”的婚育观念;有利于妇女的身体健康,增加了妇女参加社会工作的机会,提高了妇女的社会地位等等。但是,这项政策的实施也带来一系列负面影响:我国人口老龄化趋势加快,出生婴儿性别比失衡,独生子女户的后顾之忧,干群关系紧张等。正是政策效果的多样性和影响的广泛性,再加上许多影响政策的因素难于测定,这就给评估带来了很大的困难。此外,政策效果的不确定性还使某些反对评估的人有了借口,也为某些不科学的评估的出现创造了条件。例如,有些受局部利益影响的政策评估只从政策广泛影响中选取对本部门有利的因素进行评估,从而影响了评估的全面性和客观性。
3.政策资源的混合和政策行为的重叠政策资源的混合指的是投入不同政策的资源彼此纠结在一起,分不清某项资源的支出究竟是属于哪一个政策,或某项政策的总投入到底是多少。政策资源的混合使政策的成本难以核定,而其“纯效果”更是无从测定。政策行为的重叠指的是针对相同的或相似的政策问题和政策目标群体,不同的机构和部门都制定并执行各自的政策。各种不同的政策效果混杂在 一起,很难将某项政策的实际效果从总体效果中区分出来。
4.政策行动与环境改变之间的因果关系不易确定除了政策行动的影响外,实际社会情况的改变还会受到政策行动以外其他因素的影响,这就使得政策行动与环境改变之间的因果关系不易确定。比如,犯罪预防政策的目标是以威慑的方式防止犯罪的发生,而问题是:犯罪行为若没有发生,是否一定是犯罪政策所发生的作用呢?这个问题很难回答。或许某人曾经有过犯罪的念头,但是害怕受到惩罚,从而没有付诸行动;或许是受到亲人朋友的及时劝阻;也可能是尚在寻找合适的下手机会。
5.评估信息和评估经费缺乏获取真实而全面的第一手资料和各种数据,是进行政策评估的基础和前提。如果没有足够的统计资料和其他方面的信息,政策评估就成了无本之木和无源之水。在我国,政策信息工作还比较落后,许多政策机关不重视信息管理,信息收集系统尚未形成,政策评估所获得的数据往往是残缺不全、杂乱无章的。再加上一些抵制评估的工作人员拒绝提供关键性资料,这大大增加了政策评估的难度。
政策评估是一项复杂、系统的工作,需要投入相当的经费、设备和人力。但在现实中,评估工作及其价值尚未引起人们的足够重视和认同,很难指望人们从现行政策资源中拿出成本作为评估之用,政策评估常常处于经费短缺状态。即使有的政策机构愿意提供评估经费,他们也总是千方百计地试图影响评估的结论。因此,评估资料欠缺和评估经费不足始终是困扰政策评估的两大难题。
6.有关机构和人员的抵制所有政策评估最终都不可避免地涉及政策功绩的评判,而政策是由人来制定并执行的,所以,政策评估实质上是对有关人员行为的一种价值判断,政策评估本身就具有批判性,是借助批判手段实现建设性目的的活动。有关机构和人员既可以是政策评估最坚强、有力的支持者,也可以是最坚强有力的反对者,而他们的态度取决于其对政策评估价值判断倾向的认同程度。
在许多情况下,尤其在评估主体来自政府体制之外时,作为“组织”的政府经常会持有怀疑的态度,因为他们害怕评估会打破现有的秩序,或者带来利益损害。这种怀疑和担心常常使他们最终对评估持反对、抵制的态度。评估通常意味着变革,而“惰性”正是官僚组织的特性之一。组织的“惰性”和实为明显的抵抗形式一起成为评估的一种障碍。
有关人员的抵触主要来自三方面原因:一是担心评估会得出不利于他们的结论;二是对政策过程的独占心理驱使他们反对他人进入,以免影响他们的行动计划;三是人的本能的支配心理,有关人员的抵触主要表现为拒绝提供评估经费和资料,藐视、贬低和否定评估结论等。在政策评估面临的所有困难中,人为的抵制是最直接的、也是最严重的困难。
二、我国政策评估的现状我国公共政策评估的现状可以概括为:刚刚起步,问题重重。在我国,随着政策科学理论与实践的发展,科学政策对经济发展和行政效能的巨大推动作用,党和政府已经日益重视政策评估对决策科学化、民主化的重要作用,并在实践过程中鼓励政策评估,开展政策评估。特别是中央出台的一些重大的基本政策,比如国企改革、政府机构改革、金融制度改革等,无一不是经过专家和权威人士无数次调查研究、评估论证才最终出台。我国从中央到地方各级政府内部都设有专门的政策研究机构,在最高层次设有中共中央政策研究室,国务院发展研究中心等;在各高校和科研单位也都有专门进行政策研究的机构和人员。我国的新闻媒体、报刊杂志、人民大众等社会舆论也开始呈现参与政策评估的热情,这是我国政策评估相对喜人的一面。
但是,另一方面,我国的政策评估还相当不规范、不完善,而且受到较多人为因素的影响,存在种种问题与困难。尤其是地方政府层次,虽然设立了相关政策研究和评估机构,但是这些机构参差不齐,它们的主要工作是进行调查研究、分析预测和指导政策执行,很少对一项政策进行独立、正式和全面的评估。即使有进行政策评估,其目的多半是被动的,评估往往是形式主义的,评估在很多时候成为对政府欲出台的政策的可行性论证。目前在我国,严格遵循政策评估规律,按照系统的政策评估程序进行的正式和规范的政策评估基本上不存在。因此,政策评估可以说是我国政策过程中最为薄弱,最为苍白的一个环节,甚至可以说是政策过程的一个瓶颈。具体来说,当前我国政策评估工作存在的主要问题有:
1.评估者缺乏对政策评估的科学认识和认真态度我国还没有形成科学的政策评估机制,决策主体(评估者)往往视政策评估为可有可无的工作,能不评估的尽量不评估;迫于需要进行评估的,往往缺乏科学的态度和方法,甚至经常夹杂着种种不良的动机,有意识地夸大或缩小,掩盖或曲解评估中的某些事实,以求实现某种特殊目的。我们把这种有意识歪曲评估的行为称为政策评估的“主观误区”,这种“主观误区”在我国政策评估过程中主要表现为五种形式:
一是以研究取代服务。这在实践中表现为评估者借科学评估之名,故意拖延时间,使政策决定或政策终结迟迟不能完成。在此,评估研究是虚,不愿提供服务是实。
二是以好恶取代科学。这在评估实践表现为有些评估者进行政策评估的意图在于使效果不佳,绩效不良的政策合理化;有些评估者则以评估来掩饰决策的失败或错失;有些评估者甚至运用不正当的评估来地达到抵毁对手的目的。这种政策评估的目的不在于政策,而在于政策背后的利益。
三是以评估为沽名钓誉的手段。有些政策评估的目的在于证明政策的正面效果,对政策的负效应则避而不谈。这种做法实质上是把主体当作炫耀,工作绩效的手段和歌功颂德的工具。
四是以形式取代研究,有些时候,政策决定实际上早已做出,或者对某项政策的实践效果已经形成定见,却要借政策评估的形式肯定其合法性。
五是以获取资源取代政策目的。这在评估实践中表现为有些政策主体借政策评估来证明政策的重要性,同时证明客观资源不只是影响政策的主要原因,从而要求更多地获取政策资源,尤其是评估经费等经济性资源。
2.评估标准以价值判断为主,评估方法以定性分析为主评估标准是衡量政策质量高低的尺度,是政策评估的“准参照物”。科学的评估源于正确、合理的标准,评估标准的确定本身就是政策评估的一大难题。除了以价值判断为主的主观标准之外,不同类型的公共政策各有其专门的、特殊的评估标准。特别是价值标准由于主观性较强,容易受评估主体因素的影响,因此加强政策事实分析,把事实分析与价值判断相结合是科学,准确评估的客观要求。然而,由于我国的传统与现实十分重视意识形态以及道德是非,这就助长了评估者用原则判断取代事实分析的思维习惯。此外,当前我国从事官方政策评估工作的人士绝大部分都非“内行”,从事政策研究的专家、学者大多数是研究社会科学出身的,很少有人兼备自然科学和社会科学知识,其知识结构和思维方式比较单一,难以兼有思辨和公理化思维方式的长处,他们在政策评估时不可避免地偏好用价值判断取代事实分析。
政策评估方法与政策评估标准一样,是政策评估不可缺少的工具和手段。与政策评估准不同的是,评估方法较具操作性和具体性。政策分析学科已经探索出一系列科学的政策评估方法,特别是定量分析的方法。但是,当前我国政策评估实践中使用的仍然是定性分析方法多,定量分析方法少;政策评估实践中用价值判断取代事实分析,用定性评估取代的行为导致我国政策评估的“主观误区”频频发生,也为某些具有不良动机的评估人员提供了实现私利的可能性。
3.缺乏独立的政策评估组织政策评估组织一般包括官方评估组织和非官方政策评估组织,我国政策过程的显著特征是“行政的双轨结构功能系统”,即从中央到地方的各级党委与各级人民政府。我国从中央到地方各级政府内部均设有相关的政策评估组织,但在实际运行中,这些机构往往摆脱不了对政府的依赖性,处于附属地位。这些机构在政策评估过程中常常受到来自上级领导的压力,无法独立、自主、客观和公正地展开工作,导致这些官方评估机构往往名存实亡,成为论证上级政策可行性的傀儡工具。非官方政策评估组织,主要是民间政策研究组织和社会中介评估组织,这在我国当前仍然是相当缺乏的。目前我国各级政府的政策研究组织承担了政府政策评估的大部分工作,而由专业人员组成的专业政策评估机构在我国的很多地方尚未建立起来。
4.评估对象以政策输出为主,忽视对政策影响的评估当前我国政策评估在很大程度上停留在对政府行为的检测,或者对政策实现预定目标的程度的检测,而对于更深层面的政策影响的评估却很少涉及或根本不涉及。这种对政策效果的片面认识导致了我国政策评估很不全面,而其对政策方案制定的影响力也因而大大缩小。
5.资料和评估经费的欠缺评估资料和评估经费的欠缺是困扰我国政策评估的两大难题。充足的,准确的资料和信息是进行政策评估的基础,这有赖于完备的资讯管理系统的建立。然而我国相当部分政府机关不重视信息管理,资料记录残缺不全,统计数据不准确,信息处理零乱,再加上很多不对外公开的内部资料,使得评估人员获取信息存在重重困难。此外,有些相关人员抵制政策评估,他们或者拒绝提供关键性资料,或者只提供对他们有利的资料,这进一步增大了获取准确信息的难度。
至于评估经费,我国的唯一来源就是上级部门拨款,但在政策实践过程中常常存在拨款不到位,拨款不充足,下级部门没有做到专款专用,人为减少政策评估款项等问题。因此,评估费用短缺是我国政策评估的又一大难题。
6.公众未能广泛参与政策评估在当前我国,人民群众参与政策评估的热情高涨,他们通过各种途径对公共政策进行评议,主要有:一是通过“领导接待日”、“市长电话”、“来信来访”等信访渠道;二是通过上访渠道;三是通过广播、电视等舆论性机构;四是通过街头巷尾的议论。人民群众是政策的直接作用对象,他们对政策执行效果有着最真实,最深刻的体会。人民群众参与政策评估,可以使政府提供的公共服务符合他们的需要,改善和提高公共服务的质量。但是,传统行政管理的自上而下的金字塔型的等级模式限制了公民广泛参与政策评估,公民参与评估常常被当作是负担和费力不讨好的事。再加上我国政治生活中还较普遍存在着的人治现象,公众参与政策的热情未得得到充分的关注与重视,这是我国政策评估过程的又一个缺陷。
三、发展我国政策评估事业的思考针对中国政策评估工作缺陷,必须下功夫,从思想、组织、制度和手段等方面推进政策评估事业,使其要向纵深发展、日益成熟。这不仅是一项富有意义的工作,也是一项紧迫的任务。应从以下几个方面着手推进我国政策评估事业:
1.提高对政策评估工作重要性的认识要推进政策评估工作的发展,必须在思想上进行建设。首先让全社会,尤其是政策部门充分认识到政策评估的意义。这需要加强政策科学的研究和传播,使人们认识到政策评估对于政策过程而言不是无关痛痒、可有可无的环节,而是必不可少的一环,它不仅有助于政策部门认识政策的特点、优劣和成效,监督政策的执行过程,补充、修正和完善政策,而且还有助于开发政策资源,增强政策效益,从而在思想上予以重视并采取相应的行动。其次,必须端正政策评估的指导思想,改变视“评估”为“评优”、为“歌功颂德”的错误观念,正视评估的“批判性”功能,本着发现问题,解决问题,提高决策质量的评估态度,坚持全面客观、公正公平地开展评估工作,以求最大限度地发挥评估的“建设性”功能,为实现决策的科学化和民主化服务。再次,要认识到评估工作的改进与发展是一个循序渐进的探索过程,推进我国政策评估事业的发展既不能“裹足不前”,也不能“鲁莽激进”。政策评估由于受到各种主客观因素的影响在世界各国都是政策过程中的一个薄弱环节,评估工作的开展也面临重重困难。因此,想要一夜之间取得重大突破是不现实的。
2.建立独立政策评估组织缺乏专职独立的政策评估组织和政策评估人员是我国公共政策评估实践停滞不前,有名无实的一个要原因。纵观政策评估开展得比较好的西方国家,无不有相对完善的评估组织,政府和民间有许多评估机构,这些机构拥有大批职业的政策评估人员,他们独立地开展政策评估工作。针对我国政策评估组织的现状,我们可以考虑从以下三个方面进行建设:
一是规范、健全官方的政策评估组织。目前我国党政部门已存在不少的政策研究组织,必须强化这些机构的政策评估职能。必须改变现存的政策制定、评估两者合一的状况,把政策制定和政策执行分别交由两个相互分开的机构独立履行,使其各司其职,各负其责。
二是大力发展民间的政策评估组织,并使之逐渐成为政策评估的重点。只要存在官僚等级制,官方的评估人员必然会或多或少受到上级的压力,这在我国更是一时半刻改变不了的事实。因此,要保证政策评估的客观和公正,必须辅之以外部的、独立的政策评估组织,主要是要发展民间的政策评估组织。民间的政策评估组织具有专门知识和社会关系广泛两大优势,更容易进行社会沟通,了解民意,因而可以获得官方评估组织无法获得的信息。民间评估人员地位中立,更能够保持公正、客观态度。除了专门性的政策研究机构,报刊、杂志和电视等新闻传媒也都非常积极地参与公共问题的发掘与公共政策的评估。我国建立民间评估组织首先需要政府的大力支持,重视民间评估结论,设立优秀评估奖励制度等配套措施,鼓励社会大众积极参与。特别要注意赋予民间评估机构超然、独立的地位,保证其工作免受政府干扰。
三是专业评估人员队伍建设。必须加强对政府决策人员和评估人员的教育、培训,使其掌握政策评估的科学理论和相关技术方法,尽快从“外行”转到“内行”;必须采取有效措施,鼓励和吸引政策分析专业人士到政策评估组织任职工作;加强官方政策评估人员与非官方政策评估人员的交流和合作,最大限度地实现信息共享,把理论评估与决策现实有机统一起来。
3.政策评估的制度化发展政策评估事业除了思想上的软约束之外,还需要辅以制度法规的“硬约束”。制度意味着减少弹性,增加规范,这是使政策评估工作真正成为政策过程的一部分的必要保障。政策评估的制度化主要包含三个方面内容:首先,实现政策评估的程序化。把评估列入政策过程之中,通过制度规定除象征性或符号性的公共政策外,每项政策最终都要进行程度不一的评估。其次,建立政策评估基金,解决评估经费来源问题。政策评估是一项庞大而复杂的系统工程,需要异乎寻常的财政支持,以便组织各方面专门人才,收集大量信息,开展评估工作。最后,重视评估信息的反馈和评估结论的消化、吸收。政策评估的结论必须与相关人员的奖惩直接联系起来,真正实现政策过程中的责、权、利相统一。评估结论不仅提供有关政策的长处和改善的机会的信息,而且提供政策的弱点和不足的信息。这些信息应该用于为重新评价、调整政策目标和后续政策的制定服务,使评估真正起到促进决策科学化和合理化的作用。
4.明确政策目标、精选评估对象要使政策评估富有成效,就必须努力明确政策目标,这当然首先是政策规划阶段的任务。进行政策评估时必须回顾、审视当时的政策目标,了解某项政策的初衷,尽可明确政策目标。同时要精心选择评估对象。在从事评估工作时,就必须慎选评估对象。选择评估对象一般要遵循两个原则:第一,可行性。即选择那些条件比较成熟,比较容易进行评估的政策进行评估,包括政策目标比较明确,评估资源较充足的政策;优点和局限性已经显露的政策;效果显而易见、比较好测定的政策等等。第二,有效性。即选择那些较具效益和价值的政策进行评估。如具有重要价值和显著效益的政策;决定政策效益因素可以得到控制的政策;评估的结论具有推广价值的政策;评估成本较低的政策等等。根据以上两个原则,选定评估对象,力争较好的评估效果。
5.建立健全政策评估的信息系统这项工作是收集、整理、加工和使用政策信息,为政策评估服务。这是政策评估的基础工作之一。没有足够质量的信息,不能进行科学决策;同样,也无法进行科学评估。但是由于政策资源的多元性、政策重叠现象的存在、政策影响的广泛性,要全面收集政策信息又是一件复杂而困难的事。因此,要在政策过程的开始阶段就建立政策信息系统,对政策信息的收集、加工、交流和使用进行理论研究和总体设计,以便于改进评估系统,使评估活动更科学有效。政策信息系统的核心任务是系统地记录有关政策问题、政策投入、产出和外部环境变化等方面的信息资料。
必须建立覆盖全社会的,快速的信息反馈网络。政府部门除了法律规定应予保密的信息之外,其它一切有关公共政策制度背景、执行情况、评估结论等信息均应该通过网络及时向社会传播,最大程度地避免信息截留、失真。建立信息网络系统可以最大限度地实现决策中心,评估组织和社会公众之间的有效沟通,加快决策的科学化与民主化。
5.引入科学的评估理论、方法和技术长期以来,我国的政策评估工作主要是判断政策实施后的效果是否与制定政策时的目标相一致,缺乏先进的评估理论、方法和技术。要克服这一问题,应该借鉴国外先进的评估理论和实践经验,引入科学的评估方法和技术。有如学者所言:现在中国最大的问题不是在于是不是应该引进西方先进的公共政策理论,现在的问题是如何使这些理论本土化,并迅速地普及这些先进的理论。”
总之,在我国,由于政策评估发展的历史短暂,其工作又不易开展,政策评估事业尚处于起步阶段。政策评估是一项涉及面广、操作复杂的系统工程,加强和推进我国的政策评估事业需要做很多方面的工作,因此需要社会各有关部门和人士广泛支持,在实践中不断摸索,不懈努力。
案 例高雄市社会发展评估*
1979年7月高雄市制订“高雄市社区发展实施办法”,企图以社区发展之工作方式,发挥各地居民之自助精神,以配合高雄市之都市建设与工业建设,可是近年来高雄人口剧增,工业快速成长、社会急剧变迁、各种社会问题随之产生。为此,高雄市政府研究发展考核委员会为检视该市推行社区发展之得失,并研究如何加强社区精神伦理建设,遂于1983年委托台湾东海大学社会学系教授兼主任徐震对该市社会发展实施评估,现将徐震刊于其专著《社会发展——方法与研究》的部分内容摘录如下,
鉴于该市发展项目实施前后的资料欠缺,此项评估无法著重于时间上前后的比较,乃采用问卷调查方式,从各社区接受服务者与从事服务者等对于发展工作上之满意程度、贡献评价及意见,以归纳而评估既往工作之得失,作为未来发展的凭借。
1.评估研究目标。从既往社会发展工作中评定:社区建设各项目是否切合居民需要?其工作方法是否符合地区工作目的?现有社区发展之组织是否能发挥社区的自助功能?已有的精神伦理建设是否能发挥社区的教育功能?
2.研究范围。根据上述目标,确定评估研究的范围,其主要项目为:该市社区发展组织、社区发展规划、机构配合、工作项目、工作方法、经费资源、工作人员、成果维护,其它社区居民反映等。
3.研究结构。根据上述目标范围,其研究指标可归纳如下:(1)对社区发展工作中三大建设的成效评估,其指标为,居民对各项工作及活动的满意程度;居民认为各项工作及活动的贡献程度;行政人员认为居民对社区各项工作的欢迎程度。(2)对社区发展工作运作过程之评估,其指标为:社区组织的功能是否发挥;机构是否协调;居民参与积极否;经费运用适当否;专业资源是否运用。(3)对其它影响社区发展因素及其成效的探究,其指标为:居民对社区内之公共问题严重程度之评估,如环境卫生问题,交通秩序问题,青少年犯罪问题,盗窃问题等;居民对社区内生活环境满意程度之评估,如教育、医疗设施,水电、交通设施,治安休闲娱乐设施等。
4.研究架构、方法和步骤(从略)
5.研究结论。根据各项研究所得各类资料,加以统计分析,综合研究,并依照高雄市当前社会发展实况与都市发展之趋势,就社区工作的立场,加以解释与推断,作成结论并提出检讨与建议,如下列四项。
1.对于以往社区发展各项建设之评估
(1)对于三大建设的评估
指标之一,满意程度,依原报告各种统计资料,简化如下表(表一)
满意程度分项
相当满意
普通
不甚满意
合 计
基础工程建设
68.4
22.3
9.3
100.0
生产福利建设
62.1
21.8
16.1
100.0
精神伦理建设
63.9
20.3
15.8
100.0
指标之二是贡献程度,依资料简化如下表(表二)
满意程度分项
相当满意
普通
不甚满意
合 计
基础工程建设
73.5
17.7
8.8
100.0
生产福利建设
69.1
15.0
15.9
100.0
精神伦理建设
62.5
21.3
16.2
100.0
从以上表一和表二所得观察,可见多数社区居民对于以往历年来社区发展工作之评估,均表示相当满意与颇有贡献。惟在满意与贡献的程度上,以
a.基础工程建设之评价为最高。
b.生产福利建设之评价次之。
c.精神伦理建设之评价为最低。
基于居民对于社区发展三项建设在满意、贡献与需求三方面之评估,作者曾建议高雄市政府对于此三项社区发展工作,均应予以继续加强,而对于生产福利建设与精神伦理建设,尤应视各社区之未来需要,予以特别加强。
(2)对于分项工作之评估
依据此项研究综合评估之资料,其社区居民与行政人员对于三大建设中,各分项工作在改善社区生活之贡献方面,其评定之次序,如下表,
对改善社区生活最有贡献之工作项目
社区居民认为最有贡献之工作及次序
行政人员认为最贡献之工作及次序
基础工程建设
1改善巷道铺设水泥柏油路面
2.兴建社区活动中心
3.改善照明设备
4.兴建排水沟
1.兴建排水沟改善巷道铺设水泥柏油路面
3.兴建社区活动中心
4.改善照明设备
生产福利建设
1.成立社区生产建设基金
2.办理社区卫生保健班
3.设立社区托儿所
4.提供家庭副业
5.推行家庭计划
6.办理就业辅导
1.设立社区托儿所
2.办理就业辅导
3.家庭卫生指导与医疗服务
4.改善家庭卫生
5.举办技术训练
6.提供家副业
精神伦理建设
1.设置社区精神堡垒
2.社区妈妈教室
3.设置蓝球场
4.社区童子军团
5.社区志愿服务队
6.设置国乐社活动
1.设置社区小型公园
2.设置社区儿童乐园
3.社区全民运动
4.设置花坛美化环境
5.设置兰球场
6.早觉会活动
从上表可见:a.在基础工程建设方面,社区居民认为最有贡献之工作项目与行政人员之看法大致相同,惟次序不一。b.在生产福利建设方面,两者之选择有一半项目不同,且次序不一。c.在精神伦理建设方面,两者之选择有六分之五的项目俱不相同,且次序标准,极不一致。
以上除基础工程建设,工作比较具体,看法容易一致外,其余两项社区居民与行政人员所持之标准与看法多不一致,行政人员认为对社区最有贡献之项目并不被社区居民所接受。
由于社区发展工作得以社区居民之需要为主体。因此,作者曾建议,对于社区发展之工作项目,应视不同社区之不同需要,采用多元模式,尽量让社区理事会依照居民之意见,自行规划、自行选择。
[思考题]
1.什么是政策评估?政策评估的意义何在?
2.政策评估有哪些基本类型?如何看待评估标准?
3.简述政策评估的过程及方法。
4.政策评有哪些基本模式?
5.政策评估面临哪些困难?如何推进政策评估事业?
6.分析上述案例,说明“高雄市社区发展项目”的评估过程。