江苏高等教育网

Jiangsu Higher Education Network

主办:江苏省高等教育学会
协办:南京信息工程大学 / 苏州工业园区服务外包学院
当前位置:首页高教信息高教时空正文

祁占勇, 杜越|什么是好的教育政策执行效果的评估

来源:华东师范大学学报教育科学版发布:2022-02-17 10:02分享:

摘要:教育政策执行效果的评估是教育政策活动乃至教育系统有序运行的基本保障。好的教育政策执行效果的评估,不仅是教育政策目标实现的根本途径,也是强化教育政策操作与执行力度的重要措施,而且是“再造教育政策”或“生产新的教育政策”的基本依据。教育政策执行效果的评估是评估主体依据一定的价值标准,运用特定的方式方法,对教育政策执行活动作用于政策目标领域内的社会系统要素的影响变化进行事实描述与价值审判,并反馈于政策循环的活动,具有涉及复杂的利益相关者、目标模糊且广泛、过程不稳定与不确定并存、方法具有局限性、结果具有反馈性等特征。当前我国教育政策执行效果的评估存在着理论研究匮乏滞后、评估视域困守于实证范式、评估方法与技术单一、评估活动要素专业性有待提升、评估结果的反馈利用低效等问题。基于此,好的教育政策执行效果的评估需要从评估标准坚持事实与价值相统一、指标体系兼顾要素多元与联动协调、评估方法与技术切实可行、评估结果分析说理与反馈应用并重等方面重构分析框架,从而使教育政策执行实践中的政策虚置、政策悬置、政策失灵等现象尽量少出现乃至不出现。

关键词: 教育政策执行 ; 教育政策执行效果 ; 教育政策执行效果的评估 ; 利益相关者




祁占勇,陕西师范大学教育学部教授,教育学博士,博士生导师,教育部青年长江学者。



一、教育政策执行效果的评估之科学内涵

二、教育政策执行效果的评估的现实诉求

三、好的教育政策执行效果的评估的分析框架与机理阐释



        2020年10月,中共中央、国务院印发《深化新时代教育评价改革总体方案》(以下简称《方案》),指出“有什么样的评价指挥棒,就有什么样的办学导向”,要求教育评价以习近平新时代中国特色社会主义思想为指导,坚持立德树人、问题导向、科学有效、统筹兼顾和中国特色原则,到2035年基本形成富有时代特征、彰显中国特色、体现世界水平的教育评价体系(中华人民共和国中央人民政府,2020)。教育政策执行效果的评估作为教育评价体系的重要组成部分,在推动教育政策制定科学化、教育政策执行系统化与教育政策产出高质量上起着关键作用。“我们处于其中的时代是一种强调责任的时代,这种时代必然也是一种崇尚评价的时代。”(福勒,2007,第278页)鉴于政策活动本身牵涉甚广的特性,政策评估总是一个令人“不安”的话题,同时也是社会发展不可回避的任务。那么,什么是好的教育政策执行效果的评估?可以从对“好”的价值标准的厘定、对“教育政策执行效果”本质的解读和对“评估”行为规范技术的明晰等方面来阐释(王大泉等,2018)。通俗地讲,好的教育政策执行效果的评估是以理论与实践、科学与民主、社会与个人、公平与效率、多元与重点的和谐统一为指导,针对教育政策执行过程中以及执行结束后对政策调整目标领域产生的事实与价值、效果与影响、结果与效应等的变化,运用科学系统的方法技术进行描述、分析、推理、判断与升华。教育政策执行效果的评估作为教育政策活动有效开展的重要推手,是教育政策活动乃至社会系统有序运行的基本保障。回答什么是好的教育政策执行效果的评估,不仅是教育政策目标实现的根本途径,也是强化教育政策操作与执行力度的重要措施,而且是“再造教育政策”或“生产新的教育政策”的基本依据,对丰富教育政策评价研究具有重要意义。

一、教育政策执行效果的评估之科学内涵

      教育政策执行效果的评估是一个极其复杂的问题,囿于教育活动和政策活动周期长且隐秘的特点,教育政策执行效果的评估总是在繁琐的动态图景中进行脉络构建与系统运作,而本质内涵是相对稳固的存在,这就需要在不断深化教育政策研究中来完善对教育政策执行效果的评估之认识并接近本源真相。

(一)何谓教育政策执行效果的评估

       厘清教育政策执行效果的评估的概念是科学建构评估指标体系的前提。教育政策执行效果的评估可以从教育政策执行效果和教育政策评估两个层面来解读。


       一方面,教育政策执行效果即教育政策开始实施之后对政策调整目标领域作用的体现,是经由法定程序制定的教育政策作用于政策目标对象和政策环境的影响变化,具体表现为特定政策目标的实现程度以及前后对比的差异。制定出的政策经由“政策宣示”(陈学飞,2011,第357—358页)使其“入世”进入政策执行阶段才能与社会系统要素关联起来,方能真正产生实质作用。教育政策执行效果体现在事实影响和价值负载中,事实影响回答某一政策实施后所产生的实际效果,价值负载则回答某一政策执行活动中一切相关参与者及其所组成社会在价值判断上的发展演变。因此,“教育政策执行效果”和“教育政策执行影响”是不同的概念,不能混淆使用,更不能混淆视听。教育政策执行效果是基于政策过程的讨论,锁定了政策实施的目标群体,重点探讨对于特定群体和特定问题的作用影响,在政策制定时便有一定的把握与预测,主要体现为现实中的效率和效益,可以由直观的现实回应来佐证。如“就近入学”政策开展下使学生上学更加便利,减少了学生上学过程中时间和物质等方面的花费,“划片招生”的生源配置也在一定程度上优化了弱势学校的教育资源与教育能力。教育政策执行影响则放大了政策执行效果的外延,将政策预先未重点考量的社会效应纳入其中,是政策制定时难以预先考虑到的结果因素,这也决定了政策执行影响在现实中具有更多的不确定性风险。如高校扩招政策下,高质量人力资本推动了城市产业结构的升级,“人才红利”效应初显,推迟了适龄青年进入婚姻市场的时间,扭转了性别结构,女性群体话语地位上升。同时,大规模高质量人才的产出也使得高校毕业生在劳动力市场中的相对就业机会减少,毕业生失业率增加。再如近些年的新高考“3+3”改革中,出现了物理科目“遇冷”问题,这势必会影响高校STEM(Science,Technology,Engineering and Mathematics)人才素养的培育,造成量子通讯、航空航天技术等高精尖前沿研究的人才塌陷,削弱我国在第四次工业革命背景下的国际竞争力(冯成火,2018)。政策执行的效果有积极与消极之分,这些产出在特定政策执行的整个周期乃至周期结束之后皆会有不同程度的体现,其中,积极的政策效果是指实现了政策目标的内容,对政策目标调整领域的利益主体、政策环境乃至社会各子系统发展有利的作用;消极的政策效果不仅包含着可以被直接观测感知到的社会现实问题,也包括因政策及其活动本身不断进行价值选择时所丧失的潜在利他机会。


       另一方面,从教育政策评估来看,并没有充足的理由表明教育政策有必要区别于其他公共事业政策来特殊对待(那格尔,1990,第442页),因此,可以基于公共政策评估的视域来探讨教育政策评估。教育政策评估是依据一定的标准,运用一定的方式方法,对教育政策目标在政策活动全过程中的实现情况进行描述与价值判断的活动。教育政策评估贯穿于政策活动的始终,以合理的身份适当参与到政策过程之中,对政策过程产出的信息进行收集与分析,并反馈于政策过程本身。评估活动作为工具理性与价值理性的展现,服务于政策过程,因政策分析与政策改进而具有现实意义。在教育政策评估活动中,“政策制定评估”和“政策执行评估”在先后时间差与功能导向方面存在着显著差异,“政策制定评估”是针对政策制定过程规范性、政策目标的可行性、政策决策的科学性和政策方案可能后果等方面的评估;“政策执行评估”则是对政策方案在执行过程中的评估,审核政策方案的继续执行是否能达到预期目标。


       显然,基于以上分析,可以清晰地认识到,教育政策执行效果的评估是评估主体依据一定的价值标准,运用特定的方式方法,对某项教育政策执行活动作用于政策目标领域内的教育系统要素的影响变化进行事实描述与价值审判,并反馈于政策循环的活动,主要目的在于推动教育政策活动乃至其他公共政策的改良修正,发挥积极效应、规避消极效果以促进教育事业的可持续发展。

(二)教育政策执行效果的评估的基本特点

      相较于政策活动其他要素环节的评估来说,教育政策执行效果的评估整体上更加宽泛复杂。因此,有必要对教育政策执行效果的评估的基本特点进行分析,探析其独特性,从而为好的教育政策执行效果的评估的分析框架奠定知识基础。


1.教育政策执行效果的评估涉及复杂的利益相关者

      教育政策执行效果的参与者尤为广泛,小范围的权威机关制定的政策,通过政策宣示活动进入大众视野,在广泛的教育系统中开展事实与价值的政策执行,对其作用效果进行的科学评估必然需要将所有参与者纳入其中。政策执行的利益相关者既包括具体的根据政策要求实施教育活动的机构与个人,也包括最初的政策制定者以及众多参与到教育活动中以直接或间接、主动或被动的方式接受政策调整作用的组织或个人。在执行活动中,不同主体秉持不同的价值目标,具备不同的人格特质与素质,采取不同的途径方式,所产生的政策执行效果也不尽相同,好的政策执行效果的评估自然需要考量广泛参与者的动态信息。一方面,政策的制定、执行、调整与评估总是伴随着众多利益相关者的权力博弈。教育政策执行效果的评估针对特定目标群体与内容进行事实解读与价值审判的过程中,总是会在一定程度上对部分利益群体产生威胁。另一方面,处于社会中的个体不可避免地需要接受到评估的“打量”。政府和学校作为政策活动的主责承担者,以评估和被评估的多重身份参与到教育政策执行效果的评估活动之中;民众作为政策效果的直接受益者,通常是教育政策执行效果评估的“动态资料库”。


2.教育政策执行效果的评估目标相对模糊且广泛

      教育政策执行效果的评估目标的模糊性体现在教育政策目标本身的不确定性,教育政策目标的实现程度是评估政策执行效果的普遍内容,而教育政策目标具备量与质的双重标准(祁占勇,2019,第162页),量的标准可通过客观数据等信息进行明确,质的标准受主观价值的牵引往往很难测定。评估目标的广泛性不仅仅回应特定政策目标领域内的政策调整问题的实现情况,还从整体视角关注与教育政策执行相关的政治、经济、文化等内容的溢出效应。若仅以政策目标为依据进行差距描述与评判,并不能完整地说明政策执行的效果,这就需要思考政策效果分离的问题,怎样通过评估活动准确对应执行与效果的关系。随着政策活动共同体愈发拥挤,辨明某种理念或行为变化的最初来源实属不易。存在于社会开放系统之中的人、物等要素的发展变化总是接受着多重的内外作用,政策调整领域内要素在政策执行过程中所产生的变化差异,并非全都是由特定教育政策的执行引起的,如何进行科学缜密的因果关联,是效果评估难以克服的障碍,在评估方法论认识与技术模型等方面均存在着一定的局限性。


3.教育政策执行效果的评估过程具有不稳定性与不确定性

       教育政策执行总是处于不断的动态演进之中,来自教育系统内外的多重因素影响着教育政策执行的开展以及执行效果的发挥,政策执行的进一步开展又反作用于教育系统内外诸多要素发展之中,在频繁的交织互动状态下,评估过程所参考的评判依据、面向的评估对象、关注的评估内容以及具体的评估操作都处于复杂的动态图景中。同时,教育活动是在开放的系统环境中开展的,教育活动及其产品所面对的都是具有不确定性的人,因此评估过程对于教育系统信息的获取总是不充分的(包海芹,2011)。虽然可以通过推迟评估活动、延长或优化评估过程来尽可能地捕捉更多动态信息,但仍难以突破教育系统本身的限制,这也导致了“政策反讽”的产生,教育政策执行后可能引起比拟解决问题更加棘手的社会问题。当然,政策执行风险的积聚、转化、扩散与爆发都需要一定的条件和过程,而在问题苗头产生甚至是风险事件的发生之前,这种消极效果往往被忽视。以世纪之初的“撤点并校”政策为例,该政策的开展虽然整合了教育资源,在经济效益方面优化了教育资源配置,但学生寄宿求学又衍生了家庭教育缺位、农村空壳化、家庭结构离散等问题,政府深刻分析了该政策执行的现实影响,及时调整了政策执行思路,在政府工作报告中强调因地制宜处理好提高教育质量和学生就近入学的关系问题,完善好后续工作以削弱效果的负面影响。


4.教育政策执行效果的评估方法具有局限性

       将教育政策作为公共政策中的某一特定领域指向,教育政策执行效果的评估方法也来自公共政策评估,而现阶段公共政策评估本身并不完善,对于定量、定性抑或混合的方法论与工具技术的研究运用仍有待加强,却又难以在当下的社会科学技术与社会认知中寻求重大突破。如当前广泛运用于政策执行效果评估方面的统计分析、实验设计、多元回归分析等方法,普遍存在着实证倾向严重、干扰因素难以净化等问题。同时,教育事业本身具有周期长、不可逆及影响深远等特点,对教育政策执行效果的评估方法的要求则更加苛刻。目前政策评估研究所掌握的执行效果评估方法多是从事实层面进行描述性评估,价值判断层面的抽象评估仍有较大局限。此外,在政策执行效果的分离上,也存在着一定的方法障碍,政策执行效果的诱因复杂多元,确定哪些政策效果来自政策干预而非政策本身,仍需要进一步思考研究。


5.教育政策执行效果的评估结果的反馈性

      评估并不是一个完整政策周期的终结,真正为特定教育政策及其执行画上句号的是评估结果的反馈,评估因反馈而具有价值。反馈源自生物学领域,是指神经系统对外界的刺激产生感应,并将这种感应信息反向传导至中枢神经的活动(祁占勇,2019,第164页)。引申到教育政策执行效果的评估,则是指通过评估,对教育政策的执行及其效果产出信息进行判断和感应,并将信息加工后传递至特定政策主体的过程。效果评估本身只是“对政策过程进行分析的工具”(陈学飞,2011年,第369页),实现评估结果的反馈,将其运送到政策系统运行之中,才能真正发挥效果评估的价值,使其升级为另一种形态有效参与到政策过程之中。受政策活动中各种不可预知因素的动态变化的影响,政策执行并非总是一帆风顺的,最初选择的最佳的路径方案在实施过程中也可能面临着效果削减的困境,因此,需要将教育政策执行效果的评估结果反馈到政策执行过程之中,以修正政策实施偏差,优化现行教育政策的实施路径。而教育政策执行周期之后的效果评估的结果反馈,对教育实践经验的获取、新的教育政策的制定与执行等,皆有极强的应用价值。


       总而言之,教育政策执行效果的评估作为政策圆圈中的重要组成部分,在教育政策文本的形成、教育政策的科学制定、教育政策的有序调整等方面都具有丰富的价值意蕴。教育政策执行效果的评估有利于科学全面地检验政策执行的产出情况,并以此为依据对政策实施路径进行修正调整。尽可能规避教育政策执行过程中的政策内容不符、偏离政策目标、违背政策精神等执行失真问题(林丹,2004)。帮助政策执行者合理配置教育资源与协调要素运作,发挥教育政策执行在社会系统中积极的“特斯拉效应”,推动良好“政策振动”的实现(谢明,张书连,2015)。


二、教育政策执行效果的评估的现实诉求

       教育政策执行效果的评估的现实诉求是理解阐释活动由理论向现实延展的必然选择。现有的研究和实践对于教育政策执行效果的评估有着什么样的诉求,这些诉求所体现出的供需矛盾可以为我们思考“好”的价值标准提供思路。“好”包括了对于“不好”的改进以及在现实中更加丰富的理论实践优化转向。

(一)教育政策执行效果的评估的理论研究匮乏滞后

      教育政策执行效果的评估的理论研究有着深刻的学术价值,为评估活动本身的开展以及教育政策的发展贡献理论智慧并指导教育政策实践。从教育政策执行效果的评估的研究情况来看,已有研究较为单薄,在理论深度上缺少细致深入的研究成果,在前瞻性与指导性的体现上相对滞后,学术价值与实践价值未能达到价值与事实层面的统一联动。一方面,相关研究多是侧重对于教育政策评估整体的探讨,较少将教育政策过程拆解开来对政策要素或政策环节的评估进行具体细致的研究。评估领域以经济产业、环境等为主,聚焦教育领域的政策评估研究较少,相对而言,经济产业、生态环境、医疗卫生等公共政策执行效果的可度量性和可观测性较强,其所采取的评估方法与技术也更加灵活可行。教育本身具有见效慢、周期长、潜在性等特点,特定政策对个体德智体美劳的发展、教师职业发展、学校教育和办学建设等的作用影响往往难以在短期内显现,或是被全面地监测把控。因此,对于教育政策执行效果的评估需要尽可能将利益相关者、效果形态、影响时效等因素都囊括其中进行综合考量,才能更好地还原教育政策对相关因素的影响。如在对免费师范生教育政策的执行效果的评估中,利益相关者包括了核心利益相关者和外溢利益相关者,核心利益相关者至少应包括制定与推进政策的教育行政部门,以及在具体环节中运作政策的教育部六所部属师范院校、各省高考招生部门、地方教育行政部门、免费师范生就职学校、免费师范生本人等,外溢利益相关者则至少应考虑免费师范生的家长、授课对象、学校同事及六所师范院校教授免费师范生教育的任课教师;围绕不同的利益相关者产生着多重的效果形态,包括可直接观测统计的数据,如免费师范生的报考情况、毕业生就业率、学校师资结构的配比与补给情况、城乡免费师范生的从教情况等,也包括了难以度量的群体态度与社会观念,如免费师范生的职业认同、从教意愿、职业发展,以及教师职业的社会地位等;影响时效则从政策执行及其效果显现的不同阶段出发,依据评估目标来选择监测评估活动介入的时间,在该方面,针对免费师范生的课程设置、进入劳动市场后的社会回报、从教后的职业发展情况、对学校教育教学质量的影响等,都需要选择合理的时机进行评估,过早或过晚的介入都会影响评估的结果。另一方面,已有研究相对教育政策现实发展来说较为滞后,将教育政策置于公共政策视域下,简单移植公共政策评估思路,尚未从教育事业的特殊性出发构建起较为成熟的理论研究框架,难以为教育政策现实问题的解决提供足够的理论和实践支撑。匮乏的理论研究与复杂的现实问题间矛盾冲突,迫切需要研究者聚焦教育政策执行效果的评估,遵循教育政策执行过程逻辑,形成“有用”“管用”“实用”的研究成果,进一步丰富教育政策执行效果的评估研究。

(二)教育政策执行效果的评估的视域更多困守于实证主义范式

      范式是从事某一领域科学研究的学术共同体所遵循的世界观和行为方式,教育政策执行效果的评估只有遵循科学合理的范式,才能称之为好的评估。当前,我国教育政策执行效果的评估呈现出较为明显的实证主义倾向,具有工具理性与目标导向特点。一是仅就政策目标的实现来谈政策执行效果,这种带有“经验—技术”意味的目标导向评估,强调客观的工具理性的发挥,重点关注特定教育政策执行对政策目标的实现程度,是否解决了政策调整所针对的具体问题,通过社会实验等量化方法对因果关系进行理性分析,却较少考虑因果要素之间是如何进行互动作用的,也未曾探究政策目标之外的政治、经济、文化等“局外”系统的效果。二是侧重量化指标基础上对显性效果的评估,难以观测到隐性的政策执行效果。教育政策执行效果有显性和隐性之分,显性效果可以直观体现为数据等有形的客观事实,而隐性效果则包括难以在短期内为人所察觉的潜在效果和价值情感方面的符号象征效果(高庆蓬,杨颖秀,2010)。实证主义范式倾向于采用实证技术分析事实,将事实与价值相分离,以量化的数据指标为依据,尽可能排除个体主观因素,更多的是对显性的物质性效果的描述与分析,缺少对于价值层面的效果的考量。高校学术评价中唯论文、唯帽子、唯职称、唯学历、唯奖项的“五唯”评价就是过度量化的典型代表。“五唯”立场下,论文、著作、课题、获奖等均被换算成一定的分值,高校教师的学术水平通过数字叠加来体现,教师的职称评定也以论文发表的期刊层次等刚性指标为依据,“帽子”作为教师学术成果的集中体现,成为高校用人单位引进人才最直观最便捷的依据,高校的人才引进变成“抢帽子”。不可否认,客观的层次和数量能够在一定程度上说明高校教师的学术业绩,但五花八门的数字和标签并不能完全说明教师及其成果的学术贡献。学术权威话语下对期刊层次的划定和国家战略导向下对课题的审批以及对人才称号的认定具有极强的公信力和公认度,但高度普遍的认可并不意味绝对标准,低层次期刊却高质量的论文、低等级却开拓创新的课题、缺“帽子”却有水平的教师并不在少数。近些年,国家层面与学术界高度重视教育评价的“破五唯”问题,《方案》中也再度重申“破五唯”的评价导向,“破五唯”并不是摒弃对论文、课题等学术成果的认可,而是破除绝对化、单一化的“唯”指标,构建起内部外部相结合的多元化评价体系。三是评估依据局限于政策目标群体,对于效果的观测较为片面。目标导向下的评估将评估对象锁定为教育政策调整的目标群体,仅针对目标群体在政策执行前后的差异进行统计分析,却忽略了非目标群体和非预期性效果。如我国城市化进程下实施的进城务工人员子女的教育政策,政策目标群体包括了流入地政府、流入地公办学校、流动人员及其子女,彼此之间形成了一定的运作关联,仅从这一关联谱系进行评估,能够以进城务工人员子女入学数据说明一定的正向效果,但忽略了对于流入地本身适龄学生的教育资源的挤占等相对负面效果。

(三)教育政策执行效果的评估的方法与技术较为单一

      教育政策执行效果的评估需要依托一定的方法与技术来实现,聚焦教育领域的评估相当困难,很难通过一种甚至几种方法进行全面的观测分析。从方法论意义上来说,受教育政策研究本身“定性研究多,方法创新少;内容分析多,过程研究少;单一学科的研究多,交叉学科的研究少;宏观研究多,微观研究少;规范研究多,实证研究少”(祁占勇,陈鹏,张旸,2016)的影响,教育政策执行效果的评估的方法与技术存在教育特殊性不显明、评估逻辑过度依赖特定标准、量化与质性的数据处理困境、因果关系的解释匮乏等问题。首先,教育政策执行效果的评估以公共政策评估的基本方法为主,缺少立足教育事业特点的方法论建构。常见的评估方法包括“前后对比法”“成本—效益分析法”等,此类方法具有一定的普遍性,可以回答公共领域中政策执行效果的评估的一些基本问题,但难以对教育领域内的特定问题进行细致解读。其次,评估活动难以跳脱实证论的研究假设,多是依赖于一定的标准。在对教育政策执行效果的评估的方法论反思上,尚未就评估工具等形成议论批判的思路,评估方法与技术在工具理性与价值理性两层次上都有着较大局限。评估者对政策执行效果的评估,常是以预先设定的标准为轴心,从实证论意义上讲是“以一种无形的霸权抹杀了利益相关者的行动智慧和意义建构”(杜文静,葛新斌,2017)。再次,对于量化与质性方法的选择和处理难以平衡。教育政策执行效果的评估方法大致可分为定量方法、质性方法和综合性方法,鉴于量化和质性各自优缺点的问题,已有较多学者将二者结合起来形成综合性方法来评估教育政策执行的效果,但二者在现实的选择与运用中,难以形成适切契合的组合,同时,在愈发追求价值解读的过程中,容易产生对于量化价值的盲目抹杀。2002年以来,我国针对高校学科建设完成了四轮学科评估工作,历次的学科评估在评估体系方面不断优化,第四轮学科评估提出“基于客观事实的同行评议”,探索量化评估与同行评议相结合的评估模式,但在定量与定性的处理上仍有待考究。一方面,规模性和标签化的数据指标可能造成不同指标因素间重复效应的叠加考量,高校为集中力量争A类学科的积分排名而对弱势学科进行裁撤的“削足适履”策略,以及一级学科“拼体量”与新兴特色学科优势尚微的守正创新难两全问题(解德渤,李枭鹰,2019);另一方面,专家主导的同行评议可能牵涉裙带关系中的人情利益问题,评价者本身作为科学守门人的身份认同标准如何厘定,以及个人主观思维认知中的偏误问题。当前,我国正在进行第五轮学科评估,与前几轮相比,第五轮学科评估方案在强调立德树人成效、重视师德师风建设、破除“五唯”顽疾、实践融合评价路径、呈现结果方式多元等方面都提出了更细致多元的要求,在具体的评估方法的运用上,处理好客观数据和专家判断的关系仍是评估工作的重点。最后,在政策执行与实现效果之间因果关系的解释上,对政策干预因素难以进行有效区分。人类理性总是有限的,不可能从政策执行与效果中剥离出完全的“净影响”,评估方法与技术的发展只能尽可能地对应因果关系并进行相对逼近真实的分析解释。而现有研究中有关“净影响”的尽可能地分离在方法与技术上仍难以有所突破。

(四)教育政策执行效果的评估活动要素专业性有待提升

       教育政策执行效果的评估具有极强的专业性,只有配足配齐配好配强评估活动的系列要素,才能确保评估结果的科学有效,活动要素包括了人员、机构、程序、方法与技术等(范国睿,孙翠香,2012)。评估人员影响着评估的质量和结果,从现实的执行效果的评估主体来看,多是由不同层级教育政策执行者作出的评估行为,由政府牵头,学校、教师和学生也参与其中。这些执行者“既是运动员,又是裁判员”,在效果评估的信息筛选与分析上,不可避免地会带有较强的主观选择偏好,放大积极因素,弱化甚至剔除消极因素,以此为自己参与特定教育政策的执行提供有利佐证,行动与反思集中统一的模式也会限制教育事业的发展创造力。我国高等教育评价通常以外部评价和内部自评为主,其中,外部评价由教育行政部门承担,接受政府委托的第三方评估机构对高等教育的评估也多是在政府划定的规则框架内开展,评估逻辑承载着政府部门的战略选择。此种评估机制有利于统一高等教育发展同国家民族建设的总体方向,保证高校的人才培养与科研产出等真正服务于国家战略需求,但也在一定程度上限制了高校的学术自由,教育行政部门既是政策执行者,也是政策执行效果评估的权威准则,还是将评估结果用于高等教育资源配置的主要推手,高校自身相当被动。评估机构是评估活动开展的组织依托,随着教育政策监测评估的不断发展,评估机构也逐渐由附属走向独立,如地方政府设置的教育督导室等,专业的第三方评估机构也开始介入到教育政策执行效果的评估中来,如高校附设的教育研究中心以及民间的教育智库等。但相对来说,政府组织的评估机构多是以基础教育质量评估为重点,缺少专门针对不同层次、不同类型教育政策执行效果的评估的专业组织。第三方评估机构受制于传统自上而下的权力运作,在收集资料与分析问题的过程中难以得到政策执行者的配合,得出的评估结果在准确性上也有待考究(胡伶,范国睿,2012)。评估程序则是评估活动的运作机制,是确保活动要素各司其职且顺畅衔接的规则逻辑。当前,教育政策执行效果的评估程序仍不够完善规范,缺少可依循的实施细则,限制了评估主体功能的发挥,效果评估在不同的行动层级、评估主体、评估对象之间的作用机制与边界划定也较为模糊,评估活动要素的衔接运行无序。评估方法与技术是评估活动施展的操作性具象,存在简单套用公共政策执行效果评估的方法与技术的问题,对“教育”的特殊性体现不够。为了使评价方法更适应教育规律,《方案》中首次提出“探索增值评价”的要求,增值评价重点关注评价对象的进步情况,将不同层次不同类型的政策目标对象的发展变化与其自身的起点基线相比较,一定程度上避免了对不同起跑线的对象实行“一刀切”的评价标准。增值评价在国际上应用广泛,在我国的教育评价领域中尚不成熟,如何立足我国本土实际发挥增值评价方法的优势,仍需要长期的实践检验。此外,对现代信息技术手段的合理利用也是效果评估技术变革的必然趋势,5G、大数据、云计算、人工智能、区块链技术等前沿科技都是创新评估工具的有效途径。

(五)教育政策执行效果的评估结果反馈利用低效

      评估结果面向教育政策执行活动的信息反馈与政策利用是教育政策执行效果的评估实现目标与功能的必然选择,而在现实中,往往存在着评估结果理论与实践脱节的问题,评估活动使教育政策执行者认识到我们的政策及其执行出现了哪些问题,但未能将其返还到教育政策的理论与实践之中去切实纠正问题。造成这种反馈利用困难的原因有三个方面,一是教育政策执行效果的评估自身缺乏利用价值,过分关注评估过程和结果解读的科学严谨,以评估结果的获取为终点,甚少考虑评估结果对于教育政策执行的价值返还,未能真正实现评估的目的与功能;二是评估结果常常侧重正向结果的偏好选择,评估活动主导者更多看到的是政策执行好的效果,潜意识里回避政策执行不好的结果,虽然,得出的评估结果常常是实现了政策目标,发挥了积极的教育政策影响,但可供现有教育政策执行以及未来教育政策发展所借鉴的经验教训并不多,政策风险的警告意味不显著。在《国家中长期教育改革和发展规划纲要(2010—2020年)》实施的中期评估工作中,国家教育体制改革领导小组委员会办公室委托相关单位针对各级各类教育的落实情况以及学生资助、教师队伍建设等具体方面进行专题评估,公开的评估结果资料中大多是以数据形式为主的成效呈现,并对《规划纲要》的进一步落实提出了改进建议,但有关《规划纲要》政策本身的反思较少,关于现有政策执行的风险因素分析不多,多是对下阶段政策推进过程中需要重点关照问题的思考;三是教育政策执行主体为维持权威而对评估结果的选择性屏蔽。对政策执行的效果进行评估,得出的评估结论自然有功有过,而有关“过”的评判会在一定程度上触及政策执行者的利益,降低其在社会公众心中的权威性与公信力。因此,教育政策执行者会以各种各样的理由否定评估结果中对于自己的质疑,更不必说仔细审读评估结果以进行自我反思。就我国已经完成的四轮学科评估工作来说,学科评估结果能够帮助政府了解高校学科建设的情况,能为排名靠前的高校带来丰富的资源和社会声誉,也为学生及其家长选择就读高校提供了可靠的依据,但学术泡沫、抢“帽”大战、保守拼量等问题也随之沓来。行政化主导下,高校为了赶上政策支持的快车,不得不以政府偏好为标杆来调整自己的办学策略,高等教育的生态环境面临两难问题。


三、好的教育政策执行效果的评估的分析框架与机理阐释

      好的教育政策执行效果的评估归根结底是要在一定的评估模式内开展,无论是理论研究还是实践探索,都应当回归到教育政策执行效果与评估框架的解构与重塑之中。以怎样的思路架构起什么样的评估指标,才能够较好地处理好教育政策执行效果所涉及的宽度与深度、数据的获取与分析、最终的信息反馈与路径修正的关系以及诸如此类的各种活动本身及其之间的关联作用机制,是实现好的教育政策执行效果的评估必须要思考的问题。通过对其科学内涵和现实问题的解读,面向评估的具体实践,我们可以从评估应遵循的标准、评估涵盖的指标维度、评估活动的观测点几个层面进行分析框架的简要架构(见图1)。为了更清晰地理解好的教育政策执行效果的评估机理,以“双一流”政策的执行情况为例进行分析。“双一流”政策是我国新时代面向高等教育发展的重大战略决策,为高校发挥特色、创出优势、对标国际一流高等教育水平搭建平台,当前,“双一流”建设第一轮即将结束,有进有出的动态调整机制对第一轮入围的一流学校和一流学科建设提出了更高的要求,五年一周期的“双一流”政策进入阶段成果验收期,对该政策执行的效果进行分析,有助于窥见“双一流”政策执行过程中的可行方案与矛盾症结,以期为更好地推进下一周期一流大学与一流学科建设提供改进思路。



图 1   好的教育政策执行效果的评估的分析框架


(一)本体转向:评估标准坚持事实与价值相统一

       评估标准是在评估活动开始前,对被评属性或方面在质上的规定,是评估活动开展的价值尺度和作用界限(胡伶,2008),体现着评估在认识与实践方面的质量水平。好的教育政策执行效果的评估必须遵循一定的评估标准,评估标准也在一定程度上表明特定时期教育政策发展的价值负载。已有研究在评估标准方面主要从事实标准与价值标准两方面出发。事实标准以数量、比率等可量化指标来揭示效果评估的本质,如萨茨曼(Suchman, 1967,第61页)将评估标准分为工作量、绩效、绩效的充分性、效率以及执行过程,孙绵涛(2010,第211—218页)将教育政策执行效果评估标准分为教育政策投入、教育政策效益、教育政策效率、教育政策回应程度。价值标准倾向社会与个人的主观意愿的表达,带有价值判断因素。随着后实证主义的兴起,价值因素被纳入到标准构建中来,如邓恩(2002,第437页)将评估标准分为效率、效果、充足性、公平性、回应性和适宜性,其中,公平、回应和适宜正是基于价值标准的评估审视。祁型雨借鉴价值哲学的理论内涵,以教育政策价值为逻辑前提,提出教育政策价值存在的评估标准、教育政策价值规范的评估标准、教育政策价值必然性的评估标准(祁型雨,2003)。


       教育政策执行效果的评估相对于政策评估来说,是更加具体的评估,与现实问题的联系更加紧密。结合教育政策执行效果的评估的本质内涵以及前人已有研究成果,教育政策执行效果的评估标准的建构应坚持事实标准与价值标准的协调统一,从体现教育政策执行的本质属性、反映相关利益主体的利益诉求、评估方法与技术切实可行、实现教育政策执行的最佳效果四个层面确立评估标准。一是公平性,即教育政策执行成本与收益在不同利益群体之间公平配比的程度;二是充分性,即教育政策执行结果解决政策目标问题的程度;三是可行性,包括社会约定合规(必须得到法律、道德等社会约定的认可、与其规范一致)、政治可接受(不能违背当前社会主流政治思想与政治利益)、经济可负担(成本适度、预算准确)、时间可允许(便于在规定时间内完成)等;四是回应性,即教育政策执行实现不同利益主体诉求的程度;五是操作性,即方法与技术的运用合乎逻辑,可投入实操;六是规范性,即教育政策执行程序遵循要素规律、遵守社会规范;七是效率,即教育政策执行成本——收益间的比例关系,成本需考虑直接、间接和机会成本,收益应考虑直接和间接、短期与长期、显性与隐性的收益;八是效果,即教育政策执行对于社会子系统产生的影响变化,从事实价值和符号象征价值来评判。


      依据四层面的八个标准,对“双一流”政策执行效果的理性评判应当聚焦以下几个问题:一是“双一流”入选名额及入选后资源配置的公平性问题。该问题涉及第一轮遴选时对地方需求与资质达标的双重考量,即对高等教育资源弱势区域同搭上“双一流快车”资格的妥善处理,对不同层次不同类别高校和不同学科实施的差异化标准,以及2016—2020年五年间对入围者的资源投入依据及投入力度。第一轮“双一流”的遴选标准与遴选方式受到质疑,专家委员会和高校自定的遴选方式是否能保证公正、公平、客观、真实,其中的人情关系、“985”“211”标签理所当然的权威地位、自定学科中的水分等问题如何避免。不同高校和学科的建设重点千差万别,自然学科较人文社科相比具有显著的效率效果优势,对此,政府如何权衡入选后的资源配置使其物尽其用?二是“双一流”政策第一轮执行实现政策目标的充分性问题。《统筹推进世界一流大学和一流学科建设总体方案》(以下为《总体方案》)中总体目标提出“到2020年,若干所大学和一批学科进入世界一流行列,若干学科进入世界一流学科前列”,近期,多数学校在自评基础上组织开展专家评议会,对照《总体方案》要求,大都认为实现了短期目标。与遴选方式如出一辙的周期总结方式得出的结论,不免带有“既是运动员,又是裁判员”的色彩。三是“双一流”政策全过程的可行性问题。政府牵头推进新时代一流大学和一流学科建设,在政治性问题上不言自明,也具备着充分的法理和社会舆论基础,中央财政和地方财政分担入围高校的建设支持,在资源配置方面有着强有力的保证,“三步走”阶段目标和五年一轮的动态调整为实现“双一流”规划了合理蓝图。四是“双一流”政策执行实现政府、高校、教师、学生等主体的利益诉求程度。政府期望通过政策支持和资源投入来实现高等教育强国,地方政府在支持“双一流”建设中也希望能带动区域经济发展,高校则落脚于自身学术水平、学术声誉等的提升,教师和学生对“双一流”的参与、支持和选择,也带有自我实现的需要。五是“双一流”政策执行的操作性和规范性问题。在具体工作的开展上,从中央到地方、高校都形成了自上而下的实施方案,高校层面以中央文件为指导,结合高校现状和拟建设重点进一步细化行动路径。同时,阶段性调整、跟踪调查、部际协调监管等动态路径也保障了政策执行的规范性。六是对入围高校的投入与产出的效率分析。在政府大力的支持力度下,入围高校在培养高水平人才、引领尖端领域、创新前沿成果、社会服务反馈等方面的发展和贡献情况如何,建设方案的具体落实情况及其对计划目标的达成度如何,对这些指标的绩效评估需要从数量和增量两方面开展。七是“双一流”政策执行的溢出效应,包括对国家建设、对入围高校、对未入围高校、对社会大众等更加广泛的主体的影响。“双一流”一定程度上意味着国家层面更多的政策倾斜与国家建设期许。对入围高校来说,既是机会也是考验,入围高校能否把握机会实现高水平办学,抑或是为保住“一流学科”的头衔从校内非一流学科成果中东挪西凑,非一流学科遭受不公正待遇;未入围高校因缺少“双一流”的标签效应,在人才培养、科学研究等方面被动落后,“双非”学生在人才市场处于劣势;社会对“双一流”的舆论立场有好有坏,质疑“一流”的同时又不得不向规则妥协。

(二)认识重塑:指标体系兼顾要素多元与联动协调

      教育政策执行本身是一种动态的综合行为,将教育政策执行造成的影响变化这一抽象事实转化为可观测、可言说、可理解的信息,需要借助系统的指标体系来呈现。指标体系的构建以评估标准为基础,将评估标准所体现的价值原则体现于具体可操作的说明性指标之中,而受制于人类认识与实践的有限理性,构建一个满足所有评估标准的指标体系并不现实,指标体系在具体的评估活动中也可能因为政策执行的推进或新政策的执行而出现不适用的问题,因此,指标体系的构建应从动态的角度出发,避免僵化的唯标准评估,尽可能纳入多元的政策执行要素,重视各级指标之间与指标面向要素之间的联动协调。事实上,学者们针对特定教育政策执行效果的评估的研究在不同教育政策的指标设置上也有着较大差异。如谢治菊等人(2017)针对民族教育政策实施效果,构建了包括客观效果(目标实现程度、对各层面影响、对学生影响、政策走向)、主观福祉(学生对政策知晓度、学生对政策满意度)、伦理价值(目标科学、实施公平、内容合理、内容可行)在内的3项一级指标、10项二级指标以及24项三级指标。该指标体系借鉴了黄明东(2016)基于后实证主义范式的指标体系思路。罗娟等人(2018)则针对流动人口随迁子女教育政策实施效果,从教育机会、教育过程、教育结果这一教育活动过程视角出发,构建了24项初始指标,经指标赋权筛选后,保留13项权重较高的指标。


      显然,学者们在具体指标体系的构建上,多是以评估标准为导向,结合自身研究的教育政策问题,形成了说明性框架。结合指标体系构建逻辑以及我们所厘定的评估标准,可将指标体系概括为客观效果、主观福祉、伦理价值、行动逻辑四个层面。客观效果是对充分性、效率和效果的体现,表明教育政策执行前后的现实差异,既有政策目标领域内各要素的影响变化情况,也有政策目标领域外的溢出效应,溢出效应是特定政策执行未曾考虑到的现实效果,内容上更加丰富分散,主体上更加广泛多元。客观效果可能是积极的变化,也可能是消极的变化,从另一种意义上来说,单项客观效果也可能展现出双重效果,对不同领域产生着不同属性的影响。“双一流”建设的客观效果分为目标实现程度和影响属性两方面。目标实现程度聚焦政府和高校两主体,政府层面重点观测中央和地方政府推进“双一流”工作中的完成情况;高校层面重点观测一流大学和一流学科对配套方案的完成情况。影响属性则是具体的变动因素,包括入围高校近五年在人才培养(学生、教师)、科研产出(质量、创新、特色、前沿、尖端)、社会服务、文化引领、国际交流与合作方面的成效,以及第一轮遴选中落榜高校、“双一流”学生、“双非”学生等多元利益主体的核心变化。客观效果的评估不是简单地“数人头”“数成果”“排名次”,而是以量化指标为依据重点考量“双一流”大学在创新引领、社会贡献、国际影响力等方面的增量。主观福祉是对回应性的体现,重点观测利益相关者对特定教育政策执行前后的感受,纳入了利益相关者的主观偏好、价值选择、现实诉求等因素。对于政策调整所涉及的参与主体满意度等主观意愿的测量,就是关于主观福祉达成情况的说明,如全国基础教育满意度调查,分别面向基础教育服务对象、教育工作者、教育管理者、社会公民进行各级教育质量满意度的评估。“双一流”政策主观福祉的评估,重点挖掘政府、高校、学生、社会各界对“双一流”建设的满意度和认知度。从第一轮“双一流”的完成情况来看,该政策是否真正起到了提升效果,是切实迈向国际一流的奋进之笔,还是以争夺头衔及其背后的可观资源为目的编织的美好假象。 2020年8月,教育部发文要求第一轮“双一流”高校组织开展周期总结工作,各大高校已经公布的评议结果显示,绝大多数高校都自信宣告自己完成或超额完成了建设方案目标,极个别高校评议结果中未明确肯定完成了阶段性目标,对于这样的结果社会民众并不买单,舆论中不乏质疑的声音。针对清华大学“全面建成为世界一流大学”以及数所高校“进入世界一流大学行列”的自评,教育部回应,取得了一定的阶段性成果,但对同世界一流大学的差距要有清醒认知。与此同时,受到该政策影响的高校学生、劳动力市场等也显现出回应,从前的“985”“211”到现在的“双一流”,学生及其家长、劳动力市场在做出选择的时候首要考虑这些标签,未能搭上时代“快车”的“三不沾”高校及其学生陷入更加窘迫的境地。伦理价值则体现了公平性和可行性,从社会价值观念的角度出发,考量社会公认的伦理原则的遵循情况,伦理价值是更为意象化的事物,虽然该维度的把握相对困难,但对教育政策执行效果的评估的伦理价值而言,其对个体和社会系统的发展有着深远长效的意义。该指标的评估,重点观测“双一流”认定及后续国家重点支持行为的公平性;自上而下政策各环节参与主体行为的合法性;“双一流”方案各阶段目标实现的合理性;国际一流同中国特色权衡、高校学科差异化处理、量化和质性评判标准厘定方面的科学性;“双一流”建设进程中考量、吸纳、反馈社会大众的民主性程度。行动逻辑体现了规范性和方法技术的可行性,重点评估教育政策执行过程的质量水平,行动逻辑层面的评估也能在一定程度上说明政策执行本身的效果。“双一流”建设的行动逻辑是由“双一流”的遴选——政府和入围高校的联动推进——周期总结评估构成的闭环上升形态,各阶段的行为主体及其运用的评估方法与技术实现了“双一流”政策的有序开展。就目前来看,该政策执行的行动逻辑中存在着几个方面的问题。一是遴选阶段专家委员会和高校自定的评议方式是否合理,遴选标准遵循绩效导向中的各大排名榜、SCI文章产出等是否充分,相对而言,人文社科较理工科相比指标效应偏弱;二是周期总结缺少第三方评估的介入,且由政府委托的评估单位在一定程度上所得的结果并非价值无涉的评判,多是对政府偏好的再现。

(三)方法升级:评估方法与技术尝试定量与定性相混合

      在评估的方法论问题上,需要结合具体的研究进行适切的方法与技术的选择,不同的教育政策执行所侧重的目标群体选择、价值导向、问题视域不尽相同,定量或定性方法的单一运用并不足以说明现今社会运作中教育政策执行的效果问题,因此,必须以问题为导向,综合采取定量和定性相结合的思路开展评估活动,尽可能兼容客观事实与主观价值因素,重视方法践行于社会实际中的运作机理的科学可行。国外学者在评估方法与技术的认识与实践中有着较为丰富前沿的方法论研究成果。如由经济学视域中的“投入—产出”模式衍生出来的教育生产函数理论模型(Hanushek,1986),教育产出的绩效问责制度推广下兴起的增值评估法(托马斯,彭文蓉,2005),强调政策干预中的利益相关方都参与到评估过程中的参与式评估,以顾客(教育政策受益者)的需要和期望得到满足的程度为重点的顾客满意度测评模型,以及德尔菲法、层次分析法、幕景分析法、时间序列分析法等具体的方法。我国在引介国外公共政策评估方法论的基础上也进行了基于我国教育政策环境的积极尝试。如“成本—效益分析法”,综合考虑教育政策执行的所有成本和全部效益,将其转换成可计量的单位进行比较。前后对比法运用数据统计、观察量表、实验对比等方式对政策执行前后的情况作出直观呈现并加以分析。还有以相关领域专家为主的专家评估法和以政策目标群体的主观理解和切实感受为依据的目标群体评估法。也有学者尝试将国际中对于社会项目的“影响评估”引入到教育政策的评估当中,思考随机干预试验方法在教育政策执行作用下的“事实”与“反事实”推理(汤蕾等,2020)。


       方法本身并没有绝对的优劣之分,无论是数量化的试验设计、数学统计、问卷调查和社会审计,还是推理归纳的哲学分析、逻辑分析和系统分析,都有着可供利用的实践价值。选择方法与技术的过程也是对于政策执行效果的评估的认识活动,方法与技术运用的程度与功能发挥,除了其本身无法克服的限制性因素外,还受制于使用者个人的价值观念、个人经验、素质能力等以及被观测群体的认知能力、意愿态度、配合情况和现实中的经济、设备等。因此,除了重视评估方法与技术在事实评估与价值评估的多种反馈之外,还应强调评估过程中的多向度立场考察,突破以政策执行者为导向的单一向度,面向利益相关者构建起信息对称、途径对等、观念等价的双向机制,使更多利益相关者参与到评估之中,贡献认识与行动智慧(杜文静,葛新斌,2017)。


      综合以上观点,我们认为具有中国特色的教育政策执行效果的评估方法与技术应着重从以下方面来选择。一是评估模式选取利益相关者模式,充分考虑多元利益主体的意愿诉求,打破“圈内评估”片面化的伪评估现象。以古贝和林肯为代表的第四代评估理论强调多元评估主体的参与,重视主体对事物的主观评价,尊重群体沟通协商所构建的价值逻辑(钟秉林,王新凤,2020)。对“双一流”政策执行效果的评估也应积极将政府、高校、学生、家长等多元利益主体吸纳到效果评估之中,尽可能充分地实现评估标准。目前对“双一流”政策执行效果的评估多是由政府和高校开展,难免进入立场固化的思维怪圈,应在以高校自评为重要依据的基础上,发挥政府的审查督导作用,并尝试将第三方评估引入到“双一流”政策执行的各环节之中,在引入第三方评估时,以平等合作为基调,以尊重科学性和客观性为导向,以高等教育的质量提升为共同目的。二是评估方法采取定量与定性相混合的方法,针对教育政策执行全过程开展综合分析,运用风险评估等方法对政策执行前以及执行中的各类风险进行计算分析,混合运用田野调查法、目标群体评估法、专家评估法、层次分析法、实验法等方法对政策执行中以及执行后的影响变化进行统计与归纳。在开展一流大学和一流学科的遴选评估工作时,践行“破五唯”思路,以高校自评中提交的成果的数量和增量作为重要依据,同时积极推进同行评议、专家评议、风险评估等策略。当前,周期工作总结中自请专家进行自评自审的评估结果有待考究。高校自评过程中,尤其是一流学科建设高校中,在应对量化指标问题时,难免会出现拼体量的做法,东挪西凑非一流学科的相关成果为学校的一流学科点提供丰富的资料支撑,而国家开展的第四轮、第五轮学科评估工作中都在尽可能避免这种重复堆砌以达到倍增效应的方式,如此一来,一流学科建设高校的自评结果和学科评估结果之间便会呈现出差异化问题。对此,可以借鉴第五轮学科评估中的融合评价思路,开展基于定量数据和客观证据的专家融合评价(杨卫,2020)。同时,重视社会大众对“双一流”建设工作的舆情风向,将社会民众对“双一流”的推进情况及效果的观感认知纳入风险评估之中,避免舆论反噬降低政府的公信力和高校的学术声誉。三是评估技术的选用立足多学科视角,思考经济学、理学、医学等领域对于政策执行效果评估的科学移植。可以尝试利用区块链、物联网等现代信息技术开展评估工作,区块链技术具有公开透明、不可伪造、痕迹保留等特征,有利于“双一流”建设中高校信息的动态收集与管理,也更易接受社会各界的监督,实现对社会舆情的风险防控。

(四)实践推进:评估结果分析说理与反馈应用并重

       好的教育政策执行效果的评估以科学准确的结果呈现为起点,最终应落脚到现实社会中政策逻辑的改良与政策路径的修正之中,评估结果只是评估活动的一部分,仍需要针对结果进行深入的推理分析,找出问题、探明解决思路并将有效信息反馈到教育政策系统之中。一方面,评估结果应实现第一层次的分析说理功能,呈现充分、系统、科学和准确的评估结果以供各方解读。该层次的评估结果不是整体与部分的僵化割裂,也不是单一的数据堆积或是资料呈现,而是需要在获取准确一手信息的基础上,结合理论与现实进行充分的归纳、推理与分析,将信息由“可供解读”转换成“可供利用”的形式,以更好地投入到教育政策的调整之中。“双一流”政策执行效果的评估结果最终应多元呈现,总体结果与单项结果相结合,强化分类评估,在明确各高校建设成效的基本信息上,形成更加专业、深入、细化的结果分析,对得到的评估结果进行归因,反思第一轮建设中的成果与不足。另一方面,评估结果必须面向教育政策活动进行反馈应用。评估活动获取的结果返还到政策系统之中才能真正体现出评估活动及其结果的价值,实现评估的最终目的,教育政策执行中和执行后都在进行着效果产出。因此,一是要构建起畅通的反馈机制,由专业人员对收集到的信息进行整理、筛选与分析,归纳形成教育政策执行效果的评估报告,进而实现对不同群体的面向,即面向政策制定和执行部门提供政策调整改进的依据;面向相关利益者提供充分、真实、准确的切身利益问题的解决情况;面向社会公众公开政策信息,展示政策贯彻执行情况;面向专业同行公开执行过程及其结果以相评、相鉴与相促。“双一流”政策执行效果的评估结果除了用于政府、高校等核心利益相关者的交流探讨外,还应向社会充分公布,使“双一流”政策接受社会大众监督,形成对政府和高校行为的质量问责与监控,拓宽评估结果反馈路径,让更多的社会组织和个人能够参与到一流大学和一流学科的重大战略推进之中,切实提高政策的影响力和民主性。评估结果对不同群体的面向,有利于提升高校的社会声誉,强化学生、家长、用人单位等对“双一流”的正确认识。二是政策执行者应转变消极抵触的被评估态度,树立正确的参评意识,主动作为并积极配合评估工作的开展,重视并推进评估结果在具体实践中的应用,评估的目的不在于划分优劣,而是要去伪存真,更好地服务于国家教育事业发展与教育政策过程的科学化与民主化。“双一流”的周期评估的首要目的是通过高校及各方反馈情况来检验政策执行的效果,更重要的目的在于以此为依据对政策执行进行完善,动态调整“双一流”的进出机制,并探明入围高校、落榜高校、清退高校的变化动因,以实现更深层次的政策效应。教育行政部门应正确看待评估工作,积极采用第三方评估机构来创新政府管理方式,充分发挥评估结果的实践应用,进一步优化“双一流”的遴选、实施与评估总结机制。根据“双一流”第一轮的建设情况,对新一轮的支持方式与力度进行有序配比,分层分类分区确定阶段性政策规划,坚持总量控制和动态调整,不要急于求成摊大饼。


       总之,要实现好的教育政策执行效果的评估仍需要针对其间种种要素进行深入的打磨重塑,立足时代推进评估研究与实践的深刻转向。一是深化事实评估与价值评估相统一的理论与实践,二是打破就效果谈效果的评估局限,三是探索公共政策视域下新的评估策略。从评估的价值立场而言,政策发展对价值评估提出了更高的需求,迫切需要摆脱实证主义的理性局限,纳入更深层次的社会和个体价值阐释。在追求事实与价值同构共生的过程中,既要发挥事实评估对效能评估的严谨功效,也要关注价值评估在方法论上的深入演进。从评估的层次范围来讲,政策执行的影响相当广泛,除了教育政策目标领域内的效果产出,目标领域之外对社会生活也产生着多重影响。囊括目标领域内外的教育政策执行影响的评估弱化了对特定政策目标对象的锁定力度,拓宽了评估对象与内容的边界,对该评估的考察尤为困难,但有着更加重要的价值产出。从评估的方法论建构来看,尚难以突破公共政策视域构建出教育领域自身的方法论,但可以且有必要引入新的评估方法与技术。“影响评估”不失为一种新兴尝试,将“影响评估”恰当引入教育政策执行效果的评估之中,采取“归因”与“反事实”两种路径,评估教育政策执行造成的可观测到的和未观测到的影响结果及其影响机制,对分离教育政策干预的“净影响”有着一定的作用。


(祁占勇工作邮箱:qizhanyong@snnu.edu.cn)

如需阅读全文,请到《华东师范大学学报教育科学版》官网获取。

联系地址:北京西路15号(210024) || 联系电话:025-83300736 || 苏ICP备14027130号-1
主办单位:江苏省高等教育学会
苏公网安备 32010602010156号
Baidu
map