评估正在成为一种流行。无论传统公益,还是社会创新,不管善款是来自基金会、集团、政府采购、群众募捐还是来自社会投资,人人都越来越爱追问“你所取得的社会影响是什么?”可以预见,人人对社会影响评估的需要会越来越旺盛。

但是,评估和社会影响,这两个词含义都比较模糊,即使在规范的研讨和咨询领域,也没有正式的概念。不同之语境下,人人所指不同,这造成了沟通的阻力,也妨碍了人人正确认识和表述评估的总产。

什么是评估?

假如我们分析了封建社会问题,构建了革命理论,穿过监测加强了品种的实施,并且取得了正确的近年收获。这时,咱们能不能宣布项目成功了呢?

还未能!

咱们还要求追问,品种的中期和长期成果如何?咱们实现了品种的中期和长期目标了吗?要掌握,近来收获通往中长期成果的途径,并不一定像逻辑上那样畅通无阻。她有待检验。近来收获良好,但中长期成果不可以,该系现象在真实世界中并不希罕。

柯氏四级法是培植领域的正式评估方法。她把培育之总成绩分成四个递进的市级:

生存上的变迁。结果层则是作为变化之后给所在集团带来的时效改变,比如对集团战略、品种、筹集、管理、初三等造成的影响。

在有些培训中,培训师语言幽默、资料有趣,影响层效果可能不错,但学生并不一定能学习到什么深刻的胆识。而部分培训,虽然教给了学生很多知识,学生却未能采取在协调以及组织身上,这样行为层和结果层的就没有影响产生。

对一个培训类项目的终极考验,至少要到行为和结果层。从而,在未来一章介绍的探测,因为只能关心到近期收获,也即只能考察到反应层和学习层,实际上并不能对项目的总产做出最终判断。

乡村教育行动项目(REAP)曾做过一场营养实验。北方农村地区的男女贫血现象比较严重,这影响到了孩子的生长和学习。为了消灭这一问题,她们设计了多少种不同之干涉。其中一种是为老人提供培训,目的是通过家长改善学生的饮食结构,追加营养,故而改善学生的贫血状况。该干预的近年和中长期的总成绩链条是这样的:

该系项目在公益领域很常见。咱们在五光十色的品种中,为干事长、教师、大人、镇区等提供五花八门的短期培训,以至于当我们回忆公益项目的时光,先后一个冒出的想法可能就是培植。REAP 在晚期评估时发现,上述影响链条,在先后一个环节就断了,许多家长回去后,并未为子女改善饮食,或者改善行为并不能继续,儿女贫血状况也没有发生改变。从而,即使项目组为老人提供了优质的扶植,聘请专业的师资,付出了有趣的学科,甚至也使用参与式的措施,然而影响之链条在上下培训结束之后就断了。这种干预,虽然近期上上下反映很好,但中长期的总成绩递进过程中孩子的贫血状况并没有改变。

该署情景都清楚地报告我们关注中长期成果的第一。监测不能兑现此项功能,咱们需要评估!

此地,咱们把评估定义为:评估是一种经常性研究工作,针对的是项目在中长期时限内所带来的社会改变做出分析和判断,故而为项目策略调整提供可靠的以实际为基础的表决依据。

监测与评估的区别

要求注意的是,许多时候,人人把“监测”和“评估”构成在总共看,她们把监测理解为一种“经过评估”。而此处则把评估界定为一种与检测不同之东西,咱们觉得这种相互区分而不是相互交融的定义更有利于行动者理解和利用。

何时需要评估?

评估在邓小平理论上是抚今追昔性的。她特别强调系统搜集项目过往或者正在发生之影响信息,故而以实际为基础,做到尽量客观的论断和建议。

评估在利用上又是前瞻性的,评估必须对项目未来的开拓进取决策产生影响才有含义。但是,评估所影响之表决绝不是关于项目实施的细节决策,那是监测的根本职能。在现实工作中,评估发挥作用的状况大概有如下几种:

重大种现象

品种已经运营了一段日子,监测结果表现,品种的近年成效不错,咱们盼望广大复制,故而让更多的中央更多的口方可受益。然而,在规格化之前,咱们需要评估确认项目的远期成果也是正向且有效的,不然我们可能会贸然推广一种错误的品种模式。一派,咱们也要求第三方出具的成立的评分报告,这样更容易赢得广大利益相关方,如不同中央的政权和企业之信任。

老二种现象

和重点种现象一样,品种已经运转一段日子,监测近期收获不错。不同之是,咱们并不想采用自己开连锁店式地扩张规模,而是希望提炼出有些标准、主意和沼气式,以便为另外部门参考借鉴。此种地下,咱们同样需要通过评估来确认项目中老是行之有效的。此外,咱们还要求进一步分析项目的成功要素是什么,她适用于哪些内外部条件,这样也有利给任何部门更好的操作应用。

先后三种现象

政府期待出台某种政策,或者出资大力推广某种项目。在专业大规模推广之前,较为谨慎的打法是首家小规模试点,接下来通过评估判断政策或项目的社会影响。如果评估结果良好,才进行大规模推广。这种基于评估的以实际为根据的策略制定方法,是一种避免国家能源浪费的审慎做法,已经把许多国家采纳。时下中国政府大力推动政府型的公用事业项目,有的项目并未经过评估论证,很可能造成了大量资源浪费。有的项目虽然下投入上看轰轰烈烈,但长期上由于效果不佳,反而可能会引起公众对公益之不相信,对公益之开拓进取是事与愿违的。

先后四种现象

咱们的品种已经运转了几年,近来效果通过监测感觉也不易,下一场,咱们盼望在未来几年里延续并升级原有的品种模式。这样,咱们需要通过评估来确信项目的中坚内核在中长期上是行之有效的,咱们还要求分析哪些是项目成功之因素,明日需要保持;哪些是不那么有效的一部分,明日需要剔除;哪些内外部的假想已经发生变化,咱们需要调整。在这种状况下,评估成为了方针或战略规划的重点工具。

将来三种现象,不论是是自家复制,还是加大给人家,抑或是政府借行政的力进行推广,都和大规模应用有关。咱们可以称之为“为实用化而评估”。

先后四种现象,则可以称为之“为策略升级而评估”。这两种评估情景,都源于我们对中长期成果产生了不确信,或者需要论证项目中长期效果,而这是由评估的概念所决定的。

此外,四种现象下,评估可能影响之表决,都在“品种模式”规模。无形化是针对模式的,升级也是针对模式的。不论是哪种类型的评分,咱们都要求项目有一番较为平稳的货仓式。这是一番主导前提。如果模式不平静,劳动目标、目标、宣传内容等都可能在变,这时需要的不是评估,而是能够提供及时信息的探测。

从而,评估并不是一种持续性的作为,不是成套项目都要求做评估,一度项目也不经常年年做评估,只有在品种模式基本稳定,而且在政策升级以及规模化的前夕才需要开展评估。

评估什么?

不管哪种情境下,评估都有两项基本任务。本条是“总结判断”,也就是判断项目是否成功,只是产生了正向的主动的社会影响,只是值得延续、升级或推广;那个是“剖析原因”,也即分析项目为什么成功或失败,品种值得延续、升级和放开的根本成份是什么。

这两项基本工作职责,它们所关心的题材也有所不同:

“总结判断”是评估任务的底子。“剖析原因”时下还没有结构化的措施可以遵循,从而,咱们将在下文重点介绍评估执行“总结判断”任务的办事方式。对项目价值做总结判断,副逻辑上大致可以分为三层递进的剖析过程:

重大,目标对象在中长期上发生了哪些变化?(成果)

老二,该署变迁有哪些是由项目带来的?(影响)

先后三,与本相比,品种投资是否划算?(效率)

三层分析分别对应着评估金字塔的三个层次,即成果评估、影响评估和频率评估。

其中,成果评估针对的是目标人群在中长期的总成绩变化;影响评估则是因为项目的,减员其它因素后,单纯由项目带来的“净成果”,而效率等于“净成果”除以投入,也即投入产出比。

咱们不难看出,在评估金字塔中,基层是上层的底子,如果下层没有做,或者不牢靠,上层的评分就无法进行,或者效果将大滑坡。

最先,成果评估是成套评分的底子。绝大多数公益项目,如果能够将服务人群身上发生之变迁讲清楚,那已经相当不错了。

下,此间的影响评估采用的是比较严格的概念,她需要做归因分析,而归因分析则是公认的评分难点。从严定量化的归因分析需要很强的技艺和大量资源之涌入,是大部分公益项目不能顶住的。咱们鼓励大家,在成果评估的基础上进行定性的归因分析,以便对项目的社会影响做出尽可能公允的论断。

说到底,效率评估,也即人们经常谈论到的“社会投资增长率”,位于评估层次中的最顶端。人人当然关心,针对特定的社会影响,姹紫嫣红那么多钱,步入那么多口力,到底值不值。这也是萦绕在诸多艺术家以及社会投资家们头脑中的问题。


文章来源|南都公益基金会

图表来源|南都公益基金会

血站编辑|瞿艳梅