来源 《数字化的经济》杂志第6期《推动公共数据授权运营的难点和解决路径》国家信息中心博士后管理办公室副主任,刘赫,如转发需标记来源。
摘 要:我国各级政府都在快速推进数字政府建设,而其建设成效如何则需要测度、评价与改进。数字政府建设成效测度与评价的文献日渐增长,本文对这些文献进行综述,重点探讨数字政府建设成效是如何评价的,如何评价数字政府建设产生的各类影响,以及如何对数字政府建设成效评价进行诊断与优化,并提出未来该领域需要我们来关注的研究方向。本文认为,未来研究应聚焦数字政府建设成效测度与评价的典型领域,厘清数字政府建设成效的形成机理,研究数字政府建设成效不彰的“中梗阻”,并提出数字政府建设成效优化的路径与策略。
数字政府建设旨在推动政府数字化转型,实现政府高效能治理、人民高品质生活和企业高水平质量的发展。近些年来,我国大力推进数字政府建设,极大地提升了政府办事效率、营商环境和公共服务满意度。2022年6月,《国务院关于加强数字政府建设的指导意见》(国发〔2022〕14号)印发,为加快数字政府建设指明了方向。2023年2月,中央、国务院印发《数字中国建设整体布局规划》,将数字政务作为数字中国建设的重要组成部分。无论是联合国等国际组织的评估,还是我国各类机构开展的评估,都显示数字政府建设成效显著。
值得注意的是,虽然我国数字政府建设的受重视程度、财政投入和政策支持较强,但是数字政府建设的真实的情况和效果往往同理想状态存在巨大差距,在很大程度上影响领导干部、普通公民、企业等用户对数字政府建设成效的感知与评价。不少数字政府建设工程劳民伤财,沦为形象工程,没有实现预期目标和发挥预期作用,甚至会出现线上牵连线下的窘况。与此同时,一些数字政府建设项目推倒重来和另起炉灶,导致“数据孤岛”并带来个人隐私信息保护的安全风险。还有一些数字政府建设项目本应减轻基层负担,但却使基层负担不减反增,诱发“指尖上的”。
为什么数字政府建设未达到预期成效?哪一些原因影响数字政府建设成效?数字政府建设成效不彰的发生机制是什么?怎么样改进数字政府建设成效?这样一些问题值得探究,也关乎如何通过测度与评价来持续改进数字政府建设成效。数字政府建设在推进过程中特别要关注建设成效如何的问题,而这第一步是要测度和评价数字政府建设成效。当前有关数字政府建设成效测度与评价的研究积累了大量文献,但还缺乏文献概要加以评估和推进。本文对数字政府建设成效测度与评价的相关文献进行综述,并提出未来需要我们来关注的研究问题。
基于对已有文献的回顾与总结,本文发现相关研究主要从如下三个方面开展,即如何理解和评价数字政府及其建设成效,如何评估数字政府建设的各类影响,以及数字政府评价导致的行为响应和影响。本文在以下部分对这三个方面做文献概要,并对相关文献使用的研究办法来进行评估。最后,总结相关文献并提出未来研究方向。
数字政府建设同数字技术的发展、应用和推广紧密相关,数字技术的发展、应用和推广在很大程度上塑造了数字政府形态。因此,已有文献提出了多种数字政府演进阶段模型,关注不同时代的数字技术打造的数字政府,并聚焦数字转型的原因、对象、过程和结果。数字政府既关注政府内部的决策支持系统、管理信息系统、办公自动化等,也强调政府外部同其他政府、企业和公民的信息共享与公开、服务提供和互动交流。与此同时,数字技术会在经济调节、市场监管、社会管理、公共服务、生态环境保护、政务运行、政务公开等不同政府职能领域和业务场景应用,需要关注各个领域的数字政府建设成效评价。
从公共治理范式的变迁来看,先后有官僚制、职业规则、新公共管理、新韦伯式国家、数字时代的治理、公共价值管理、新公共治理等七种范式,它们在集中控制、水平协调、价值表达、社会参与等维度差异明显,并对数字政府建设及其成效评价提出不同诉求。有研究认为,公共价值包括效率、效益和社会价值,而就数字政府来说则包括成本、时间、便利性、个性化、沟通、信息获取便利性、信任、完全知情、决策参与等9个因素,它们可以用于衡量数字政府成功与否。还有学者通过问卷调查发现,公共价值理论可以用于指导发展中国家的电子政务绩效评价,需要关注信息质量、电子服务功能、用户导向、效率、开放性、公平和公民信任、环境可持续性等关键价值维度。
对77篇论文的系统综述识别了五大类136个涉及电子政务绩效的概念,包括使用便利性、有用性、用户满意度、基础设施、网站成熟度、授权、运营效率、服务质量和信息质量等方面,这说明电子政务绩效评价框架需要围绕这些关键概念进行,并注意引入其他未被重视的绩效维度。有研究构建了以公民为中心的电子政务服务评价框架,包括成本、收益、风险和机会等四个维度,并在土耳其得到验证。对墨西哥州政府的研究显示,评估政府网站提供的数字服务质量,需要关注如何不断精减指标和提供测评效度。还有学者构建了政府网站促进数字民主治理的理论框架,认为要关注公民是否通过政府网站实质性参与民主。
概括来讲,当前我国有关数字政府建设成效的测度与评价主要有如下几类有代表性的做法。
①政府网站绩效评价。2002年,中国软件测评中心开始发布中国政府网站绩效评估报告,对中央部委、省级、地级以上城市、区县级政府网站绩效做评估。2016年以来,清华大学国家治理研究院对中央部委、省级、地市级、区县政府网站绩效进行评估。这些是最早开展数字政府评价的机构,主要聚焦政府网站的信息公开、互动交流和服务提供等方面,侧重政府网站提供的各种功能。但是,这些评估没有认识到政府网站只是数字政府的一个方面,没有对移动政务和数字政府的实际使用情况进行评估。
②政府网上政务服务能力评价。2015年以来,国家行政学院电子政务研究中心受国务院办公厅电子政务办公室委托,对 31个省份和新疆生产建设兵团的政府网上政务服务能力进行第三方评估,2019 年将32个重点城市纳入评估。2016年以来,南京大学政务数据资源研究所开展政府电子政务服务能力测评,覆盖中央部委、省份和地级市。类似地,2018年以来,电子科技大学智慧治理研究中心对全国334个地级行政区政府的“多网、多微、多端”的全互联网服务能力进行监测和评估。2019年以来,南开大学商学院网络社会治理研究中心每年发布“数据赋能政府治理评价指数”,包括社会治理、公共服务、保障支撑和公众参与等维度,并对重点城市进行排名。清华大学数据治理研究中心自 2020年以来发布《 中国数字政府发展指数报告 》,从组织机构、制度体系、治理能力、治理效果等方面进行评估。
③各类数字政府专项功能评估。数字政府表现在许多方面,不少评估都是针对某个方面的功能和表现展开的。比如,不少机构针对政务社交媒体或政务新媒体开展评估,侧重政府部门使用微博、微信、抖音短视频等进行信息公开和互动交流的情况。数字政府的题中之义是通过互联网提升政府信息公开和透明,所以不少研究机构对政府透明、财政透明进行专项评估。2021年,复旦大学数字与移动治理实验室开发“中国政务服务掌办指数”,聚焦移动政务服务App的掌上好办开展测评,反映出对移动政务服务质量的关注。2017年,复旦大学数字与移动治理实验室开始发布“中国开放数林指数”,对省市两级政府数据开放进展进行评估,并在2023年纳入公共数据授权运营方面的评估。此外,中山大学数字治理研究中心围绕政务服务智能化建设、政务热线服务质量进行全国范围的评估。与此同时,腾讯、阿里巴巴、微信等互联网公司针对其所提供的数字服务进行评估,如“互联网 + 城市服务”、政务小程序等。
从全球来看,数字政府建设也催生了许多测度和评估。例如,联合国每两年开展的成员国数字政府调查影响较大,主要从电子服务和电子参与、数字基础设施、人力资本等角度进行评估。与此同时,不少国际组织和研究机构也评估各国和主要城市在政府网站、开放政府数据、智慧城市等方面的绩效。比如,美国罗格斯大学的研究团队就对各国主要城市的政府网站绩效进行评估。
上述针对数字政府建设成效进行的测度和评价,为诊断和评估数字政府提供了依据,但在谁来评价、评价什么、如何评价、评价结果运用等方面也存在值得改进之处。比如,这些评价无法面面俱到,尚未涵盖数字政府的所有功能;侧重供给侧和客观数据,缺乏对需求侧和用户感知的评价;只关注数字政府的过程和产出,而对其结果和影响评价不足;评价逻辑仍然是简单线性思维,尚未充分认识数字政府的复杂性。因此,有必要对数字政府建设成效测度与评价问题进行深入研究,在上述研究的基础上进一步促进数字政府建设。
如果说上述研究是聚焦数字政府建设自身的成效,那么还有不少研究关注数字政府建设对政府治理、经济发展、社会治理等方面产生的短期和长期影响。电子政务被视为革命性的政府创新,可以推动政府改革、经济发展和社会进步,并被人们寄予厚望。其早期研究主要聚焦电子政务绩效评价,关注如何对电子政务发展水平进行评价。比如,对中国省级政府网站的评价,主要侧重其所公开的信息和提供的服务。研究显示,电子政务的绩效承诺并未实现,对服务可及性、效率、经济、效益和其他结果的影响并不明显,而这同政府内部和外部的各类影响因素都有关。对韩国环境部门的调查发现,电子政务有助于改善基于互联网的决策速度、智能水平和质量,但这取决于高层领导支持和环境行动主义。
数字政府建设成效会最终反映在经济、社会、政治、文化、生态等方面,并需要对其实际成效和影响进行评价。比如,电子政务和数字政府都宣称会通过政府信息公开来强化对政府的问责和监督,进而有效地强化反腐败和廉政建设。但是,国内外相关研究却发现二者之间的关系并不稳定。进一步研究显示,政府部门引入数字技术是否会打击腐败取决于特定环境条件因素,特别是行政问责制度建设。此外,有研究关注数字政府建设特别是大数据引入会推动政府机构改革。还探讨数字化同集约化与标准化对政府采购绩效的影响,聚焦数字政府建设对政府能力特别是汲财能力的影响。因此,数字政府评价不仅要关注政府绩效特别是投入、过程和产出,而且还要关注数字政府最终实现的结果和产生的影响,特别是对经济社会发展带来的广泛影响。
数字政府建设会通过信息公开、服务提供和互动交流等功能影响公民,提升公民对政府绩效的满意度和信任。大量研究都表明,电子政务有助于提升政府信任。研究显示,电子政务绩效的第三方评估结果无法预测公民使用,但可以解释公民对电子政务的满意度。对中国地方政府网站绩效评价以及全球不同国家和城市的比较,也都发现了类似结果。这意味着,基于供给侧的第三方评估同需求侧的民众使用尚存距离,因此需要将需求侧纳入第三方评估。值得注意的是,最近对欧洲的研究发现供给侧的电子政务评估与公民对数字服务的使用率有关,也同公民对政府的信任和数字鸿沟有关。考虑到数字鸿沟让困难群体无法上网获得数字红利,数字政府对社会公平的影响值得关注。
最近一些研究开始关注数字政府建设可能带来的其他影响,特别是对数字经济发展和营商环境优化的作用。比如,有研究发现行政审批制度改革会便利企业准入,而“放管服”改革则有助于营商环境优化。还有研究发现,智慧法院建设通过数智赋能可推动法治化营商环境建设,并使企业更容易获得商业信用融资。研究显示,大数据发展水平会促进政府治理效率提升,而制度环境可以强化这一作用。与此同时,研究显示地方政府采购人工智能技术,会推动企业进一步研发和创新。此外,还有研究考察数字政府建设对行政负担减轻的影响。
上述文献研究数字政府建设对政府自身、公民和企业等的各类影响,为我们理解数字政府建设成效提供了经验证据。但是,这些研究往往是早期基于电子政务特别是政府网站的,针对新近数字政府建设的研究还不多。与此同时,不少研究通过问卷调查获取截面数据,缺乏对数字政府建设成效的长周期评估。这意味着要聚焦数字政府建设对政府、公民和企业的影响,并采取更加可靠和稳健的研究方法进行评估。
数字政府建设成效评价科学、客观、可靠和可信吗?这是已有文献特别关注的问题,并从“元评估”即评估的角度进行批判性分析。有学者开发了第三方评估的评估标准,包括独立性、相关性、效度、信度、易懂性和功能性等六个维度。对多项公共服务绩效第三方评估案例进行的元评估发现,第三方评估存在信度、效度和可用性等问题,并需要推动透明、有效、可用。与此同时,特别需要从评价走向体检,从评价走向改进,推动循证决策或基于证据的决策,推动数字政府建设更加循证和科学。比如,基于“什么奏效用什么”的理念,使数字政府建设少交学费和少走弯路。
针对数字政府建设成效的评价五花八门,吸引政府部门的关注,并使管理人员面临压力。但是,研究显示这些评价和排名的可靠性和可信度并不高,并可能带来对数字政府建设的误导。对英国的批判性研究发现,引入私营企业流行的标杆管理工具对政府网站绩效进行评估,主要是通过政府网站绩效评估和排名来构建有关分类的真理,而这种标杆管理可能会重塑政府与公民的关系,并模糊政府与企业的边界。对非洲6类电子政务排名的研究发现,它们之间的区分度不够,对电子政务实践的指导性也不高。
我国政府绩效评估与管理涉及不少运行已久且影响深远的体制和模式,如目标责任考核制度、党政领导干部考核评价、预算绩效管理、公民评议政府、第三方评估等。对中国城市的定量评估发现,目标管理、效能监察、外部评价等绩效管理工具会促进绩效改进,而法制化、领导重视、结果运用和社会参与等因素会使其进一步发挥作用并改进绩效。针对电子政务的标杆管理自上而下地推动地方政府关注中央政府指令,在推动电子政务整合的同时增强其适应性治理能力。
当前不少第三方评估以排名形式发布,既对政府部门施加压力,也使评价机构面临风险。对荷兰和英国的调查实验发现,不同排名机构可能会使公民对排名结果产生不同程度的信任,公民对联合国的信任水平远高于对本国政府的。一些评价机构为了避免敏感和争议,会选择性地披露绩效优异的地区或部门,而避免曝光排名靠后的评价对象。研究发现,排名公开会强化政府之间的绩效竞争,而排名结果不公开则弱化竞争和绩效改进。对环境信息公开的第三方评估也发现了类似结果,即披露和告知排名会强化压力,推动政府部门改进绩效。对北京市“接诉即办”改革的研究同样发现,公开点名表扬和批评这样的外部压力,会激励政府部门改进绩效。
数字政府建设成效评价期望通过绩效信息公开和反馈来强化绩效问责和激励,进而推动政府部门建设和改进数字政府。从绩效反馈的角度而言,历史绩效差距、纵向和横向社会绩效差距都会对政府网站绩效改进产生影响。但是,强力激励会扭曲政府部门的动机,诱使弄虚作假的博弈策略,进而导致“官出数字、数字出官”这样的绩效管理悖论。比如,数字政府建设可能诱发“数字”,会激励政府部门注重迎合上级要求和强调展示功能的表面工程或面子工程,而不关注其功能实现和用户满意。与此同时,设定绩效目标会带来“棘轮效应”,会使表现不佳的政府部门快马加鞭,但也会让表现优异的政府部门放缓步伐。由此可见,要关注政府部门如何对数字政府建设成效评价做出反应,特别是关注其应对策略,才能避免评价可能造成的负面影响。
对数字政府建设成效进行测度和评价,可能会诱使政府部门将考核压力转嫁到服务供应商,而这可能意味着政商关系会影响数字政府建设成效评价是否会发挥预期作用。数字政府建设主要通过企业外包实现,如果政府部门的评价结果不理想,那么就可能迁怒于提供技术服务的企业,并会激励企业采取措施改进绩效。但是,这也可能会诱使企业博弈,通过弄虚作假来美化绩效。这就意味着不仅要关注政府部门如何对数字政府建设成效评价做出反应,而且需要深入到其背后的企业,关注政商关系如何塑造和影响数字政府建设成效评价。
总体来说,目前对数字政府建设成效测度与评价的研究主要关注评价什么和如何评价,还没有全面剖析评价模式的其他方面,如为何评价、谁来评价、如何组织评价、评价结果如何运用等问题。尽管一些文献初步探讨了数字政府评价和排名存在的不少问题,但还需要进一步的系统评估,揭示评价的问题及其带来的影响,并提出完善评价和改进成效的建议。
从数字政府建设成效测度与评价的研究方法来看,目前研究使用了一些方法,但还需要采用多种研究方法,包括实地调研、二手数据分析、案例研究、问卷调查、实验研究、大数据分析等,从而进一步发展数字政府建设成效测度模型与评价方法。
数字政府建设成效测度与评价的生成机理、形成逻辑和变化过程是值得打开的“黑箱”,需要通过座谈会、深度访谈、参与式观察、神秘客体验等实地调研进行探究。为此,应对涉及数字政府建设成效测度与评价的政府部门和基层组织工作人员开展深度访谈,以了解数字政府建设成效测度与评价的动因、特征、过程和制约因素等问题。与此同时,还应对群众、企业进行实地调研,从他们的立场和视角来评估数字政府的多元功能和影响。此外,可以使用扎根理论来对实地调研资料进行编码和提炼,使之自下而上地涌现出理论构想,为数字政府及其建设成效的概念化和构建理论模型提供依据。
目前有关数字政府建设成效测度与评价的相关资料主要是二手数据,即政府部门的文件、会议记录、报告等。为此,应从多个来源获取二手数据,一方面借助新闻报道和政府网站,另一方面则通过实地调研获取文件资料。这些二手资料可以为我们还原数字政府建设成效测度与评价是如何发起、生成、演变和积累的。通过整理、清洗、编码和匹配等程序,将这些二手资料转化为可供分析的数据,实证分析数字政府建设成效测度与评价。
数字政府建设积累了大量案例,可以针对数字政府建设的典型领域开展个案分析和比较案例研究。可以选取有代表性的辖区、部门和政策领域,对数字政府建设成效测度与评价开展个案分析和比较案例研究。通过个案分析特别是过程追踪,可以深入挖掘数字政府建设成效测度与评价的具体过程和内在逻辑。基于理论模型选取多个典型案例,通过比较案例研究可以识别数字政府建设成效测度与评价的作用机制和路径。与此同时,还可以使用定性比较分析(QCA),识别不同测度模型与评价模式对数字政府建设带来的影响。
通过问卷调查,可以揭示不同利益相关者对数字政府建设成效测度与评价的感知情况及其驱动因素。可以面向有关部门开展抽样问卷调查,测量相关关键变量,并为统计分析提供基础数据。与此同时,还可以面向群众和企业进行抽样问卷调查,识别其特征和属性对数字政府建设成效测度与评价的影响。调查问卷的核心部分需要专门开发,而其他变量则可以借鉴已有的成熟量表并进行修订和完善。此外,还可以使用中国综合社会调查、中国社会状况调查、中国家庭追踪调查、中国私营企业调查等大型社会调查数据。
使用情景实验、实地实验、准实验和自然实验等实验研究方法,可以对数字政府建设成效测度与评价进行因果推断。实验研究是揭示因果关系的不二法门,为此,可以基于网络问卷调查方法,嵌入涉及数字政府评价的不同场景,考察数字政府建设成效测度与评价的相关问题。与此同时,可以基于各地区和各部门开展的不同成效评价,构造实验组和对照组并进行实验设计,对数字政府建设产生影响的因果机制进行统计推断。此外,还可以同有关政府部门开展合作研究,共同设计不同版本的数字政府建设项目和评价界面,通过实地实验来评估数字政府建设成效的因果效应。
利用网络爬虫、机器学习、计算机辅助文本分析、主题建模(topic modelling)等大数据分析方法,可以对涉及数字政府评价的海量数据进行抓取、清理、打标签、编码和分析。群众企业会通过社会化媒体、政府网站、政务客户端、“好差评”系统等表达其对数字政府建设成效的感知和评价,这为我们研究数字政府建设成效测度与评价提供了“富矿”。可以利用最新发展的大数据分析方法,对这些海量数据进行挖掘、分析和利用。
基于各种研究方法获取的量化数据,可以通过相关分析、多元回归分析、多层模型分析、结构方程模型等多元统计分析技术,定量研究数字政府建设成效测度与评价的特征、机制与路径,并检验本文提出的理论假设。特别是数字政府建设会对辖区内的政府部门、居民与企业产生不同影响,能够正常的使用多层模型分析方法,将宏观与微观相结合,更加精准识别和估计数字政府建设成效。与此同时,能够正常的使用双重差分法、倾向值匹配法、合成控制法、工具变量法等准实验研究设计和定量分析方法,对相关变量之间的关系进行因果推断。
最后,还能够正常的使用系统综述(systematic review)与荟萃分析(meta-analysis)等定量文献计量与研究综述方法,对数字政府建设成效测度与评价的文献进行总结与批判。具体来说,可通过 CiteSpace、ASReview 等文献计量工具,全面检索、系统编码与深度分析同本文紧密相关的研究文献,提炼具有总结性的研究结论,并为未来研究指明方向。
本文围绕数字政府建设成效测度与评价,回顾与总结了已有相关研究文献。总体来说,当前文献针对这一问题开展了大量研究,但还有必要进一步深化和拓展。基于上述讨论,本文认为如下方面值得未来研究予以重视。
首先,要想对数字政府建设成效进行测度与评价,至关重要的是应厘清数字政府建设成效的形成机理,探究数字政府建设成效是如何逐步形成的。机理也称机制,数字政府建设成效的形成机理指数字政府建设的构成要素与组成部分之间相互作用并产生结果和影响的过程和方式。数字政府建设成效是如何形成的?经历了哪些环节并有哪些关键“靶点”?只有对数字政府建设成效的形成机理进行深入分析,提炼数字政府建设成效形成机理理论,进而识别数字政府建设成效的结构与维度,才能提出对其进行测度与评价的方法。
其次,未来有必要研究数字政府建设成效不彰的“中梗阻”,探究哪些因素在什么条件下和通过何种机制使数字政府建设无法达到预期成效,甚至适得其反,导致政府治理效能、人民生活品质和企业发展质量的下降。TOE 理论框架认为,环境、组织与技术三者共同影响数字政府建设成效,需要对它们分别进行分析,并结合在一起加以探究。技术执行理论强调客观技术需要被执行,才能发挥预期作用,而这往往受制于环境、制度、组织与技术的多重耦合关系。此外,政策执行理论指出,要从数字政府建设相关的政策是如何具体执行的,来探究执行偏差或“中梗阻”是如何发生的。与此同时,数字领导力理论认为数字政府建设成效不彰同政府部门缺乏数字领导力有关。总之,综合上述理论框架来研究数字政府建设成效不彰的关键诱因与发生机制,有助于为测度与评价数字政府建设成效提供理论依据。
再次,未来研究应聚焦数字政府建设成效测度与评价的典型领域,实证分析其具体过程和机制。特别是能够正常的使用实地调研、问卷调查、案例研究和实验研究等研究方法,提炼和解释统计分析结果,并形成相互支持的证据链条,从而发现数字政府建设成效测度与评价的概念、路径和条件。未来研究应创新实证研究策略,全面系统地对数字政府建设成效测度与评价进行研究,揭示数字政府建设成效测度与评价的规律性认识,而这对该领域而言有丰富的方法论意涵。这有利于更深入地理解数字政府建设成效测度与评价的前因后果,并为提炼更具一般性和解释力的理论框架、测度模型和评估模式提供条件。