范如国:公共管理的大数据与社会计算方法论革命

当前,中国社会正处在经济转型、社会转轨、心态转换的重要时期,一方面公共管理面临诸多新问题、新契机,越来越复杂,另一方面,现有公共管理的研究方法越来越力不从心,公共治理失灵处处存在。随着信息时代的来临,大数据、互联网、智能化开始成为社会运转的基本方式,公共管理进入“数据事实”时代,大数据开始深度改变社会结构以及人的生活形态、思维模式和行为方式,并被逐渐运用到公共管理研究和实践过程中来,成为公共管理无法回避的思维和方法论选择,运用大数据思维成为公共管理研究的新转向。大数据为公共管理提供了海量规模和高品质的数据信息,利用数据挖掘,公共管理能够系统观察、把握社会的复杂性行为,避免统计数据下的主观臆断和扭曲,有效提高公共管理的客观性、针对性、系统性和科学性。在社会实现大数据、量子化的今天,公共管理需要站在可能产生重大理论成果的前沿,敏锐地实现研究对象、研究方法、研究环境创新,加强学科能力建设,推动公共管理学科理论与实践的发展。

一、公共管理研究的统计数据困境

数据是公共管理的基础,今天公共管理已进入大数据分析时代,用大数据思维和方法推动政府公共决策与服务水平的整体提升是当前公共管理研究的重要内容。随着公共管理问题的日益复杂化,基于统计数据应对低复杂性和低不确定性的研究方法遭遇“处处失灵”的困境,公共管理研究需要引进新的研究工具和方法,实现方法论创新。

(一)公共管理的复杂性及其“多学科融合集成化”要求

1.公共管理的复杂性及其方法论选择。有学者认为公共管理的研究对象是人、社会及其活动,人及社会具有主观性、意识性和能动性,应强调质性研究和规范性研究,反对实证研究,这决定了公共管理不可能也不应该成为科学。也有学者认为管理讲究科学化,倡导定量研究和实证分析,强调用科学的方法和程序来研究社会存在和发展的规律。应该说,对于工业化时代低复杂性和低不确定性公共事务与公共问题而言,这种争论有一定价值,但对于具有高复杂性和高不确定性的信息化、智能化时代的公共问题,这种争论就毫无价值,单一的质性分析或定量研究都是工业化时代的研究思维。从哲学和数学的角度来讲,质性分析和定量研究是方法论的对偶“二相”,没有定量支持的质性研究是空洞的,而没有质性指导的定量研究又是盲目的。

公共管理涉及政府、公众、社会以及技术等各个层面,与一般管理一样,公共管理既是一门科学也是一门艺术,是科学性与艺术性的结合。科学性强调研究的内在规律及科学的研究方法,艺术性则强调问题的异质性、过程的社会工程性和方法的适应性。如果没有现代公共管理理念、原则和价值标准,那么方法层面的现代化将没有意义;反之,没有现代化的公共管理研究工具和方法,再好的公共管理理念也只能流于形式。

随着“创造性破坏”、“颠覆性创新”信息技术的出现,人类快速进入大数据、互联网和人工智能时代,人类社会由工业化社会快速地成为一个具有高度复杂性的“陌生社会”,公共秩序由确定性秩序转变为混沌性秩序,整个社会开始运行在由社交媒体、互联网构成的虚拟社会里,社会呈现出数据化、虚拟化、智能化特征, 面临许多新的、重大而又复杂的公共问题,如环境治理、人工智能、网络犯罪、恐怖活动等,而且网络社会里的行为映射到现实社会之中,影响现实社会的运行和治理,甚至重塑现实社会的结构,“大”而“杂”的数据经过挖掘后,变成相关性强、价值陡增的宝藏,大数据安全成为国家安全和公共安全管理新的重要内容。

对于这些复杂公共问题,工业化时代的思维和工具方法越来越力不从心,复杂性本身便是对公共管理最直接的挑战,单一学科的研究已变得不再适应,有效性显著降低,经常出现理论研究和实践行为的双重“失灵”,公共管理迫切需要发展新的研究方法。

现有的公共管理研究主要以哲学、政治学、社会学、逻辑学等为理论基础,讲究哲学分析、逻辑分析、历史分析等,这些研究方法更多的是一种人文主义方法论,强调“定性”分析(“质性”分析),通过研究者的经验和直觉,以及公共事务过去的轨迹和现在的状态,对公共事务的性质、特征、规律等作出界定和判断。

与人文主义方法论相对的是实证主义方法论,强调对公共管理的定量研究,主要通过抽样调查获取统计样本,在样本数据的基础上,运用假设、变量、检验等方法对具体问题进行量化分析,了解问题的性质,或者问题各影响因素之间的关系,研究中注重规范化与系统性,是对定性研究的深化,以及对公共问题认识的精确化。借助定量研究,公共管理学科得到新的发展,研究领域不断拓展,理论分析不断深化,显著提升了研究的科学化水平。

定性或质性分析的基础是人的“完全理性”假设,但现实的人只具有有限理性,其行为受到个人偏好、心理、价值观等主观因素的影响,这使得定性分析具有较大的主观性和多义性,可验证性与可描述性差,处理复杂问题的能力和科学决策能力也非常有限。此外,公共管理决策受到资源、时空、信息和方法等条件的限制,决策目标常常是多元的,具有模糊性和相对性,有时甚至是相互冲突的,这种复杂决策情境也是有限理性下的定性分析无法应对的。

定量研究是弥补定性分析不足的有效措施。不过,定量研究主要关注典型问题,追求科学主义程式,注重问题的细节,缺乏全景式关怀与整体性、跨越性认识,对于结构复杂、关系复杂、影响变量众多的公共问题,采用高度抽象、简化的办法容易掉入还原论的陷阱,研究的客观性、准确性也难以保证。同时,定量研究受研究者主观性影响也较大,研究所得的结论是基于假设条件,如果研究前提失真,那么就可能导致错误性结论,不能客观反映公共问题的真实场景。此外,定量研究还存在数据的测不准性、变量缺失及变量可控性等问题,也缺乏对公共问题深度的“价值分析”,价值理性薄弱,工具理性显著。比如新公共管理以“理性经济人”为逻辑起点,强调公共管理的经济性与效率性,却对公共管理的根本属性“公共性”缺乏价值分析,是典型的实证主义定量研究方法。

2.公共管理需要“多学科融合集成化”研究。公共管理学既属于管理学科的范畴,又是政治学、社会学、经济学、统计学、哲学、法学等学科研究和关注的领域。公共管理所要面对和解决的问题常常是复杂、多元的,所研究公共问题的视角、方法和工具也应该是多元化的。问题的复杂性、多元性及学科特点决定了公共管理研究需要进行多学科融合集成化研究,避免单一研究工具和理论视角带来的研究局限。

现有公共管理研究的思路,更多地还停留在工业化社会的习惯上,缺乏对工业化社会和信息化社会公共管理差异性的反省。在信息化社会里,公共问题的高度复杂性、因果关系的多样性、社会过程的非线性、以及主体行为的异质性等特征要求采用多元化的研究方法,积极地吸收数据科学、信息科学等“新科学”的知识,进行多学科融合集成化分析,全面准确地揭示复杂问题之间的因果关系和相关关系,才可能有针对性地实施科学的公共管理政策,提供高效的公共服务。

所谓公共管理的“多学科融合集成化研究”是指从公共管理、社会学、管理科学、经济学、计算机科学、数据科学、行为科学以及物理、数学、复杂科学等不同学科出发,综合运用多学科的理论和工具,通过将跨学科专家群体、大数据、计算机技术三者有机结合起来,综合解决复杂公共问题方案与预防公共问题发生的研究方法。“多学科融合集成化研究”吸收了钱学森“综合集成研讨厅”的思想,它既是公共管理发展的内在要求,又是解决复杂公共管理问题的客观需要,也是提升公共管理自主性与开放性的必然选择。大数据分析不拘泥于定性与定量的分析,从信息化社会思维出发,为研究复杂公共管理问题提供了一种超越定性和量化研究的、多学科融合集成化的研究方法。

(二)统计数据下公共管理研究的困境

公共管理作为一门管理学科,离不开数据的支撑。作为一个复杂系统,现代公共管理对于其中的公共事物和问题,需要首先去认识它,然后量化它,数据就是帮助人们刻化复杂公共问题、评价公共管理效果、找到正确应对措施、做好公共管理创新的基础性保证,拥有关于公共问题的各类信息数据,才可能产生解决问题的真知灼见、创新性思路。

在工业化社会里,公共问题表现为低度复杂性和低度不确定性,可以通过诸如经验分析、逻辑分析、统计与计量分析等方法,从个体的、规模有限且不连续的结构化数据与论据中,去寻求普遍的、一般性公共管理规律并实现有效的公共治理。由于数据有限,且数据获取成本昂贵,公共管理更多地依赖个人经验、直觉以及统计数据进行分析。统计数据分析的一般过程是:发现公共问题及选择研究的具体问题、选择理论方法及设计研究方案、确定研究方法并对研究问题进行抽象简化、给出条件假说、搜集样本数据并进行参数估计、对假设进行检验及理论进行修正、得到具有可信度的满意结果实现理论升华、对公共问题进行有效预测与决策。

上述研究过程主要是通过对公共事物、公共问题的“稳定”状态进行总体抽样、统计调查获得数据,并基于统计分析、计量分析、优化分析,以及定性分析等方法对公共问题进行定性与定量研究,获得关于公共问题的“因果”关系,样本数据具有统计、空间、时间等“结构性”特征。

统计数据下的研究方法主要考虑的是具有完全理性、同质性的社会主体,在方法论上存在许多不足。

第一,统计数据依赖于研究假设与研究方案的设计,即根据假设或方案来进行样本采集。采集过程会受到调查范围、采集技术、统计方法及获得成本等的限制,把一些可能对研究假设证伪的数据排除在外,用如此“简单”的数据很难揭示复杂公共问题的各种影响因素和社会演化的各种可能。

第二,受访对象对调查方案的适应性反应会影响数据的质量。比如,数据调查中,问卷设置的相关问题可能对受访对象产生某种心理暗示或倾向性,诱导受访对象在特定问题上作出适应性反应,使得调查结果受到受访对象特定“偏好”的影响。

第三,存在假设的合理性、研究者经验的局限性、认知能力的有限理性问题,即霍金提出的“金鱼缸”现象,金鱼缸的尺度决定研究者的认知模式和水平,使得研究结果存在明显的“内生性”缺陷和诠释与预测能力的不足。

第四,由于“测不准性”的存在,样本数据存在规模上的有限性、内涵上的片面性、结构上的局部性等问题,数据的误差会导致结果的不科学性、理论结论的偏差性,进而误导公共问题的决策。

第五,基于样本数据的模型系数显著性检验,反映的只是变量在统计上的关联性,可能并不一定是真正意义上的因果性。

第六,研究对问题进行抽象简化,是一个化非线性为线性、人为降低问题复杂性的过程。那些被认为不重要、舍弃掉的因素,在某些条件下,可能会产生严重的后果,引发巨大的“蝴蝶效应”。

为了减少公共管理研究中的不确定性,降低各种问题的复杂性,提炼出公共管理的新问题、新趋势,有效的办法是扩大样本的规模和类型,获取包含公共问题完全信息的大数据,控制研究误差,做出科学的预测与决策,于是大数据、大样本就自然而然地成为公共管理分析的选择,统计数据分析被大数据挖掘和社会计算所取代,这不仅是公共管理在测度方式、研究方法上的变化,也是公共管理思维与行为方式的深刻变革,以及研究范式的巨大转换。

现有公共管理研究从本质上讲都是统计数据思维,追求数据的精准性,强调对事物因果关系的把握。而在大数据时代,对复杂性问题的定量分析不再只是样本数据,而是全场景数据,在理论、工具和方法等方面给研究以全新的视角。随着公共问题复杂性的显著增强,对问题特征的精确性和因果性关注将相对降低,相关性分析则显著上升,需要转向多学科集成化研究,寻求大数据的答疑解惑。

二、公共管理的大数据思维

(一)大数据及其本质

大数据作为信息社会的产物,由托夫勒在《第三次浪潮》中首先提出,但目前还没有统一的定义。一般认为,大数据是指信息量规模巨大、类别多样,采用传统的数据处理工具和方法,无法实现抓取、存储、分类、计算和分享等活动,经过处理后才能具有更强的决策力、洞察力和流程优化能力的各类信息集合。大数据具有海量规模、实时性强、结构复杂、价值密度低,以及真实性等特征。其中,海量规模和复杂结构是对大数据规模与类型的界定,而时效性与价值性是对大数据获取、分析及处理的速度要求和研究目的的描述。

大数据内涵非常丰富,既包括传统的“结构化”数据,也包括像图片、视频等“非结构化”数据,不仅数据规模巨大,而且种类繁多而复杂,呈现出“大”、“杂”和“关联性”特征。所谓“大”是指能够捕捉到的数据越来越多,规模越来越大;“杂”是指数据在没有进行系统分析前,呈现出毫无规律的混乱性,在结构上表现为“非结构性”数据;“关联性”是说数据之间存在着联系和相关性。这告诉我们,能够进行数据深度发掘与“关联性”构建的数据才能称为大数据。

实践证明,大数据是复杂社会系统进行价值挖掘与行为预决策分析的有效技术方法,给人类的预测、决策与分析带来三个方面的转变:一是不再依赖传统的统计数据,而是所有数据。“所有数据”完整地刻画复杂系统整体,反映出的是从局部到整体的复杂性思维转变;二是不再只追求数据的精确性,而是混沌性。“混沌性”是指数据的繁杂和不精确。如果数据越“大”和“杂”,那么预测的结果可能就越准确;三是不拘泥于寻求事物之间的因果关系,而是相关关系,强调从因果关系到相关关系的转变,探寻不同数据集合之间、主体之间、组织之间、公共事务及公共问题之间的相关关系,让数据自己说话。

可见,大数据的本质是自然界与人类社会存在形态及其发展过程的数据化形式,是自然界与人类社会发展规律的数据化载体,是关于自然界与人类社会存在状态和发展水平的数据化描述,是分析自然界与人类社会存在状况和发展规律的数据化工具。

(二)大数据及其方法论价值

“大数据”本身并不具备深刻的含义,其真实价值隐藏在“杂乱”的数据之中,挖掘其中的“价值”是对大数据进行记录、处理和分析的目的与意义之所在。由于大数据分析还具有计算复杂性高、研究周期长等特点,要想发掘其中的价值,就必须借助像“云计算”这样的大数据处理技术才能实现。“云计算”是一个依托互联网将硬、软件条件按照科学计算要求连接起来,根据算法要求动态调整结构形式,内耗最小、功效最大的虚拟资源服务集合。它像人的大脑一样,通过快速地思考运算,把数学算法运用于大数据,把从虚拟资源服务集合中得到的各种数据进行挖掘、过滤,筛选出有价值的信息,寻找相关关系并通过相关性预测问题存在与发生的可能性,做出有逻辑关系的相关性行为判断。大数据之所以能够焕发出强大的魅力,关键在于像“云计算”这样信息技术的支撑,否则,不仅不会有物理意义、逻辑意义的大数据,也不会有社会价值的大数据,云计算所具有的强大数据处理能力、快速计算能力、卓越的机器学习能力和出色的成本效益能力是统计数据分析所没有的。

作为应对社会复杂性的重要技术和方法,大数据及其应用已经成为包括公共管理在内的社会科学研究的热点,计算机科学、社会学、哲学、经济学、管理科学、政治学等都在思考和研究大数据,“大数据”也成为现代社会发展形态发生深刻变化的重要指征和线索。为此,计算机专家格雷在2007年提出,大数据是人类研究继实验分析、理论推导、数字仿真三种范式之后的“第四范式”,即“数据密集型的科学发现”。当然,第四范式并不是要用大数据代替前面三种范式,而是将他们与数据统一起来,协同对自然与社会问题展开分析。作为一种基础设施、一项基础性制度、一种战略性资源和一种复杂性技术,大数据所焕发出来的变革力量也正在改变公共管理的思维和模式,对公共管理研究产生着深刻的影响。

(三)公共管理研究的大数据转向

复杂性理论表明,即使在确定的系统中依据简单的规则也可以产生复杂且不可预测性的行为。随着公共管理问题的日益复杂化,以及大数据对公共管理研究的重塑,公共管理研究需要转变思维范式,采用突破性的技术和方法,这就是“多学科融合集成化”研究中的大数据思维。公共管理的复杂性成为方法论创新及研究转向的根本诱因和内在要求。

传统意义上讲,包括公共管理在内的许多社会科学如社会学、教育学、哲学、文学等大多只是定性或半定量分析的科学,随着大数据、云计算的出现,这些学科在研究方法上出现了显著的转向,这就是运用大数据思维、社会计算、复杂网络分析等研究方法。恩格斯说:“每一个时代的理论思维,包括我们这个时代的理论思维都是一种历史的产物,它在不同的时代具有完全不同的形式,同时具有完全不同的内容。”今天,我们处于一个科学技术迅猛发展的信息化时代,面对越来越多由众多独立因素叠加在一起而产生的复杂公共管理问题,无法进行有效的因果分析,但可以进行多方面关联性分析,这要求我们要习惯用相关性来考虑和分析问题。大数据强调全体数据、混沌性数据以及数据的相关关系,很好地适应了复杂公共管理的关联性、非线性、多样性和涌现性等特征和解析要求,给公共管理带来了从行为到思维的根本性变化。

大数据不等于大数据思维。大数据思维是一种开放性思维,强调数据来源的多源性,不考虑数据的杂乱;也是一种复杂性思维,充分关注对复杂性问题的分析,不刻意追求因果关系,注重相关性,强调不能仅仅凭几个有限因素来进行决策,不要求数据的精准性,但重视其代表性和完整性,相关性揭示的正是复杂性;还是一种价值思维,注重挖掘数据背后隐藏的各类巨大的价值。大数据所具有的数据获取、挖掘、相关性分析和预测能力,使得公共管理能够获取多源性、多形态的信息,促使公共管理从封闭性模式走向开放性模式;从科层制结构转向网络化结构;从经验式管理转变为依靠大数据的精细化管理;从被动的“后觉后知”决策管理、验证性分析转向基于大数据的前瞻性预决策优化管理。人类理性无法理解的许多复杂公共问题,大数据可以用精确的数据语言、缜密的算法去阐释和刻画,帮助解读出其中的内涵,把握复杂公共问题背后的真相和规律;一切难以把握的不确定性因素,大数据可以通过数据挖掘和算法分析,给出相对精准的预测,发现社会主体意识、公共活动过程、公共治理等方面的诸多新含义、新洞见,实现预测性管理;对于人们直觉上的盲区,大数据也可以弥补其对事实的偏离,以科学化、数字化的方法有效地展开公共管理。

随着大数据广泛渗透到各种公共问题的实践之中,大数据所蕴含的数据思维和方法为公共管理理念及研究方法的转向提供了技术可行性和现实的社会基础,成为提升公共管理能力和公共服务水平的重要保证。运用大数据思维来预测公共需求和公共意愿、研判公共问题特点、探求公共管理新的方法论特征,已成为公共管理研究和实践发展无法回避的客观选择。大数据思维是从复杂关系中发现本质规律极为有效的工具,给复杂公共管理研究带来了重塑。比如,大数据在社会方面的运用促进了社会形态的变化,使得社会阶层流动起来,改变了社会生活的基本准则和社会公众的行为规范,形成新的社会性格,并成为社会演化的新动力;大数据在政治方面的运用改变了传统的政治生态,促进了网络政治、网络民主的快速发展,并导致现实政治的变革与转型,任何有关“公共问题”的大数据传播,都可能引发措手不及的公共事件。因此,现代公共管理需要系统转向大数据思维,“用数据说话、用数据决策、用数据管理、用数据创新”应成为公共管理大数据转向的核心。尤其是“多学科融合集成化研究”在公共管理中的应用,将使公共管理研究的科学化、定量化产生巨大的飞跃,促进实现公共服务的精细化、公共管理的智慧化(如下图)。

三、大数据的复杂性特征与复杂公共管理

社会是一个复杂系统,作为记录社会行为轨迹的大数据同样也是一个复杂系统。

(一)大数据的复杂性特征及其价值

复杂性研究是当前自然科学与社会科学发展重要的前沿研究领域。“复杂”由“复”与“杂”结合而成。“复”既意指多层、复合、重叠,也包括通过层层嵌套形成具有自相似精细结构之意,部分与整体表现出结构、功能、尺度上的相似性;“杂”则是指破碎、杂乱、多样、无序。“杂”具有很大的价值,正因为多种多样的“杂”才形成了多姿多彩的“复杂”,无“复”不以成为复杂事物,单纯的“杂”没有任何价值,只有“复”且“杂”才是真正意义上的复杂性,通过层层嵌套的“复”把混乱的“杂”有机地结合起来,形成局部与整体的自相似性结构才是完全的复杂性。不过在重复叠代过程中不时会有随机因素加入,可能导致部分与整体之间自相似性的“破缺”。

从关于复杂性特点的分析中,我们可以看出,大数据也是一个复杂系统。首先,大数据呈现出的“大”、“杂”和“关联性”特征,是复杂性“复”、“杂”内涵的体现,数据挖掘的目的也在于揭示隐藏在“杂”后面的价值;其次,大数据表现出复杂的多层网络结构。大数据通过获取、清洗、聚集、分析等层层嵌套的“复”,把“杂”而破碎的数据有机地关联起来,形成具有不同意义关系和关联价值的多层复杂网络中局部数据与整体数据意义上的自相似结构。

社会是一个多层复杂网络,公共管理大数据就是复杂社会网络中数据存在的结构形式,每个数据成为显示社会主体作为网络节点在网络上行为的痕迹,公共管理活动是在多层复杂社会网络上展开的过程,大数据是对这些复杂过程的记录及进行科学管理的形式,其核心是数据的空间组织结构。从各种复杂过程采集的大数据反映的是一个个孤立的关系,但连接起来就是一个揭示相互关系的网络,展示出时间、空间和关系复杂性。通过把基于公共行为、公共过程的大数据转换成面向公共管理的多层复杂网络决策数据,揭示数据资源蕴含的复杂公共事务、公共问题结构,不断修正并优化已有的模型,给出关于公共问题精确的描述,不断接近问题的本原,提高公共管理的水平。此外,数据是分布在多层复杂公共网络节点上的物质,如同物理空间里事物的构成元素一样,数据之间的关联关系由复杂网络中节点所处的位置决定,大数据所具有的海量规模、实时性、结构复杂等特征也正是公共网络复杂性特征的很好描述。而且,公共管理大数据的处理和应用也是一个极为复杂的过程,大数据的获取、清洗、存储、计算等活动,需要借助计算机建模、算法、仿真去完成,计算复杂度激增。

大数据的复杂性特征使得大数据可以有效地降低公共管理的复杂性和不确定性,满足公共管理应对复杂性挑战的要求。大数据通过实现对社会存在和演化过程中海量、异质性、多样态数据的记录和处理,适时获取高价值信息,揭示出事物的特征及其内在的各种耦合关系,展示问题或事物的全貌,有效地降低问题的复杂性和研究的不确定性。

通过把复杂公共管理大数据转化为多层复杂网络空间中局部数据与整体数据的层层自相似结构,这种局部数据类似于样本数据,代表的是一个个具有自相似性的基础性公共问题,可以运用基于样本数据的结构简单数学模型,对基础性公共问题进行研究,再依据自相似原理由基础性问题迭代生成整个复杂公共问题,把复杂公共问题转化为一个可计算的自相似系统,通过大数据的相关算法进行准确描述,把公共问题研究的模糊性、不确定性转化为精确、确定的可计算模型。

(二)基于大数据思维的复杂公共管理预测分析

现代社会的复杂性决定了公共管理的复杂性要求,而信息社会的到来又进一步加大了公共管理的复杂性。公共管理分析要在混沌的现象中找出相对明确的关系和秩序,让公共行为建立在清晰、稳定的基础之上,发现“混沌中的秩序”是公共管理的目的之所在。现实中普遍存在的“治理失灵”说明需要优化现有的公共管理方式,重视发挥数据的作用,用大数据方法引领公共管理,以复杂性科学方法和大数据思维指导现代公共治理,实施复杂公共管理,有效应对公共管理问题的复杂性。

复杂公共管理是以复杂性科学视角对大数据背景下公共管理进行系统性、创新性审视及所展开的理论研究和实践活动。比如,如何提升社会舆情的识别能力,预测社会舆情可能引发的社会舆情事件,及时采取预警行动是公共管理的重要内容。通过将大数据分析与公共舆情监测、预警与治理决策结合起来,依据海量语言数据通过复杂挖掘和聚合分析,从公共舆情的虚拟数字场景中把握互联网舆情的特征,判断公众的舆论倾向,现实社会舆情的治理。

在实践中,大数据为应对社会中的复杂公共问题,特别是复杂公共治理工程学范型的实施提供了很好的契机,借助大数据,充分利用计算机仿真、数字世界、云计算等技术组成的人机综合集成研究厅系统,将各种碎片化的数据聚合起来,把各类主体的意见集合起来,将定性和定量集成起来,揭示许多超越经验和常识的联系与规律,发现新的政治关系与社会关系、新的价值观念和社会准则、新的公共问题和公共服务要求,增加预见的可靠性,形成解决复杂公共问题新的、优化的方案。

此外,大数据的核心是其预测能力,公共管理决策需要前瞻性地做好预测工作,预测的前提是对复杂社会系统的本质、行为和规律要有全面、准确的把握,这也需要海量数据作支撑。大数据预测以全数据为基础,在“杂乱无章”的数据中寻找相关关系,以较快的速度实现对公共问题的实时分析和响应,科学制定公共管理政策,帮助规避公共决策的不确定性和决策结果的可能风险。

显然,大数据思维正在深刻影响和改变公共管理的研究方法,大数据技术和思维在推动公共管理数据的互联互通、提升公共管理的预测与决策能力、优化公共服务水平,进而实现公共管理的民主化、科学化、智慧化、高效化等目标方面具有其他技术不可替代的价值。

(三)大数据下复杂公共管理的非结构化决策

大数据对公共管理的价值不只是来自大数据本身,而且还在于它能够进行公共管理的决策,通过对决策的结果进行可视化呈现,帮助公共决策部门对决策方案进行优化和有针对性的改进。此外,它还能够把公共管理中大量只能进行定性或半定量分析的领域变成了可以进行完全定量分析,实现定量与定性研究的互相融合,让公共管理决策从琐碎的信息和统计数据中脱身出来,而且除了传统的结构化决策外,还可以优化半结构化、非结构化决策,显著提高了公共管理的决策分析能力。所谓半结构化决策是指决策中所使用的数据具有某些不确定性或不完整性,虽有一定的决策准则,但决策准则因人而异,可以通过适当的算法产生决策方案得到较优的解,但无法从中得到最优解的决策过程;非结构化决策是指决策过程较为复杂,决策过程和决策方法无规律可遵循,没有确定的决策规则和模型可依据,而且决策者的主观行为、偏好和风格对决策效果影响巨大的决策过程。

在传统决策模型里,数据都是样本数据、面板数据、时间序列数据这样的结构化数据,而把像图片、视频、文本这样的非结构化数据排除在外。然而在公共管理中,存在着大量像幸福、正义、伦理这些无法进行精确测量的非结构化问题,对它们的研究存在着“模型化”和“数量化”的巨大困难。在大数据思维下,可以通过把非结构化问题转化成非结构性数据,把问题表述成可以有效地进行数据处理的形式,借助数据重组技术,依据算法构建非结构性数据的相关关系并挖掘其中的价值,把分散的数据整合起来,使之成为有内在相关性的大数据,深度揭示这些难以处理的非结构化决策问题,有效降低公共管理问题的复杂性和不确定性。

四、复杂公共管理的社会计算思维

现代社会是一个多层级、关联、动态、耗散的复杂系统,呈现出“处处可联网,事事可计算”的网络化、可计算复杂性特征,从“可计算的社会”迈向“社会的数字化”进而“数字的社会化”。

(一)社会是一个可计算的复杂系统

在由数据构成的复杂社会中,海量数据为各种社会行为、社会内容的社会计算、定性定量结合分析提供了坚实的基础,使得人类社会成为一个可计算的复杂社会。复杂社会中的公共管理问题需要计算机、人工智能以及物理、数学、复杂科学等领域的知识和方法的跨学科集成化研究,其中社会计算作为一种数据密集型科学,是和大数据思维密切相关、应对复杂公共管理问题必不可少的分析方法和手段。其作为社会科学、数据科学与管理科学融合的交叉学科能够有效解决传统的假设、模型、检验研究方法在复杂公共管理及大数据面前变得过时的困境,转向以数据说话。

在现实中,解决公共管理复杂性最直接、最有效的方法就是进行社会实验。然而,由于受到资源、伦理、道德、心理、成本及风险等的限制,社会实验无法成为公共管理可行的研究方法,在计算思维面前这些制约都会迎刃而解。

所谓计算思维是指运用计算机科学理论,通过对问题进行不同层级的抽象,运用算法去理解人类社会行为,设计人工系统,求解复杂问题,并用数学模型和方法形成可靠的社会问题解决方案的一种思维方法,计算思维既能把记录现实社会活动的海量数据抽象成代码又能把揭示社会规律与行为特征的人工社会代码转换成描述现实社会活动的巨大数据,是一种采用抽象和自动计算来控制复杂任务或进行复杂社会系统设计的方法,也是复杂社会形态中人们观察问题、分析问题、解决问题的一种普遍认识和一类普适性技能。

计算思维的关键是对问题的“抽象”以及“抽象”计算的“自动”实现。即什么能被有效地抽象并被有效地自动计算,“自动”是对“抽象”的解释和执行。数据是“抽象”的基础,计算思维中的抽象需要得到计算机的自动执行,自动执行的基础在于准确的抽象、严格的建模,以及计算机可以“听得懂”的算法语言。

公共管理研究离不开抽象,也需要应用计算思维方法去分析和解决复杂公共管理问题,利用计算思维来研究人类社会的行为及其管理,称为社会计算。社会计算是大数据分析的关键技术,是现代计算技术与社会科学之间的交叉学科。它把复杂社会系统中的社会活动、社会过程、微观主体作为计算单元,借助现代信息技术、计算机算法让多主体之间交流互动,通过抽象与符号化,对社会活动与行为,如人的心理过程与偏好行为、组织的基本结构与功能、公共管理政策及其实施机制等进行数学建模,“自下而上”地生成一个虚拟的人工社会模型,以此为基础开展各种社会图景设置与动态演化的仿真实验,利用人工系统“涌现”出的实验结果揭示现实宏观社会的各种规律,解释社会现象,对社会演化进行预测,获得对公共问题宽阔而可靠的认识,较好地解决传统公共管理研究方法所面临的微观与宏观之间的分离。社会计算使社会科学家也可以像自然科学家那样,以大规模可重复实验的方式来研究复杂社会问题,从中理解人类公共行为的规律和特征。利用社会计算,并与公共管理研究中的统计数据分析方法融合起来,很好地研究公共问题的复杂性结构、公共政策的作用机制、利益博弈的演化过程等内容,实现公共管理“问题导向”与“多学科融合集成化研究”的要求。

在信息化条件下,人类社会转变成一个由现实数据构成的世界,复杂公共管理面对的一切问题、行为、关系、过程和结果都以数据的形式录存起来,然后被处理,此时,社会及人与社会的关系也成为由各种数据描绘的总和,这并不是对马克思辩证唯物主义关于人与社会关系哲学思想的违背,相反,是在信息技术环境下的继承和发展。借助这些数据,并通过社会计算,我们不仅可以研究“实在”的公共社会,而且还能够研究“愿景”中的公共社会。在公共管理中,社会计算根据公共管理的目标去设计虚拟人工社会系统,利用这一系统对公共管理行为反复进行社会实验,虚拟公共社会是对现实公共社会的映射,与现实社会平行,最大程度地反映公共社会现实、描述公共社会特征。

(二)大数据思维下“社会的数字化”与“数字的社会化”

用数字表达思想、行为和物品是信息社会的普遍现象,大数据成为社会存在状态的数字化描述,即“社会的数字化”。大数据分析以计算机、各种信息设备为载体,通过社会计算把公共治理中各类主体的经验、智慧和谋划以及现实活动中人与公共行为产生的“全息”数据聚集起来,建立起一个反映人与社会不同行为、不同结构、不同关系,与现实公共社会相对应的数字社会,亦即人工公共社会,形成现实公共社会的虚像——— “虚拟公共社会”,公共社会转变为复杂的数字化结构,即“社会的数字化”,形成现代公共社会的现实和虚拟“二相”结构,人工公共社会的活动会映射、影响、指导现实社会的公共治理活动。借助“社会的数字化”和社会计算,依托社会实验方法,对各种公共管理政策、方式进行重复验证、模拟,再把社会计算结果与现实社会进行对比、平行执行,逐步逼近社会现实,得到关于现实公共管理问题的优化方法,为现实公共管理提供支撑,实现“数字的社会化”。

对数字化后的公共社会运用数据挖掘、深度学习、人工智能等多种技术手段,按照研究目的进行分析,对各种公共管理政策、治理方式进行重复演化、模拟,优化公共决策和公共管理流程,发现瓶颈和短板,从定量分析中给出关于现实公共问题的定性分析,对各项社会计算结果与现实公共社会进行对比、平行执行,逐步逼近社会现实,还原社会,即“数字的社会化”,帮助人们解决现实社会所面临的各种复杂公共管理问题,塑造新的社会结构、关系、秩序和形态,得到关于现实公共管理的创新性思路,实现社会的智慧化治理,提高公共管理的效率和水平。

“社会的数字化”与“数字的社会化”相互作用,彼此动态印证,使数据不再只是对现实公共社会的机械性虚拟和映射,而是与现实社会融为一体反映社会系统的虚实“二相”复杂关系。在大数据环境下,“数字化社会”作为人工社会能最大程度地逼近现实公共社会,人们借助数字世界,将自己“投射”到虚拟社会之中,通过大数据工具对数据进行实时动态监测、相关性测度和全场景式的分析,借助社会计算了解复杂现实公共社会内部各要素、各种公共现象之间的复杂关联关系,观察人类社会从宗教、文化、信仰,到资源、经济、环境、政治等各种公共活动和社会现象的交互作用,揭示其本来面目,从微观行为数据分析中发现社会结构和行为规律并展示规律,设计、思考解决复杂公共问题的方案和策略。

显然,社会计算是实现“社会的数字化”与“数字的社会化”的主要思维方式,在社会计算作用下,实现“人工”影响“现实”、“虚拟”影响“实在”、“现在”影响“将来”的巨大转换。可以说,没有社会计算根本无法有效地解析现实公共社会的复杂公共问题并有效地预测未来。基于复杂性科学、大数据和社会计算思维的复杂公共管理,使得公共管理具有从科学理论到科学技术的完整程式。

(三)公共管理大数据分析的“精神世界”在场

虽然“数字化社会”本质上是对客观世界的映射,是对现实公共社会最大程度的逼近,但二者存在“精神世界”的作用。依据波普尔的“三个世界”理论,世界可分为客观世界、精神世界和人工世界,客观世界与人工世界之间隔着精神世界,但三者一体,虚实互映,彼此存在平衡与转换。从现实社会的公共问题到“数字化社会”的公共问题,再从“数字化社会”真实地回到现实公共问题中来,揭示现实社会公共问题的特征和规律是社会计算需要解决的核心问题,由此也引出一个重要的课题,那就是公共管理大数据分析需要“精神世界”分析或者理论分析在场。

人类在认识社会发展规律的过程中一直都在试图回答“表象”和“现象”是否一致的哲学问题,即我们看到的表象和现象是否是表象和现象之间的真实关系。对于公共问题而言,大数据是公共过程发生后的“表象”,具有鲜明的社会属性,即公共管理大数据,对其分析需要“精神世界”的在场。公共管理大数据不是公共问题本身,即使能够获得关于公共问题完整的大数据,也无法在不进行逻辑分析、价值分析、因果分析的情况下实现对公共问题的真实回应以及揭示公共问题的本质特征。数据本身不会“说话”,多样态的公共大数据需要经过计算科学、统计学、社会学、政治学、哲学和心理学等理论指导下的爬取、挖掘、分析等处理之后才能“说话”,展示出数据表象中隐藏的真实公共价值和社会属性,其中,“精神世界”分析在于对蕴含在数据之中的公共问题本质属性和变化规律进行质性分析和价值探寻。

公共管理大数据分析的每一个阶段都离不开“精神世界”分析的在场。在数据爬取与清洗阶段,需要运用深度学习、机器学习等技术下的数据抽取、归类、聚合、结构化,实现数据形态从大而杂向结构化、逻辑化数据转变,此时,计算机科学、人工智能承担着主要的技术分析,但“精神世界”分析不可缺少,因为数据内容和逻辑来自对公共过程的全景纪录,要实现“数据化社会”对现实公共问题的阐释,离不开社会学、政治学、行为科学等“精神世界”领域的深刻分析。在数据挖掘与分析阶段,数据之间逻辑关系、相关关系的揭示,离不开数学方法的运用,但模型的选择、约束条件的确定、假设的给出、参数的估计与检验等,都需要“精神世界”的分析。在大数据诠释阶段,从揭示出的数据逻辑关系中提炼出本原意义上的内涵、意义和关系,诠释出更具普适性的公共关系原理,都需要“精神世界”的质性分析。

由于人是具有个性化、异质性特征的社会主体,不同的人以及由人主导的公共问题的计算基础不完全一样,因此,公共管理大数据分析还要解决好复杂公共管理同质性到异质性分析的转换,需要依靠“精神世界”分析弄清楚数据测度的公共行动发生的社会情境和话语依据,否则再完美的挖掘,再正确的数据推论,也只是研究者对所研究公共问题话语建构的产物。如果“精神世界”分析离场,一些看似“精确”的大数据研究,从一开始可能就偏离了公共问题现象本身而变得毫无价值。

同时,公共管理大数据分析还要解决好从微观中阐释宏观规律的定性研究问题,因为复杂公共管理关注的是宏观层面公共问题的特质和属性,表现为从微观到宏观的“涌现”和“突变”,这些问题的分析也都离不开“精神世界”分析的在场。

此外,大数据有助于公共决策的研判,帮助决策部门进行决策优化和有针对性的改进,但最终决策还是由决策者给出。决策者如何基于大数据分析给出科学、切合实际问题的正确的决策选择,同样需要“精神世界”的在场。

五、公共管理大数据分析效果的有限性问题

虽然大数据及其社会计算价值巨大,对公共管理研究在方法论上的影响深远,但许多问题仍有待澄清,人们对大数据及其公共管理研究的科学价值和效果还存在一些疑虑。从理论和实践两方面来看,由于大数据理论的成长性、公共问题的复杂性、大数据方法的实用性、研究中的“对称性破缺”性等原因,使得公共管理的大数据分析还存在研究价值及效果的有限性问题。

1.目前大数据的内涵、技术、方法还不成熟,在其发展的过程中还将面临多种问题和技术挑战,大数据分析中的数据高效存储、数据有效获取、数据分析、数据展示、数据安全等技术都还有待进一步发展,基于当前的大数据技术还不能完全胜任对复杂公共管理问题的分析,这使得公共管理大数据分析在效果上表现出有限性。

2.大数据运用于公共管理问题研究所采用的原理和方法具有一致性,但是具体的公共管理问题是千差万别、形态各异的,针对某个公共领域的问题所建立的有效大数据分析方法和模型,不一定适用于另一个公共领域,或者另一国家的同一个公共领域,即不存在具有普适性的大数据模型和研究方法,这导致公共管理的大数据分析在研究价值及效果上产生有限性。

3.公共管理问题的差异性使得大数据分析方法也具有实用性和针对性,同一个公共领域不同时间的同一问题,因为影响公共问题相关因素的环境发生变化也会对大数据模型产生重大作用,如果生搬硬套曾经有效的公共管理的大数据模型,分析研究的效果将会大打折扣。

4.大数据在复杂公共管理中存在“社会的数据化”与“数据的社会化”之间的“对称性破缺”问题,也影响了大数据在公共管理研究中的价值。

“对称性破缺”是一个跨物理学、生物学、社会学和系统学等学科的概念,表示具有较高对称性的系统,出现不对称因素或结构。在这里借用这一概念,表示从“社会的数据化”到“数据的社会化”的过程中出现的关于公共问题本质特征描述及认识的不一致性问题。虽然“社会的数字化”本质上是关于现实公共问题的“表象”,是对现实公共问题“现象”最大程度的刻画,二者之间本质上应该是一种“对称映射”的关系。但依据波普尔的“三个世界”理论,“数据化社会”不可能直接等同于现实公共问题,一是二者存在精神世界的认知作用和影响,存在认知能力的有限理性和不确定问题,二是大数据分析具体研究方法的选择也与研究对象的数据规模及数据形态密切相关,这中间存在关于公共问题假设的合理性、数据选择的倾向性、决策者经验上的局限性等问题,加之“金鱼缸”现象的存在,这些都可能导致“社会的数字化”对公共问题“现实”的过滤与失真,使得二者之间出现映射的“对称性破缺”。比如,人们借助数字世界,通过大数据工具对异质性公众行为、情感、心理、认知、诉求,以及社会系统中的公共活动过程等进行大数据监测、相关性测度、全场景分析,通过大数据计算把握现实公共问题之间的复杂关系,每一个社会主体在其中了解自己的社会角色和责任,思考解决公共问题的方案,但由于“精神世界”作用的存在,加之人的有限理性和世界的不确定性,这种大数据分析的结果与真实的公共问题之间可能存在偏离,使得“数字的社会化”与社会现象之间不是“一一对应”,存在“对称性破缺”可能,给公共管理带来误导。因此,如何从现实社会现象到“社会的数字化”,再从“社会的数字化”到“数字的社会化”,真实地、对称地回到社会现象中来,揭示现实社会的特征和规律,这是社会计算必须要解决的重要问题。

5.大数据之“大”、“杂”、样式多样、真伪难辨等一系列特征与问题,也导致人们对大数据本身是否存在不够真、不够全、不整齐、缺乏代表性,以及无法准确判定其中蕴含的错误和风险的质疑。所谓“不够真”是指由于数据采集技术不成熟或人为操作而产生虚假数据,使得数据并不是真实社会过程的记录;“不够全”是指大数据虽然规模巨大,但有价值的社会信息非常少,以致于难以依据其进行科学的挖掘分析;“不整齐”是指大数据过度杂乱,或者数据缺失严重,不能进行数据汇聚、挖掘分析,无法产生价值收敛;“缺乏代表性”是说大数据由于存在上述问题而失去对所研究问题的代表性。如果获取的大数据存在这些问题,以其为依据构建的数据化社会就会失真,以此挖掘出的公共问题运行规律进而寻求公共管理优化方案的努力就会遭到扭曲,大大降低大数据分析的价值。

6.公共问题大数据专注于通过把数学算法运用于公共问题分析,从中寻找问题的相关关系,通过相关性去预测问题发生的可能性,但大数据结构复杂性和意义复杂性带来了社会计算的复杂性问题,无论采用多少数据,预测都不可避免地遭遇主观价值判断,不可能是真正精确,使得大数据分析的效果有限。