大数据与公共安全：概念、维度与关系

发布时间：2017-09-27 发布者：必威浏览次数：

大数据与公共安全：概念、维度与关系

丁翔　张海波

随着《自然》和《科学》两份学术期刊相继推出专刊讨论大数据的价值，大数据分析成为一种新的科学方法和技术手段，被认为是继实验科学、理论科学和计算科学之后的“第四范式”。[1]这一范式的特点表现为：不在意数据的杂乱，而强调数据的量;不要求数据精确，但要求数据的代表性;不刻意追求因果关系，但重视规律总结。在此基础上，大数据被赋予经济、政治和社会意涵，成为“创新的前沿”，[2]体现“数字形式的主权”，[3]驱动“生活、工作和思维方式的大变革”。[4]随着大数据概念的广泛扩散，大数据与公共安全也成为多学科交叉的新兴领域。

一种激进的观点认为，大数据分析的兴起意味着“理论的终结”：规律的发现将不再依赖于理论假设，而是基于大数据的规律涌现。然而，事实并非如此：“‘理论的终结’似乎暗示着，尽管理论仍存在于像物理、化学这样的学科里，但大数据分析不需要成形的概念。这实在荒谬。”[5] 恰恰相反的是，无论是数据的收集，还是数据的分析和结果的解读，它们都需要理论，“毕竟，谷歌用检索词来预测流感而不是鞋码。”[6]正因为如此，舍恩伯格(Viktor Mayer-Sch.nberger)和库克耶(Kenneth Cukier)认为：“大数据绝不是一个理论消亡的时代，相反地，理论贯穿于大数据分析的方方面面。”[7]

大数据与公共安全也是如此。很显然，作为一项科技创新，大数据是“双刃剑”：既能促进公共安全，也能危害公共安全。那么，我们该如何理解大数据与公共安全的关系?如何从理论上提供一种整体观和逻辑一致性，趋利避害，促进大数据与公共安全的良性互动?

　一、公共安全的双重属性

在本质上，公共安全具有双重属性：一是科学属性;二是价值属性。促进大数据与公共安全的良性互动需要对公共安全的本质属性有完整的理解。

在理论上，“公共安全”是一个复合概念，由“公共”和“安全”两个概念共同构成。其中，“公共”是限定语，标明了概念的主体对象;“安全”是主词，显示了概念的主要内涵。因此，公共安全是指公众的安全。按照这种构词方式，至少还可以有“国家安全”和“个体安全”两个概念，分别指国家作为主体的安全和个体作为主体的安全。此外，还有“食品安全”“粮食安全”“职业安全”等概念，它们用以指称公共安全的分支领域。[8]

按照传统的学科划分，公共安全主要是公共管理学的研究对象，正如国家安全主要是政治学的研究对象、个体安全主要是社会学的研究对象一样。然而，由于学科的交叉与融合，这种界限正在被打破，公共安全正在成为一个多学科交叉的研究领域，融合了来自政治学、社会学以及其他学科的相关研究。

实际上，由于公共管理学本身也是多学科交叉与融合才兴起的新学科，对公共安全的理论研究尚不充分。因此，多学科(尤其是政治学、管理学和社会学)的研究视野，对于公共安全管理的理论研究至关重要。

政治学侧重讨论了安全的价值属性。例如，沃尔弗斯(Arnold Wolfers)将“安全”界定为“价值的实现不受威胁”。[9]沃尔弗斯的定义也是政治学关于安全研究的起源，在“冷战”的背景下，“安全”主要指“国家安全”“军事安全”。至20世纪80年代，在乌尔曼(Richard Ullman)倡导的新定义中，传染病、水旱灾害等也都是安全研究的对象，且其重要性更高。[10]这也说明，早在上世纪80年代，政治学关于安全的研究就已经涉及了公共安全问题。

管理学主要强调了安全的科学属性。埃文(Terje Aven)将“安全”界定为“免于事故和损失”。[11]这是管理学关于安全研究的初始假设。因此，管理学关于安全研究的逻辑主线是识别事故的演化规律并作出相应的制度安排。例如，特纳(Barry Turner)认为，任何灾难都有很长的孵化期。[12]因此，虽然特纳是社会学家，但他对85起因重大系统故障导致的灾难性事故的分析，并在此的基础上提出的事故的六个周期却成为管理学安全研究的重要文献。[13]

政治学和管理学关于安全属性的理解差异还反映在“安全”概念的使用上：前者多使用“security”;后者多使用“safety”。在英文中，“security”通常涉及蓄意为之的情形或事件，例如恐怖袭击;而“safety”通常是指非蓄意的情形或事件，例如职业安全。[14] 这种概念的差异也体现在管理实践中。例如，在中国，虽然公安部和国家安监总局都是公共安全管理的职能部门，但公安部的英文为“Ministry of Public Security”，安监总局的英文则是“State Administration of Work Safety”。

事实上，安全的科学属性和价值属性是“同一个硬币的两面”。正如斯达尔(Chauncey Starr)所言，安全是一直存在的问题;因此，安全本身并不是问题，“多安全才算安全”才是问题。[15]斯达尔在20世纪60年代的研究就已经显示，在收益相同的情况下，公众对自愿活动风险的可接受程度大约是非自愿活动风险的1000倍。[16]这充分说明，安全的科学属性与价值属性原本是密不可分的。

在管理实践中，“security”和“safety”已经有所融合。例如，2001年“9.11”事件之后，美国开始倡导以反恐为优先任务的国土安全(Homeland Security)管理，发布了《国土安全法》，成立了国土安全委员会(简称HSC)和国土安全部(简称HSD)，并将以自然灾害应急管理为优先任务的联邦紧急事故管理署并入DHS。2005年“卡特里娜”飓风之后，美国发布《后卡特里娜应急管理改革法》，FEMA重新获得了自然灾害应急管理的领导地位，“security”和“safety”也从“9.11”之后的高度融合调整为适度融合。近年来，中国倡导“总体国家安全观”，也推动了上述两种安全观的融合。[17]

在多学科的视野下，公共安全的双重属性得以完整呈现。这对于理解大数据与公共安全的互动关系至关重要。大数据与公共安全的良性互动需要同时从公共安全的科学属性和价值属性出发。

二、从科学出发：大数据如何促进公共安全?

大数据的核心价值在于其科学属性，这与公共安全的科学属性存在着内在的契合。在这一维度，大数据与公共安全是双向的互动关系;一方面，公共安全事件促进了大数据的生成;另一方面，大数据分析可以显著提升公共安全管理的适应能力。

(一)公共安全事件与大数据生成

大数据从哪里来?这是大数据分析的前提。从数据来源分类，大数据可以分为社会的数据、通过传感器收集的来自物理空间的数据和网络空间的数据。[18]其中，来自社会的数据包括政府数据，如存储于卫生、安监、信访等政府部门业务运作过程中产生的文件、文档以及信息系统数据，这些都可以直接应用于公共安全管理;来自物理空间的数据，如公共场所的视频监控数据，也可以直接应用于公共安全管理;网络数据又可以细分为三类：自媒体数据，包括在社交网络、博客、微博等应用中的用户生成数据;日志数据，包括搜索引擎、运营商、网购服务、金融服务等网络服务所产生的用户行为、交易等日志数据;富媒体数据，包括文本、音视频、图片和文字等。

相较于政府数据和来自于物理空间的数据，来自网络空间的数据更能体现大数据的“4V”特征：体量大、多样化、高速性和高价值。[19]大数据驱动的公共安全管理的实践创新也大多与来自于网络空间的大数据有关。例如，通过谷歌搜索数据来预测甲型H1N1流感;[20] 通过社交网络数据来分析灾民的行为模式，对受灾城市可能发生的大规模灾民避难、迁移行为进行建模、预测和模拟，并对灾民的撤离路线进行有效推荐。[21]在很大程度上，来自网络空间的大数据体现了政府与公众关于信息的共同生产，[22]因此更能揭示出公共安全管理作为复杂适应系统的本质。[23]具体来看，公共安全事件主要通过四种机制促进大数据的生成：

一是在线社会聚合。灾难发生后，公众在网络空间发布信息、发表观点等行为在理论上被称为“在线社会聚合”，主要包括七类：帮助、焦虑、返回、支持、纪念(mourning)、利用和好奇。[24]在线社会聚合在本质上就是信息、观点、技术、情绪和行动在网络空间的聚合。[25]这直接促成了大数据的生成，使得通过大数据分析来识别公众在灾难情境下的行为规律提供了可能。

二是信息扩散。灾难发生后，公众的信息渴求直接推动了信息的扩散。[26]为满足公众的信息需求，政府部门通过社交媒体推送灾难的相关信息，公众通过社交媒体进行转发和评论，这种信息扩散的过程也是大数据生成的过程。

三是“众包”协作。灾难的发生造成需求的缺口，在道德因素的驱动下，大量的“数字志愿者”在网络上通过“众包”的方式进行协作，推动信息的共享、加工和整合的过程。[27]这也可以促进大数据的生成。

四是集体智能。灾难发生后，公众在网络空间上探寻真相，通过对碎片化信息的“拼图”来获得问题的全景，形成集体智能，推动问题的解决。集体智能的形成过程也是大数据的生成过程。[28]

(二)大数据分析与公共安全管理

在多学科视野下，公共安全管理可以视为由风险管理、应急管理和危机管理三个阶段构成的“连续统”。[29]大数据分析与公共安全管理的内在契合在这三个阶段都可以得到体现。

1.大数据分析与风险管理。风险管理的目的在于“防患于未然”。然而，如何“防患于未然”?从不同的理论视角出发，得到的结论也不尽相同。例如，如果从风险社会理论出发，风险源自现代性的自反性。[30]因此，用现代性的手段来预防现代性的自反性只能是“饮鸩止渴”，其结果可能是更大的灾难。如果将风险理解为实体的，则风险是有形的，也是可防可控的;如果将风险理解为建构的，则风险是无形的，只存在于观点之中。在大数据时代，环境、人、物和组织的活动轨迹都会被数据记录，无论是实体性风险，还是建构性风险，大数据分析都能显著提升风险管理的效果。

首先来看实体性风险的管理。实体性风险通常被定义为发生损失的可能性，等于概率和后果的加和或乘积。这也意味着，实体性风险的管理往往需要足够的观测资料的积累以计算概率。在实体性风险的管理中，保险是最为主要的方式。保险的基本原理是大数法则：随机现象的大量重复中蕴含着必然规律，相同类型的风险单位的数量越多，实际的损失结果就会接近于从无限数量的风险单位得出的预期损失的结果。大数据与大数法则存在着内在的一致性，运用聚类分析和关联分析等方法，大数据不仅可以更加精准地识别风险同质的潜在标的，实现保险的精准定价;也可以更好地实现最大诚信原则，降低保险的道德风险。

在这方面，已有商业公司进行了尝试：“谷歌前雇员在硅谷创办climate公司，从美国政府获得30年的气候、60年的农作物收成和14TB(钛字节)的土壤的历史数据，同时还利用来自250万个地点的气候测量数据和1500亿例土壤观察数据，生成10万亿个模拟气候数据点。该公司预测任一农场的下一年产量，向农户提供天气变化、作物、病虫害和灾害、肥料、收获、市场价格等咨询，并出售个性化保险，承诺每英亩的玉米利润增加100美元，如果出现未能预测的恶劣天气损坏庄稼，气候公司将及时赔付。”[31]

其次来看建构性风险的管理。建构性风险可以定义为感知性风险的集体建构。建构性风险通常很难管理。这是因为，感知性风险的个体差异很大，传统的问卷调查方法只能获得小规模样本的感知性风险，且这些个体化的感知性风险如何形成集体化的建构性风险的路径并不清晰。在传统的社会科学调查中，样本规模在3000以上就可以满足全国性调查的要求。[32] 在大数据时代，样本规模的约束被打破。更为重要的是，大数据所依托的网络空间为感性性风险的集体性建构提供了平台和路径。例如，“魏泽西事件”就是典型的建构性风险。虽然社会个体对医疗行业的现状各有不满，但都是分散的、独立的;在网络空间中，这些分散的、独立的感知性风险集体呈现出来，个体之间通过网络空间彼此连接、互相认同、互相强化，迅速完成了集体性的风险建构。因此，在大数据时代，建构性风险的管理将变得可行。

在这方面，信访大数据也开始尝试进行建构性风险的管理。在最近的十几年中，一方面，随着信访制度权利救济功能的扩大，出现了“不闹不解决、小闹小解决、大闹大解决”的乱象，导致信访制度不断异化;另一方面，随着各种社会矛盾向信访汇聚，群众的上访行为(包括在网上提出信访诉求)中蕴含了大量的社情民意信息，这为建构性风险的识别提供了可能。[33]目前，网络信访已经在全国范围内推广;[34]政府网站留言板、微博等社交媒体平台上也有大量的信访诉求信息。通过大数据的聚类、关联和回归分析，这些信访诉求背后的建构性风险就能得到及时的识别和管理，真正实现“数据多跑路，群众少跑腿”。[35]

2.大数据分析与应急管理。信息能力在很大程度上定义着应急管理的适应能力。[36]大数据的本质就是信息。[37] 在大数据环境下，信息的及时性、可及性、准确性和完整性都会发生显著改变。首先，由于大数据的高速性特征，相较于传统的信息获得方式，大数据分析能够获得更为及时的信息。其次，由于互联网和社交媒体的广泛普及，信息的可及性大为增强。第三，虽然互联网和社交媒体上充斥要谣言，但通过数据之间的交叉检验，大数据分析更容易识别和澄清这些谣言，这也强化了大数据的高价值特征。第四，由于大数据的体量大、多样化，通过大数据分析获得的信息更为完整。由此可见，大数据的“4V”特征可以全面地提升信息的及时性、可及性、准确性与整体性，大数据与应急管理也存在着内在的契合。

具体而言，大数据提升应急管理适应能力的核心机制在于态势感知。[38]在理论上，应急管理可以包括五个阶段：预防、减缓、准备、响应和恢复;但从态势感知的角度来看，大数据促进预防和响应的作用最为显著。首先来看预防。通过大数据的关联分析和聚类分析，隐藏在分散的信息背后的逻辑一致性得以呈现，从而形成关于何种事件即将发生的态势感知，进而提高预防的针对性。例如，大数据可以显著提升反恐的预防效果，“一个人买高压锅很正常，一个人买钟也很正常，一个人甚至买一个火药也正常，买个钢珠也正常，但是一个人合在一起买了那么多东西，就一定不正常了。”[39]

其次来看响应。通过大数据的关联分析和聚类分析，碎片化的信息得以形成“拼图”，从而形成关于事件整体图景的态势感知，进而提升响应的协同性。在常规的信息条件下，应急响应的信息主要源自于正式的信息渠道，协同的范围也就相对较小。在大数据的信息条件下，应急响应的信息大量来源于互联网和社交媒体等非正式的信息渠道，协同的范围也随之扩大。例如，在灾难发生后，关于灾难损失的快速评估不仅可以来源于理论模型的推算和现场的损失调查，也可以来源于大数据分析：通过对网络空间中的灾情信息的整合，可以迅速识别不同区域的受灾程度，实现政府与社会的协同评估。

3.大数据分析与危机管理。如果不进行严格区分，危机管理和应急管理并无显著差异。如果进行严格区分，危机管理主要侧重于危机沟通，而应急管理主要强调事态控制。库姆斯(Timothy Coombs)的情景式危机沟通理论认为，危机沟通不仅需要从组织职责出发进行危机响应，还要从组织声誉出发考虑危机情境。[40]因此，也可以这么理解，应急管理主要从组织职责出发，旨在减少或缓解人员伤亡、财产损失或社会失序;而危机沟通则需要从危机情境出发，维护组织声誉。这一理论对于公共组织也完全适用。在互联网舆论环境下，危机沟通已经成为公共安全管理的重要组成部分。例如，在2015年的天津港危化品仓库爆炸事件中，天津市政府的应急响应虽然卓有成效，但危机沟通却非常失败，致使组织声誉严重受损，公共安全管理能力也备受质疑。[41]

在灾难事件中，网络空间的大数据来源于公众与政府对于信息的共同生产，无论这些数据是情感类型的，还是信息类型或观点类型的，抑或是行动类型的，它们都是真实的，其中蕴含着公众对安全的焦虑和关切。大数据分析就是要从舆情数据中识别、锁定、收集和提取公众对安全的焦虑和关切，为危机沟通提供“精确坐标”。[42]在这方面，大数据分析已经可以通过“词云”、情感分析、文本挖掘等方法和技术提供快速的舆情分析，提高危机沟通的效率。

应该说，相比于传统的由宣传部门主导的单向的信息发布方式，基于大数据分析的危机沟通的精确性和交互性更高。一方面，基于大数据的舆情分析可以准确地呈现舆情的热点分布和情感指向;另一方面，通过信息的共同生产，大数据分析也可以获得政府危机沟通的及时回馈，进而及时调整危机沟通策略。当然，大数据时代的危机沟通也给各个政府部门、各级地方政府形成了强大的压力，并非所有的政府部门和地方政府都愿意且有能力应用大数据分析来进行危机沟通，有些政府部门和地方政府甚至运用大数据分析来进行删帖，以此逃避舆论监督，这是对大数据分析的误用，需要纠正这种错误的倾向。

当然，大数据分析仍然存在技术瓶颈，尤其多源异构数据的融合和非结构化数据的处理，这些在很大程度上制约了大数据分析在公共安全管理中的应用。

　三、从价值出发：大数据如何促进公共安全?

从公共安全的价值属性出发，促进大数据与公共安全的良性互动，主要需要考虑三个问题：

第一，大数据与数据监控。在任何社会，安全都是重要的价值，但都不是唯一的价值。鲍德温(David Baldwin)总结了安全价值的三种模式：[43]一是将安全作为优先价值，潜在的假设是安全是享受其他一切价值(如自由、繁荣)的前提条件。这是一种绝对的安全观，在现实中很难持续存在也不可能实现。因为按照马斯洛的需求层次理论，生存是比安全更为基础的需求，一旦安全的需求被满足，又会产生更高层次的需求。因此，绝对的安全即便存也不可能持续。达尔和林德布鲁姆也认为，即便存在绝对的安全，人们也不一定真的想寻求绝对的安全，而是试图留下一些挑战和风险。二是将安全作为核心价值，也可以同时有其他核心价值。这种模式的难点在于很难清晰地区分什么是核心价值，什么是非核心价值。三是将安全作为一种边际价值，潜在的假设是边际效用递减也适用安全价值。在这一模式中，安全只是同时竞争资源的众多政策目标其中之一，在本质上也是一个资源分配问题，将安全价值至于何种位置并无一定之规，而是需要视情境而定。这不仅取决于需要多少安全，也要取决于已有多少安全。这和马斯洛需求层次理论在逻辑上也是一致的，当安全匮乏时，安全的边际收益就高，安全的需求就很迫切;当安全充裕时，安全的边际收益下降，对安全的需求也会降低。

在风险社会的背景下，公共安全越来越成为一种优先价值。例如，2001年“9.11”事件之后，美国不惜中断边境贸易，以换取绝对的安全。然而，绝对安全同时也意味着贸易的中断，美国只坚持了两周便重新恢复边境贸易。[44]与此同时，美国通过《爱国者法案》，授权国家安全局(简称NSA)截取国内通讯记录。2015年5月31日，《爱国者法案》到期，随后通过的《美国自由法案》仍然授权NSA可以获得特定必要的数据，只不过需要先获得秘密法庭命令，才能向电话公司索取记录。[45]

一旦将公共安全作为一种优先价值，大数据分析便有可能导致数据监控，侵犯个体的自由与隐私。此外，大数据分析还有可能被权力机关滥用，也有可能被不法份子利用，反而危害公共安全，这就会形成了一个“悖论”：用于促进公共安全的大数据反而会危害公共安全。

第二，大数据与新兴风险。从风险社会的理论视角出发，大数据也可视为一种新兴风险，是正在表露但人们尚且陌生的风险。贝克和吉登斯认为，现代性具有自反性，现代科技和制度的发展都不可避免地带有“副作用”(side-effects)。核能源如此，转基因如此，大数据也是如此。

新兴风险是公共安全当前面临的主要威胁之一。在很大程度上，现有的公共安全管理体系在应对熟悉风险上已经积累的相当的经验，短板恰在于新兴风险。那么，既然大数据有风险，这是否意味着需要放弃大数据的发展呢?答案显然是否定的;否则，就是因噎废食。从源头来看，新兴风险源于现代性的自反性，用现代性的手段来应对现代性的自反性，这不但不能从源头上治理风险，甚至有可能造成更大的风险。因此，即便大数据也有可能危害公共安全，但对大数据带来的新兴风险只能采用适应性治理，只能适应而无法消除，宽容治理的滞后性，在科技发展和制度创新的收益和风险之间进行权衡。

第三，大数据与功能均衡。任何事物都可能“物极必反”。大数据也是如此，一旦大数据在公共安全上的“副作用”超过了其正功能，大数据与公共安全的良性互动也就难以维持。默顿的“总功能的净均衡”的概念可资借鉴：“当现存社会结构的总功能的净均衡明显具有反功能时，这对变迁会形成强大的、持续的压力。”[46]换言之，当大数据对于公共安全的反功能大于正功能时，总功能的净均衡便具有反功能。因此，要维持大数据与公共安全的良性互动，就要尽量抑制大数据的反功能。

四、结束语

大数据时代的来临给予了公共安全研究带来全新的机遇与挑战。本文旨在理解大数据与公共安全内涵的基础上，依据公共安全的双重属性，从科学维度与价值维度论述了大数据与公共安全的作用机理。可以说，在风险社会的时代背景下，公共安全的重要性与日凸显。要形成大数据与公共安全的良好互动，需要兼顾公共安全的双重属性。只有处理好大数据与公共安全的相互关系，公共安全才可能作为中国国家治理的新“名片”。

参考文献（略）

基金项目：国家社科基金重点项目“新兴风险与公共安全体系的适应能力研究”(编号：13AGL009);国家自然科学基金重大项目“我国重大基础设施工程管理的理论、方法与应用创新”(编号：71390521);教育部新世纪人才项目“中国公共安全体系当前面临的挑战与未来发展方向研究”(编号：NCET-13-0284)

作者：丁翔，南京大学政府管理学院助理教授，南京大学社会风险与公共危机管理研究中心研究员;张海波，南京大学政府管理学院教授、博导，南京大学社会风险与公共危机管理研究中心研究员，南京 210093

来源：中国行政管理

理论广角

大数据与公共安全：概念、维度与关系