每一天,有两百万人次乘坐飞机穿梭于美国上空,超过一百万人通过陆路进入国内。验证每一个人的身份并确定他或她是否会构成威胁的工作落到了国土安全部(“Department of Homeland Security”, DHS)的头上,后者必须在数秒内处理大量的数据来完成这项职责。这项工作不仅仅是从一个“草垛”中寻找一根“针头”,保护我们居住的家园往往需要从许许多多的“草垛”中找出那根最为关键的“针头”——一个典型的大数据问题。
确保国土安全部有效而合法地使用它搜集的信息是项艰巨的任务。在“911”恐怖袭击之后,国土安全部已经分离出22个独立的政府机构。如今国土安全部中的许多数据库仍分散各地,运行着陈旧的操作系统,而无法整合不同安全级别的信息。除此以外,国土安全部的职责组合方式多样,而这些职责本身却分别由在法律上独立的部门执行。在任何时候,这些信息必须在保护本国公民和进入或定居于本国的外籍公民的隐私与人身自由的条件下被用于授权过的特定目的,而这确保信息被正确使用的任务,就由国土安全部总部的六个办事处执行。
自2012年起,来自首席信息官、政策部门和情报部门的代表与个人隐私、公民自由和法律监督方面的官员一同开始运行第一个跨部门大数据应用试点项目——“海王星”(”Neptune”)与“地狱犬”(“Cerberus”)。“海王星”项目计划将不同来源的未经分类的信息汇聚成一个“数据湖”,并在其内部设置多项安全保障措施,包括添加多条数据标签的权限与精确到“哪些用户可以基于哪些目的使用哪些数据”的访问规则。所有这些数据都依据一套精细的方案贴上标签。在政府使用的过程中,重点关注是否存在经授权的访问目的,访问任务和必要事项以及使用者本身在访问信息时是否具有合适的工作证明和明细。在这种方式下,通过对数据标签、用户属性与访问前后信息的三重定位就能确定哪条信息在何处被谁访问。
为了在它的大数据试点项目中确定数据标签的统一标准,国土安全部还将数据系统的所有者与来自个人隐私、公民自由与法律监督办公室的代表聚集到一起。对每一领域的数据,他们都共同制定其数据属性并针对不同的用户群体设置了对应的访问权限。在制定出一整套标签来对信息进行编码后,他们又针对特定的使用限制或一些法律法规下的特殊情况设计附加的规则与保护措施。通过这种添加标签的方式,不仅可以完成高精度的数据访问控制,同时也保留了源数据与其原始搜集目的之间的联系,最终形成了一套对数据从哪里来、到哪里去得到进行全程监控的分类规则。
每个数据库中的字段分为三类:核心身份信息:例如姓名,出生日期和公民身份;扩展身份信息:包括地址、电话号码和电子邮箱;具体的随机数据:衍生于国土安全部中国的电子信息与真人信息的匹配过程。随机数据是最为敏感的数据类型,它可能包括执法人员对被访者的观察记录以及对被访者提出的威胁国土安全的指控。此时详细的规则就能借助数据标签来确定哪些人可以以何种目的访问这些信息。在这两个试点项目中,大多数访问权限的规则设计都需要国土安全部内不同部门的数据使用者间的持续协商才完成。例如,许多数据使用者需要核心身份信息访问权限来获得完成相应的任务所需的特定数据,但由于特定的使用限制,一些规则要求这些数据者提供与所确定的标准更为匹配的信息。
“海王星”与“地狱犬”试点项目同时包含对数据使用者能够采用的搜索方式的重要限制。一个基础检查点可能只需要对一个特定的个人进行数据搜索,因为这个检查点仅需核实基本的身份信息。但是,移民局和海关在侦查案件时,就需要对个人基础身份信息和特征信息进行搜索。而国土安全部的情报分析员就可能需要综合身份、特征与行动趋势信息来分析国家安全的潜在威胁。同时,系统管理员也没有系统内部数据的访问权限,因此数据库的框架设计要允许管理员在不访问任何个人记录的同时也能维持整体系统的正常运作。
在这两个试点项目中,数据库以完全不同于国土安全部自2002年沿袭至今的方式进行了重新组织。在这些大数据的相应举措开始之前,跨越不同部门的数据库搜索较为不便,而将这些数据进行汇总更是难上加难。在过去,数据的使用者与系统管理员一旦登陆成功便很有可能获得所有的访问权限,这些访问有时甚至不会受到跟踪、监测。如今,国土安全局有能力精确设计根据任务需求而定的访问权限。最重要的是,在这些先进的数据库中,通过人为地制定标签和数据的重新组织,国土安全局能够在强有力的法律监督下实施新型的事件预测与异常分析。
国家安全局如此细致地设计数据处理系统并不是偶然的结果。国家安全局内部专门设有独立的隐私办公室与公民权利与自由办公室,每一个办公室都配有专业人员来帮助研究处理这一复杂领域的相关事务。每一个试点项目在实施前都会向社会公众公布详细的隐私影响评估报告。国家安全局同时向公众提供各项目的介绍并接受大众对于项目具体措施的问询。经过这一系列的工作,隐私与公民自由办公室的官员不仅批准了这两个试点项目的实施,还同时通过了服务于未来功能扩展的配置建设。所有这一切都将有助于推动国土安全部的计划能在确保隐私和公民自由自始至终得到密切关注的同时得到进一步的发展。