知物由学 |“网状世界”下,无处可逃的信息安全

网易云易盾2018-10-31 20:06


“知物由学”是网易云易盾打造的一个品牌栏目,词语出自汉·王充《论衡·实知》。人,能力有高下之分,学习才知道事物的道理,而后才有智慧,不去求问就不会知道。“知物由学”希望通过一篇篇技术干货、趋势解读、人物思考和沉淀给你带来收获的同时,也希望打开你的眼界,成就不一样的你。

本文作者:Tyler Elliot Bettilyon

进入互联网大数据时代以后,数据安全危机日益加重,个人信息随意泄露,公民的隐私得不到保护,无论是政府机构还是一些有预谋的公司都在不断的收集个人信息,在互联网大数据时代,每个人都像裸奔在互联网上。我们不是患上了被害妄想症,是数据安全危机比想象的要更糟糕。本文作者旨在呼吁保护数据安全和个人隐私。


小说家乔治•奥威尔在他的经典小说《1984》里,描绘了一个无可逃避的被监视的状态,每个房间的监视屏幕监控每一个动作,记录每一个声音,并将这一切报告给独裁者。奥威尔刻画了一个令人感到窒息的恐怖世界,在假想的未来社会中,独裁者以追逐权力为最终目标,人性被强权彻底扼杀,自由被彻底剥夺,思想受到严酷钳制,人民的生活陷入了极度贫困,下层人民的人生变成了单调乏味的循环。他可能从来没有想到,在2018年,人们会花600美元(外加上每月一次的费用)来换取口袋里装着监视屏幕的特权(手机时刻被监控定位)。


一些国家的监控设备包括脸部识别技术,连接着一个庞大的中心网络以及警官佩戴着的带照相功能的太阳镜;不久它将连接到一群伪装成鸟的无人机上。作为不断发展的搜索网络的一部分,火车站将很快要求进行面部扫描。


美国拥有自己的一些令人恐惧的工具,包括国家安全局的PRISM(“棱镜”)计划,著名的告密者爱德华•斯诺登揭露了这一计划,这就是所谓的“棱镜门”。在棱镜下,国家安全局收集并存储了大量互联网流量数据。斯诺登转储和随后披露的信息表明,国家安全局多次(有时是成功的)试图打破公共加密标准,例如Diffie-Hellman密钥交换算法。这样做可以让他们读懂大量被认为是隐私的信息。“棱镜”直接进入美国网际网路公司的中心服务器里挖掘数据、收集情报,包括微软、雅虎、谷歌、苹果等在内的9家国际网络巨头皆参与其中。


打着安全的旗号,类似的高科技监控和数据收集政策正在全欧洲展开。世界范围的独裁主义正在兴起,每年的《网络自由》报告都表明,在线内容审查也相应上升。从2017年的报告看:


在线内容操控导致互联网自由度连续七年全面下降,同时移动互联网服务中断增加,对人权捍卫者和独立媒体的物理和技术攻击增加。


2017年《网络自由》评估的65个国家中,将近一半的国家在评估期内经历了网络自由度下降,而只有13个国家取得了进展,他们大部分都是小国家。不到四分之一的用户居住在互联网被认定为自由的国度,这意味着在这些网络自由的国度,没有通过重大网络访问障碍,对内容的严格限制,或者以不受限制的监视形式或对合法言论的不公正影响等形式严重侵犯用户权益。


世界各国政府变得愈来愈精通科技。在独裁政体中,这意味着更好的监视,更多的内容审查和强有力的虚假信息战术。有些人认为间谍机构存在以保护他们的公民,因此这些技术进步是最好的,但是即使相信这一点,监视和网络战争的进步也不是没有风险的。


这种非比寻常的火焰病毒和震网病毒是由美国和以色列政府联合开发的,它们共享多个组件。有些人认为震网病毒是有史以来最令人印象深刻的软件。它劫持了微软基础设施的关键部分,并把自己伪装成合法的微软更新,向世界各地数百万台计算机传播。这两个蠕虫病毒自动复制并安装到USB驱动器和其它外围设备。火焰病毒变种能够打开照相机和麦克风,监控网络流量,以及更多。


这两种病毒在世界范围内传播,其目标是感染和破坏伊朗的核设施(如果感兴趣,震网病毒攻击伊朗核设施的事件可以在网上查阅到更详细的介绍),震网病毒攻击导致了伊朗核设施瘫痪。即使你相信政府会用这个软件做正确的事情,但是完全掌握病毒代码后会使政府成为一个攻击目标。


影子经纪人(TSB)是一个黑客组织。令人气愤的是,影子经纪人窃取了美国国家安全局的关键技术,在2016年,变成了WannaCry勒索病毒感染了数百万台计算机。如果没有黑客组织影子经纪人,勒索病毒WannaCry的影响力绝不会像现在这样遍布全球。也许美国国家安全局从来没打算使用这些技术作恶,但是如果无法防止代码被盗,那么意图还重要吗?

作为一个社会,才开始摸索出对付数据可能被武器化的各种方式,然而,我们正处在大数据革命的漩涡中。


好像这还不够,间谍活动不仅仅是为了政府。Facebook,Google和其它许多公司都致力于全天候的监控,旨在帮助公司销售广告,做出更多“数据驱动”的决定,以及“理解它们的客户”。(这就像我们通过搜索引擎搜索了某个东西后,很快就会不断有类似的广告推送到我们面前。)销售广告是一个非常普通的目标,但捕获的信息可用于更邪恶的目的,例如剑桥分析丑闻。更重要的是,他们收集的数据对于政府机构或非国有黑客组织来说是一个高价值的目标,这些黑客组织可能正在寻求施压、敲诈或窃取那些他们可截取数据的人的身份。


作为一个社会,才开始摸索出对付数据可能被武器化的各种方式,然而,我们正处在大数据革命的漩涡中。处理庞大数据集的机器学习算法在硅谷和其它领域都是众人瞩目的焦点。它让每天从繁杂的互联网上提取有价值的数据变得更容易。
不幸的是,最严重的脆弱性在很大程度上是看不见的,数据最严重的滥用还没有到来。更糟糕的是,一些最相关的攻击面已被嵌入到互联网本身的结构中,使所有人都处于危险之中。


这个问题令人恐惧的范围


也许你认为你是安全的。


你使用密码管理器,为每个网站生成强大的独一无二的密码。你摄像头有录像功能。你已经禁用JavaScript脚本,阻止广告。你从来没有连接过不安全的WIFI接入点。你加密。你使用预付费的电话机。你使用Tor的VPN。不,你地下室的那个房间不是一个“荣耀的锡箔帽”,它是一个法拉第笼。


不幸的是,即使是非凡的个人安全承诺也不足以完全保护你的数据。


事实是,现代的网络基础设施已经创造了一系列脆弱的系统。如果数据通过不安全的中介传输,那么不管自己的行为如何,你现在都处于风险之中。你的朋友正在存储你发送给他们的短信。Facebook存储你朋友为你拍的照片。谷歌存储你的网页搜索历史和你的位置历史,然后把这些数据卖给广告商。快照存储你的快照。监控清单还有很多。


谷歌为用户提供了一个选项来关闭这种跟踪(深深地埋藏在它们的设置中),但是确保数据永远不会在不安全系统上的唯一方法是永远不要使用互联网发送数据。


开玩笑吧。即使从你未使用过互联网,现代世界也已经为你使用了它。


Equifax是一种服务,实际上没有人选择在1.45亿个社会安全号码上暴露自己。美国人口大约有3.25亿,这意味着仅在一次攻击中,你的数据就有44%的机会被窃取。顺便说一句,驾照号码、出生日期、信用卡号码、电话号码和税务识别码也会一同在这种数据窃取中泄露。这些被窃取数据的公民中,很有可能有从未使用过互联网的公民,属于被动式的个人数据泄露。


无论何时你从事金融交易,都有很好的机会将相关数据录入到数据库,并且该数据库可能连接到互联网。政府愈来愈多地在网上提供公民信息。你的朋友、同事和熟人也会在网上留下一些信息;推特,Facebook帖子,图片以及关于你的个人信息,甚至连你自己都不知道,这些信息可以被试图跟踪你的组织使用。“人肉搜索”往往也基于这些信息。


巴拉唐德•瑟斯顿的精彩(美国专栏作家巴拉唐德•瑟斯顿也许是和互联网关系最紧密的一个人。在一年之中,他发了1518条脸书消息;11541条推特,处理了59409封邮件。)和令人不安的数据排毒,在数不清的轻松步骤中捕捉到一部分缠结的网,组成一个人的数字足迹。Facebook与第三方App共享数据,开发者可以将这些数据存储在自己的数据库中。正如我们在剑桥分析公司看到的那样,数据可以卖给第四方(第五,第六)。这些数据最终可能落入到一个政治行动组织、俄罗斯政府、一家广告公司……甚至任何人。


冰山一角


我们对组织如何使用我们的数据几乎没有什么控制,对如何通过互联网的物理机器传输我们的数据的控制甚至更少。


今天,超过两个百万的三次方字节的数据,也就是2后面有18个0的字节数据将在互联网上传输。有时作为无线电波,有时作为电信号,有时作为光的爆发,通过激光或光缆。在到达目的地的路上,数据将通过几个不同的计算机,其中任何计算机都可以记录关于你的IP地址、你发出的请求类型、你的数据流量通过这台计算机的频率、你发送和接收的数据大小,你发送数据并接收数据的IP地址列表。斯诺登转储的数据透露,美国国家安全局实际上正在大规模地记录此类信息。


关于你看过哪些电影、你多久给妈妈打一次Skype、你最喜欢的歌曲,以及你在互联网上做的其它事情的信息都是通过可能受攻击的基础设施传输的。一旦它到达目的地,你的数据被存储在其它潜在受攻击的基础设施中。在许多情况下,有野心的第三方可以凭空轻而易举地攫取惊人数量的信息。

物联网上的设备也容易受到智能的攻击,这些攻击会导致设备以意想不到的方式运行。如果连接没有加密,数据路径上的任何人都可以轻松地记录发送和接收的所有数据。加密有助于保护消息内容。但不幸的是,仅仅加密是不够的。加密与匿名结合的工具,如VPN和混合网可以帮助减轻这些元数据的泄露。Tor就是这样一个工具,它是一个系统,试图通过使用几个代理来隐藏源和目的地IP地址,这些代理本身对于真正的源和目的地的知识有限。技术细节是巨大的,但也许以下的隐喻可以帮助理解。


想象一下你正在给你的朋友提姆写信。你想伪装你的位置,所以你组建了一个私人网络,爱丽丝,鲍勃,和查理,他们负责转发信件。没有问题(他们是Tor网络)。你把信放在寄给提姆的信封里,然后把信封放在寄给查理的信封里,然后把查理的信封放在寄给鲍勃的信封里,然后把鲍勃的信封放在寄给爱丽丝的信封里。然后在邮件中放入嵌套的信封。


有人窥探你的信件,但不窥探爱丽丝,就会发现你给爱丽丝寄了一封信。有人监视你的朋友提姆会知道查利给提姆寄了一封信。有人监视鲍伯,甚至连你和提姆都不认识,但是也会监控到你和提姆。这不是一个完美的比喻,但这大致就是Tor如何帮助保护你的匿名性:通过混淆网络流量的真正来源和目的地。


Tor和其它类似的系统仍然容易受到所谓的相关性攻击。通过监视你的连接和Tim连接的对手可以使用元数据推断你俩正在通信。这更难,需要一个成熟、强大、有动力的对手,但值得注意的是,没有什么系统能给你完美的匿名性。


扩展攻击面


正如比以往任何时候有更多的方法来传输数据一样,更多的机器正在交互和侦听对方。随着手表、烤箱、冰箱、鱼缸、恒温器,以及更多设备连接到互联网,物联网持续发展。微型计算机已经渗透到我们现代生活的方方面面,所有这些设备都是一个新的潜在的安全风险,要么作为一个创造值得窃取数据的设备,捕获值得窃取的数据,要么作为渗透到网络的潜在弱点。


物联网上的设备也容易受到智能的攻击,这些攻击会导致设备以意想不到的方式运行。例如,黑客已经找到了把扬声器变成麦克风的方法,甚至在只能发出声音的设备上也能听到你的声音。在一项特别令人毛骨悚然的研究中,科学家能够听到受试者在键盘上输入密码的声音,并且80%的时候能够准确地猜出这些密码。顺便说一下,那是在2005年,音频处理领域从那时起有了显著的进步。想象一下,从你认为无害的声音中可以推断出什么。


鱼缸温度计是用来从赌场偷钱的。这并不是因为鱼缸可以直接访问金融交易,而是因为鱼缸在其它安全的赌场网络中是一个弱点。虽然黑客的攻击细节没有公开,但是攻击者可能利用了糟糕的安全措施(例如,赌场员工认为鱼缸温度计不需要像其它网络设备那样被保护)和糟糕的安全基础设施(例如,温度计制造商的硬件/软件比网络上的其它设备更容易破解)。


黑客已经能够闯入汽车的计算机系统,远程关闭发动机,猛的刹车,转动车轮,突然加速等等。每个具有互联网连接的设备都是潜在的攻击向量。


更突出的问题是,所有这些设备连接它们的基础设施常常由不安全的软件提供动力。以域名系统(DNS)为例,域名系统是计算机基础设施的重要组成部分,也是众所周知的隐私和安全风险。


如果不手动配置计算机的DNS设置,那么当你访问这些网站的时候,可能正在发送你访问的每个网站的列表,以及使用零加密的公共信道访问这些网站的频率。默认情况下,这些信息将被发送到你的ISP,然后ISP将为你发送的域名(如“google.com”)提供IP地址。所有这些信息都可以无限期地存储在犹他州的Bluffdale由国家安全局操作的数据存储设施中(假设地说)。


DNS的弱点也在高科技数据劫持中得到了利用。攻击者不记录DNS信息,而是使用DNS中的弱点和支持互联网流量路由的主要协议之一(边界网关协议或BGP),以便在钓鱼攻击中窃取登陆凭据。在一次这样的攻击中,超过15万美元的数字加密货币被窃取,这些钱是从交易网站MyEtherWallet的用户那里偷来的。


这种攻击相当复杂。首先,攻击者利用一个众所周知称为BGP泄漏的漏洞恶意地将互联网流量重新路由到受损的基础设施。其次,重定向的流量被破坏,具体来说,与MyEtherWallet.com网站相关的DNS查询被“毒害”,将用户引诱到钓鱼网站。再次,当用户无意中将密码输入到钓鱼网BGP泄漏,DNS中毒,诸如OpenSSL的心脏出血漏洞尤其令人关注,因为它们影响所有互联网用户,并且为受影响的用户提供几站时,攻击者使用窃取的证书来盗取用户的数字加密货币。


数据处理与预防


随着可用数据的范围不断扩大,数据处理能力也在不断提高。大数据是新常态,而机器学习的进步对大规模数据集产生了更大的需求。随着人工智能的不断向前发展,收集的数据数量变得越来越有价值。


与此同时,我们逐渐意识到机器学习和数据科学不是客观的。数据集反映了它们构建条件相同的偏见。算法和统计模型是由人和具有议事日程的公司构建的,它们的主观意识反映在这些算法和模型的功能中。


有大量算法偏见的例子。当人们发现搜索“非专业发型”时,Google的搜索算法受到了审查,Google不相称地显示了黑人妇女的形象(她们拥有专业发型)。Google将一些黑人照片归类为大猩猩后,从它的一些图像识别算法中去除了“大猩猩”的分类。ProPublica报道了一个令人深感不安的算法偏见的例子,在法庭程序中,作为保释、判决和假释程序所使用的程序算法,黑人一贯受到过重处罚,白人一贯受到过轻处罚。算法都带有种族歧视。


接受新的互联现实将是一个过程,而不是目的


这些结果表明“数据驱动”与“客观”并不完全一致。他们质疑当前最先进的机器学习算法的适用性,尤其是在诸如执法等已经陷入种族偏见的领域。即便如此,大多数献身技术的新手仍然怀着算法可以解决政府歧视的天真想法。


也出现了一些令人鼓舞的怀疑主义迹象。当谷歌和亚马逊披露向军方出售产品的谈判时,谷歌的Maven项目和亚马逊的Rekognition人工智能工具都成为头条新闻。两家公司的员工都举行抗议活动,给公司领导写信,并威胁要辞职。技术工人的团结,他们的诉求很大,产生了作用。Rekognition被奥兰多警察局拖走了。谷歌退出了Maven项目。监视产业综合体很好的建立起来,它并不是不可抗拒的。


欧盟一直引领着数字监管。被遗忘的权利导致超过650000个请求删除数据。通用数据保护条例(GDPR)正在打击脸谱网和谷歌公司,它们将面临十亿美元左右的罚款。
个人缓解措施,诸如使用密码管理器,安装隐私工具(如EFF的HTTPS Everywhere浏览器扩展),以及切换DNS供应商(如CloudFlare的1.1.1.1,它使用加密的DNS协议),可能会有帮助。不幸的是,个人行为永远不够。打击像美国国家安全局、谷歌和其它监控巨头这样的大型组织的联合力量需要有组织的努力。


随着科技侵入我们生活中最隐私的方面,我们必须将这一现实更可怕的方面带到光明之中,必须要求公司和政府对他们收集的数据更加透明。接受新的互联现实将是一个过程,而不是目的。对数据、隐私和监视的了解越多,就越能将这些问题带入到主流意识中,在那里,这些问题或许可以得到解决。