cnBigger.COM
因为逼格儿 更有逼格

作为基石的Cookie正在蚕食世界 隐私渐行渐远

Cookie 是现代互联网的基石。

编者按:Cookie这个东西一般人也许不怎么在意,但这个20年前发明的东西现在已经无所不在,成为现代互联网经济的基石。Lou Montulli当初发明这个东西的时候本意是让它成为保护用户隐私的工具,现在它反而变成了广告巨头收集有关人们渴望、需求、喜好的庞大数据库,甚至制造族群分裂的工具。事情究竟是如何演变到今天这样的呢?techonomy的一篇文章为我们剖析。

1990年代末的时候,当网站第一次用我们的名字欢迎我们回来的时候,我们很多人都会感到一阵激动。直到那个时候,我们每次回到之前上过的网站时,都得一再告诉它我们是谁并且要经过繁琐的登入过程。就像回忆不起谁订过煎蛋卷的服务员一样,那时候的互联网对谁干过什么也没有记忆。网站没法知道你是老访客,甚至也没记录过你访问过它的众多网页中的哪怕一个。

在这些第一批的“欢迎”消息当中还有一小块看不见的文字,小到不超过几百个字符的长度。你的web浏览器能看见它,但你不能。它的名字叫做“cookie”。它的工作是记住你之前是否访问过,是的话就不需要再重新登录了。设计这个东西的出发点是为了维持你的隐私和安全;这一小块文字既不是软件代码也并不知道你的名字或者你在web的其他地方干了什么。它只知道你计算机的浏览器曾经访问过特定网站,这样如果你再回来的话它就知道了。

那卑微的计算机cookie今天已经演变成为一个比过去更加无所不在、能力更强也更加邪恶得多的东西。现在它已经成为一个产业的中心——覆盖全世界的数字广告业价值已达数十亿美元。这究竟意味着什么?全世界对此均产生了极大的担忧。这一工具的使用被少数技术巨头垄断着,其行为已经变成(对个人隐私、安全等)日益增加的担忧之根源。Cookie是我们全体做出的大妥协的使能者——这种妥协就是用浏览高度定向的广告换取对web的免费访问。但这项一度内敛的工具现在所促进的数据收集与分析,最终可能会威胁到民主本身的未来。

发明了cookie的那个人现在在想自己是不是该让它来到这个世上。1994年,Lou Montulli 23岁,当时他正在做后来成为Netscape浏览器的东西。他想到了一个自己认为相当不错的主意。他最近从堪萨斯大学(在那里的计算机中心时他开发了了Netscape的前身Lunx)搬到了北卡罗莱纳。作为Netscape的创立工程师,1994年夏的时候他负责要找出办法让网站能记住之前来访问过的访客的信息。主要问题是如何给web创建一个购物篮,让用户在选择了第一样东西之后能够不断地添加新的东西进去。

Montulli就想出了cookie这玩意儿。这只是在你姥姥特定网站时下载到你浏览器上面的一小段文字。就像寸衣处的换取牌一样,当你拿着它回来取衣服时寸衣处能认出你是谁。它可以回忆起你看过了哪些页面或者你已决定购买哪些产品。这个概念现在对于整个web的工作机制已经变得必不可少。Montulli的这个想法后来被授予了专利(其雇主Netscape是专利的实际拥有者,但从未收到过一分钱的版税),他说“我们是想支持各种应用,购物篮也是其中之一。在cookie之前,除了再次直接登录进去以外,web并没有记住哪怕一个用户的方法。”

Montulli和Netscape那帮人其实还想过其他一些给网站增加记忆的方法,但那些方法都会显著提高在整个www上追踪用户的能力,他们希望避免这个现在经营着航空软件公司JetInsight的Montulli说:“cookie的设计主旨是避免跟踪,因为只有发起的网站能够设置和接收那些cooike。”

但有一点这些早期浏览器的发明者都没有预见到,那就是当有人访问特定网站或者浏览特定内容时其他网站和服务将自己的cookie插入到浏览器的能力。这部分是由于现在web的工作机制已经非常不同。今天网页的创建已经不仅仅是访问一个服务器来做到的,而是通过从许多不同的服务器上抓取材料最后汇编成用户看到的东西。

广告界起初推断,当网页加载进用户计算机时,将该广告植入该网页的独立运行的服务器也能将cookie插入到用户浏览器上。对此RealMedia(最早开发软件将广告植入网站的公司之一)的创始人Dave Morgan解释:“很自然他们会想,‘为什么我们不能让广告服务器也使用那个cookie呢?’”

如果广告服务器能够利用cookie识别特定用户——或者确切地说,识别那位用户的计算机和浏览器软件的话,它就能做个性化广告了。为此,它利用一段现有的名为“referrer header(其实是早期web开发者的误拼)”的代码,这段代码可识别广告加载到了哪个网站上。referer header放在浏览器里面,是web浏览器和服务器用来传输信息的网络协议的一部分。发送cookie的时候广告服务器就发送请求给referer header,从而识别出用户在哪个网站上看到了特定广告。

很快,众多交付内容给网页的服务企业开始加载cookie用于跟踪用户、定向广告以及一般的观察行为。Morgan说,Cookie协议的简洁性“创造力创建大量cookie的能力。”再加上其他的web技术,所谓的“第三方cooike”就能在用户即便不上原先网站的情况下也可以跟踪到用户。对此Montulli的看法是“那些公司想出了玩弄这套系统的办法。”

随着广告网络的发展与整合,他们开始购买、销售、共享有关用户已经“cookied(cookie化,在业界已经被广泛使用的一个词)”的信息。有了这些信息,他们就可以建立详细的web用户档案,这些档案对于数字广告的发展极其重要,而我们这些被定向的web冲浪者对此却毫不知情。

管理广告型cookie的系统背后是同时也跟着网站和内容的庞大数据库。Cookie再加上能告诉用户看了什么内容或者搜索了什么东西的技术,使得广告业可以做出那些无所不在的广告——它们能在你浏览一个个网站时如影随形地跟踪你。当你观看《纽约时报》的汽车版时,你可能也会看到汽车广告,甚至告诉你最近的经销商在23.5英里处。如果那个广告是由同一家广告网络管理的话,它还可以跟踪你访问的下一个网站。

到了2000年的时候,全球最早的大型广告技术公司之一DoubleClick已经利用cookie来跟踪对上百万(使用其技术展示广告的)网站的访问。Google也已经把自己的cookie放到用户计算机上,用来跟踪他们的搜索情况。2007年,Google以31亿美元的价格收购了DoubleClick,这在当时被认为是一项历史性的交易,是对广告的加倍下注。此举让Google掌握了对消费者行为数据宝库的空前访问,并且掌控了2000亿美元web广告市场的很大份额。正如当时反对此项合并的FTC所言,Google得到了“一个有关渴望、需求、喜好的庞大数据库,这个数据库可以用来观察、传唤、归档、跟踪,并且用于各种各样的目的。”

类似地,Facebook也获得了监控用户行为的极大能力。大多数情况下,其全球范围内的22亿用户均自愿提供自己的姓名、位置、喜好(厌恶)、职位、相片、年龄、个人史,以及自己在Facebook上的浏览史。

但是这个社交网络和媒体巨头知道的不仅仅是你在Facebook上看了什么。它还知道你在全球多达1100万其他网站上干了什么。这是因为其中有很多都允许你“用Facebook账号登录”或者配置了Facebook的“Like”按钮。里面包含有代码,或者说是一个像素,再加上第三方cookie,就能说出你看了什么。Morgan说:“大家不理解因为所有那些‘Like’按钮到处都是自己就会被跟踪了——哪怕自己不在Facebook上面。”

前苹果CEO John Sculley在2018年3月时告诉CNBC说:“Facebook这台机器跟之前创建的任何机器都不一样。这是一种非常漂亮的广告销售模式。”不过Facebook澳大的数据池也让他成为一台“计算化的宣传”机器,令其他人可以“操纵民意”。这就像在前互联网时代电话公司利用你的拨打模式(你在什么地方打电话,通话时长多少,你跟谁聊天,你什么时候订购新产品等)来卖广告给俄罗斯机器人(会在你通话的时候插入广告)一样。

这种种的发展态势已经令Montulli等人警觉,他们原先以为cookie应该是用来保护大家隐私,而不是监控和记录用户的每一次敲击键盘。Web早期的浏览器开发者开始设计工具,让反对跟踪的用户可以屏蔽浏览器上的第三方cookie。这对与当前被广泛使用的跟踪来说仍然只是个补救措施。Montulli说:“我们增加了很多功能让用户可以知道有多少cookie被添加进浏览器,从而可以删除它们。现状就是这种情况。这20年来基本上没有太大变化。”

不幸的是,很少人愿意劳烦自己去寻找这些工具并屏蔽第三方cookie,这使得像Facebook和Google这样的数字广告公司成为了地球上最赚钱的公司之一。Martin Sorrell 说,Cookie“让我们可以更加有效地定向投放广告并进行沟通。” Martin Sorrell是经验丰富的从业人员,曾任广告巨头WPP的CEO,2018年初被迫离开公司,随后创办了数字化广告、数据及内容公司S4 Capital。“它们让我们得以在合适的时间以合适的方式接触用户。”

如果只是一点个性化广告跟踪你的话似乎也没什么大不了的。但几个情况的发展已经激烈改变了平衡:一是Google和Facebook令人难以置信的影响和广度;更快更好更强大的数据和分析;以及web在日常生活的核心地位。定向广告已经把免费的web商业化了,并且成为想要扭曲政治、欺骗公众或者售卖假冒产品的工具。

像Philip M. Napoli(杜克大学公共政策学教授)这样的学者认为,cookie所促进的数字广告模式鼓励了假新闻以及他所谓的“parasitic journalism(寄生新闻)”的崛起。这意味着那些并做原创报道或者事实核查的“新闻”。此类发布基本上就是把其他媒体发掘出来的材料重写写一遍,再赋予煽动情绪的观点,从而鼓励点击,目的是产生广告收入。Montulli哀叹,甚至一些正当的新闻组织,为了提高收入,也会利用标题测试和故事概念技巧来换取更多的点击,尽管媒体公司通常都没有展现出一点羞愧。比方说,BuzzFeed就训练自己的员工掌握“文化地图”来让内容流行起来。

Montulli说:“对于广告是否有利于互联网及我们的社会互动出现了更广泛的讨论。这是一个非常困难的问题。我开始认为权衡之下是不值得的。鉴于广告收入的本质以及它对大家写文章方式的影响,纯粹广告驱动的媒体开始展现出许多的漏洞以及很多的负面影响。”

在像斯里兰卡这样的地方,影响已经发展到暴力动荡的地步。在美国,广告支持的模式已经让俄罗斯支持的公司,在2016年美国总统大选期间建立假冒Facebook账号来制造政治不和,以及购买定向广告抹黑或者嘲笑希拉里。

摩根大通前软件高管Bob Visnov现在经营着一家技术与互联网咨询公司,Timegen Consulting。他说:“我们已经把自己训练成为了商业原因而接受数据收集的人,但现在这已经被用来针对政治方面的原因了。我不知道俄罗斯的行动是否影响了此次选举,但我并不认为这事儿难以置信。”很多人对此表示同意。

欧盟对此已经做出了响应,实施了全新的General Data Protection Regulation(GDPR,一般数据保护条例)。该条例要求网站所有人告诉用户cookie是怎么工作的,并且在用户使用cookie时要明确同意。EU的要求也许走得还不够远,因为更多的人已经意识到,当他们来到网站并以烦人的个性化广告换取免费或廉价服务时,自己也在放弃可能被用来针对他们的隐私信息。数字广告高管Sorrell说:“争议均围绕着隐私展开。根本性的问题是消费者是否知道cookie的存在,以及是否知道自己注册要同意什么。”

其他一些业界的资深人士则认为,光是披露相关信息是不够的,消费者需要更多的保护。作为一名数字出版的高管,前Vila Media LLC的CEO Gretchen Grant发现Facebook的洞察对于销售广告非常有价值。但“它的缺点是缺乏透明性,哪怕是有GDPR。我不清楚谁掌握了我的什么信息,要找到答案需要花太多的时间了。随着技术通过cookie的使用控制了我们越来越多的生活,我们会不会更加关心自己的数据呢?我的意思是说,我不再随意提供我的电话号码了。”

20年前当Montulli开始做web的时候,Netscape即将以第一个大型浏览器的面目出现,让普通人家也能网上冲浪。他说:“我以为我们能够将全世界有相似想法的人联合起来,让人人都掌握数据、科学与经济的信息。”他希望这能帮助大家确定客观事实。“可是现在大家上网是为了寻找类似想法的人以强化不好的想法。我们似乎正在分裂并发明我们自己形式的现实。这是很可怕的。”(本文编译自techonomy,cnBigger配图)

赞(0) 打赏
分享到: 更多 (0)

评论 抢沙发

觉得文章有用就打赏一下博主吧

支付宝扫一扫打赏

微信扫一扫打赏