网站是依靠哪些技术跟踪监视用户的?

2013-12-12 12:58:19来源:极客范作者:

某些监视方法是比较容易想到的,比如,当你登录网站的时候,它就可以知道你是谁了。但是这些网络监视系统是如何通过你的上网行为记录你的个人信息呢?
广告系统经常通过追踪用户行为的方法来建立用户信息库,以定位

某些监视方法是比较容易想到的,比如,当你登录网站的时候,它就可以知道你是谁了。但是这些网络监视系统是如何通过你的上网行为记录你的个人信息呢?
广告系统经常通过追踪用户行为的方法来建立用户信息库,以定位谁是目标客户。如果你曾经访问过某个商业网站,之后不久你又在其他网站看到了这个商业网站的广告,那么,这个广告系统可能已经在工作了。

IP 地址

IP地址是确认用户身份的最基本的方法。现今,在家或者办公室,你电脑很可能与你的其他网络设备共享同一个IP地址。从你的IP地址,网站可以大致确定你的地理位置 —— 还不能精确到街道,但是一般能确认你所在城市或者区域。你可能见过那些弹窗小广告通过显示你的地理位置来伪装自己,广告系统就是这么干的。IP地址可以变,并且可以被其他用户所共享,所以它并不是一个追踪单个用户的好方法。但是,IP可与本文介绍的其他技术相结合来确定你的地理位置。

image

HTTP Referrer

当你点击一个链接的时候,你的浏览器会加载这个页面,并且告诉这个网站你是从哪来的。打个比方,你单击了一个How-to Geek网站的一个指向外部网站的链接,那么这个网站会知道你是从How-to Geek的哪一篇文章点击进来的。这个信息是被存储在Http referrer信息头中。

某些监视方法是比较容易想到的,比如,当你登录网站的时候,它就可以知道你是谁了。但是这些网络监视系统是如何通过你的上网行为记录你的个人信息呢?
广告系统经常通过追踪用户行为的方法来建立用户信息库,以定位谁是目标客户。如果你曾经访问过某个商业网站,之后不久你又在其他网站看到了这个商业网站的广告,那么,这个广告系统可能已经在工作了。

IP 地址

IP地址是确认用户身份的最基本的方法。现今,在家或者办公室,你电脑很可能与你的其他网络设备共享同一个IP地址。从你的IP地址,网站可以大致确定你的地理位置 —— 还不能精确到街道,但是一般能确认你所在城市或者区域。你可能见过那些弹窗小广告通过显示你的地理位置来伪装自己,广告系统就是这么干的。IP地址可以变,并且可以被其他用户所共享,所以它并不是一个追踪单个用户的好方法。但是,IP可与本文介绍的其他技术相结合来确定你的地理位置。

image

HTTP Referrer

当你点击一个链接的时候,你的浏览器会加载这个页面,并且告诉这个网站你是从哪来的。打个比方,你单击了一个How-to Geek网站的一个指向外部网站的链接,那么这个网站会知道你是从How-to Geek的哪一篇文章点击进来的。这个信息是被存储在Http referrer信息头中。当你下载当前页面的内容的时候,http referrer也会被发送。例如,一个网站有广告或者跟踪脚本,那么你的浏览器会告诉这个广告商或者这个网络监视系统,你正在浏览哪一个网页!所谓的”web bug”是很小的,由单个像素组成的不可见的图片,它利用HTTP referrer去偷偷的监视你。它们也被用来监视你所打开的邮件,前提是你的邮件客户端会下载图片。

Cookies 和 跟踪脚本

Cookies是一些信息片段,网站可以将它们存储在你的浏览器上。它有许多正当的用途——比如,当你登陆你的网络银行,cookie可以记录你的登录信息。当你改变对一个网站的设置,那么cookie也会将它记录下来,这样你的设置就可以一直在你浏览的过程中有效。

image1

Cookie也可以用来识别和记录你在某个网站上的行为。这并没有什么大的问题——这个网站可能想知道你在浏览什么网页,这样它就可以知道你体验如何。而真正有危险的是那些第三方的Cookie。

image2

尽管第三方cookie也有一些正当的用途,但是它们常常被广告系统用来监视你在不同网站的行为。许多网站——并不是大部分网站都会有第三方的广告和监视脚本。如果两个不同的网站有相同的广告或者监视系统,那么你浏览器上关于这两个网站的浏览历史就可以结合在一起被追踪和分析了。那些来自社交网站的脚本同样有追踪的功能。比如说你登录了Facebook,然后你浏览另一个网站,而这个网站上有Facebook的那个“Like”(点赞)按钮,那么Facebook就可以知道你浏览了这个网站。Facebook保存了一个cookie去记录你的登录状态,这样这个Like按钮(它本身就是脚本的一部分)就可以知道你是谁了。

Super Cookies

你可以清空你的cookies——事实上,我们这里有一篇专门的教程教你如何清空浏览器的cookies。然而,清空cookies这招已经不怎么起作用了——“super cookies”正在兴起。super cookie的一个例子就是evercookie。super cookies如evercookie会把cookie数据存在不同的地方–比如,flash的cookie,Silverlight storage,浏览器历史记录,或者说html5的本地存储中。一个非常高明的记录用户的方法是,每次用户登录一个网站,网站都记录在一个很小的图片中记录一个特有的颜色。这些图片会被存放在用户的浏览器缓存中,这样一来,这个颜色就可以用来识别这个用户了。

 

当网站发觉你在某些地方删除了super cookie,那么它会利用其他的地方的存储的数据将这些信息恢复过来。例如,你可能清除了浏览器的cookies,但是你没有清除flash中的cookie,那么,这个网站会将flash中的cookie信息重新复制到你浏览器cookies中。这样来说super cookie的生命力是很强的。

image3

User Agent

每次你的浏览器链接一个网页的时候,它都会向网站发送User Agent信息。这些信息包括了你浏览器的信息和操作系统信息,它们会存储起来,并被广告系统利用来分析如何投放广告。如果想知道更多关于User Agent的信息,请参阅维基百科上的User Agent。

image4

浏览器指纹

每一个浏览器实际上都具有自己的特征。网站可以检测你的操作系统类型、浏览器版本、安装的浏览器插件及其版本、操作系统的屏幕分辨率、下载的字体、所在时区和其他的信息。看吧,就算你禁用了浏览器cookie,那么也有其他信息来识别你的浏览器。

有个叫Panopticlick的网站可以告诉你这些信息是如何使用的。事实上,在110万人中,才会有一个人的浏览器跟你有相同的设置。

image5

当然了,肯定有其他的追踪技术。每年花在这技术的钱可不少,而且有许多人每天都在绞尽脑汁想出新招来追中你——evercookie的出现就是一项证据。

关键词:网站