2020-04-11 09:00
在2015年5月15日星期五这个七千年一遇的日子,百度站长平台挂出公告《百度将逐步取消referer关键词显示 站点数据更安全》,一个简短的公告,关注和讨论的人似乎不多。不过这可能会是一件影响深远的事情。
一、百度做了什么
a)从百度https化说起
实际上这件事情的开始要从几个月前的羊年春节说起:百度选择在流量比较小的春节期间,悄然把搜索全站切换到https。到现在百度已经是全站https化。大家都知道https比http更加安全,不带“S”的http在传输过程中是明文的,也不对传输双方进行验证,在传输过程中的任何一方都可以对数据进行修改。
说个段子:一个黑客黑下了一个妹纸的路由器,看到妹子正在刷微博,于是找到了妹子的微薄账号。还给妹子的浏览器弹窗说:早点休息。
HTTP传输过程中不仅内容是明文的,传输层还可以把修改的内容返回给用户。在百度启用HTTPS之前,DNS劫持这件事情在中国广泛存在。在这一方面有许多灰色利益链,比如说:
● 直接劫持跳转(例如上淘宝A商品页面会先跳到某个B商品页面)
● 上网的时候给你在URL后面加个小尾巴(比如在百度url后面加个tn=,百度是要为这个流量来源付费的)
● 嵌入一段js或者一个iframe给你弹广告
● 修改网页中的广告联盟ID,窃取其他站长的联盟收入
● 修改cookies中的一些信息,创造成不存在的广告(例如用户是直接进入淘宝的,但是经过修改referer和cookies被当成淘客来源进入的)
● 修改百度搜索结果中的竞价排名甚至自然排名
● 分析你的上网行为,把你的数据出售给第三方:有人搜个“人流”以后收到医院打来的电话
以上只是列举一些常见的行为,实际还有更多花样,都触目惊心。事实上百度每天要处理很多这类投诉:
百度在收到无数用户投诉之后,决心解决这个问题。于是就有了后来的百度全站HTTPS的出现。
b) 什么是REFERER?
REFERER全称是:HTTP(s) REFERER。这个东西在HTTP的header中,浏览器Referer用来告诉服务器我是从哪个页面链接过来的,服务器籍此可以获得一些信息用于处理。