以前曾经很单纯的以为搜索引擎在你做了一次搜索后,所做的事情只是记录你的搜索行为,并把结果列出来,至于你点击第几个结果,他们是不统计的.
但是在查看了搜索结果页的源码以后,这个单纯的念头消散了.显然每个结果的超链接上都加了点额外的动作.百度如此,google也如此
那么他们会提取哪些参数呢?截包看一下
在百度搜索hello world,然后点击排名第二的网站,是IBM.同时截取数据包,观察发出的第一个数据包,忽略user-agent,host,referer, cookies等部分(cookies中也许会有些有用的参数,但因为是加密的代码,恐怕研究不出什么东西)
Tags: 参数
除非是一个个getBytes,弄得自己很费解,以前也没这样啊,再来我也继承了ProRequestProcessor进行重新编码,怎么会这样呢?最后发现,form 中的method 中竟然是get,改成post,问题解决!
另外附上一份filter的过滤方法:
另外附上一份filter的过滤方法:
复制内容到剪贴板 程序代码
public class SetCharacterEncodingFilter implements Filter {
// ----------------------------------------------------- Instance Variables
// ----------------------------------------------------- Instance Variables