08-07
02

如何防止采集

之前写了很多关于采集的文章,这次说说如何防止采集吧。
防采集主要的办法就是给采集增加难度:
1.混淆字符串在文章中,再把这些随机字符串设置成统一的白色。
这样会给采集增加很大难度,但同时对搜索引擎不友好。

2.随机ID插入采集关于位置。
懂得采集的人都知道,采集需要先写一套规则,这套规则是固定不变的,如果我们在规则处写入随机字符串,那么规则就无从下手。如:
动易的:
<td  class=pv110title colSpan=2 zzz="{$ArticleID}">{$ArticleTitle}</td>
DEDE:
<div class="content"  zzz="{dede:field name=ID/}">
            {dede:field name='body'/}<br />
            {dede:pagetitle style='select'/}
</div>


3.web Service做防盗链

文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags: 采集
相关日志:
评论: 0 | 引用: 0 | 查看次数: 722
发表评论
昵 称:
密 码: 游客发言不需要密码.
内 容:
验证码: 验证码
选 项:
虽然发表评论不用注册,但是为了保护您的发言权,建议您注册帐号.
字数限制 1000 字 | UBB代码 开启 | [img]标签 关闭