防止网站内容被采集的几个方法
1、网站内容采用多套模板,随机模板,给采集程序设置过高的门槛;但这招对整站采集器不起作用。
2、网站内容里随机加入本网站的版权,如域名,网站名称,网站主人,而这些标识可以分开来写,或中间加短横之,或换成全角字符,防止被自动过滤。
3、给我们网站里的图片打上个人的的logo标识,比如在图片的右下角打上网站的名称+域名;采集者把我们的网站的图片采集过去,不可能1张1张图片都ps;所以,他们采集我们的网站内容,等于变相地帮助我们宣传网站。
4、这招比较损。如果对方采集的程序几乎以及你的网站同步,那么你可以采用这招了。先在我们的网站里添加几篇标题以及文章开头结尾都非常正规的内容,而在文章内容中间偷偷加入非法关键字,有多非法就要多非法,多加入几个,隐蔽工作做的也要到位,然后在我们的网站robots.txt文件里禁止搜索引擎抓取这几篇文章。等对方采集了这几篇文章后,我们立即删除个人的网站上的这些文章,然后向采集者服务器当地网警举报。嘻嘻。后果怎么才能,大家可想而知了。
