该问题已被锁定!
3
关注
3803
浏览

wecenter网站如何做到防爬虫抓取数据?

AI智能回复搜索中,请稍后...

为什么被折叠? 0 个回复被折叠
jat 超级管理员 用户来自于: 广东省深圳市
2015-03-04 14:44
搜索引擎的蜘蛛也是爬虫
zhengqiang 超级管理员 用户来自于: 广东省深圳市
2015-03-04 13:13
基本上没考虑这部分的内容,目前仿抓取的操作大部分是在服务端执行,程序端可以做的并不多。杀敌1千自损800。。
sl514 中级会员 用户来自于: 江苏省苏州市
2015-03-04 11:07
如果人家要针对你的网站 机器爬取是防不住的。 你只能 1.图片打水印 2.文件防盗链 3.加入那种和背景色一样的超链接在文中 4.分页 其他没啥办法了。

关于作者

问题动态

发布时间
2015-03-04 11:00
更新时间
2015-03-04 14:44
关注人数
3 人关注

推荐内容

请问G_STATIC_URL这个变量是在哪里定义的?
安装时,第4步,获取base_url与base_dir的bug
大家有没有觉得wecenter收录很难?
自从wecenter被收购后,就没有任何动静了?
强烈建议WC标签中的全部问题的排序按照最后回复 而不是最后操作!
这个搜索问题 能不能改进一下,能不能更加智能点 (新倩女幽魂)
如何让同一个问题的不同回答通知单独出来而不合并?
恭喜wecenter重新开张,几个建议
爆改WeCenter网站上线测试,小伙伴们来给捣捣乱啊,可否乎?
请问后台能够恢复用户自己删除的内容吗?