网页抓取

网页抓取主要有三个方面: 1、搜集新出现的网页; 2、搜集那些在上次搜集后有改变的网页; 3、发现自从上次搜集后已经不再存了的网页,并从库中删除。

共 1 讨论,7天新增 0 个讨论,30天新增 0 个讨论

@zhengqiang 首先感谢站长辛苦付出开发出了WE并且开源给大家使用。 我以前也是码农,不过混不下去,改行做电商了。深知开发WE的不容易。 谈谈我对WE的看法吧!以前作为一个码农我只考虑程序够不够优秀,总是在小代码小功能上打磨。但...
用WC完全改造的虚拟商品交易平台
http://www.idaima.com/ 不需要注册、喜欢直接付钱下虚拟产品。 我这主要用于下载代码。  
没找到标题SEO优化,教程就自己写了个,效果还不错哦
wecenter功能很强大,但是依然有很对地方不利于优化。其中一个最头疼的就是标题。本来想着去帖子里找个教程,直接拿来主义的,后台来发现没有系统的,干脆自己写了个。 下面是代码部分,看官自行品味,可以优化文章,问答,话题等标题,至少符合SE...
社交化: 社交网络只是把人际关系简单地连接起来,然而这仅仅是一个开端。就消费习惯来 说,随着互联网的普及,消费者与消费者各是一个点,连接形成一个网络;商户与商户各是一 个点,连接形成一个网络;城市与城市各是一个点,连接形成一个网络;每个...
o2o
今天在群里说要分享的内链修改代码,我来履行承诺了。
效果如  http://www.sanshu.cn/a/38.html 内链是很多 站长都重视的一个SEO的步骤,不光可以引导蜘蛛去抓取,也能在别人采集你网站内容的时候带上你的链接。 本修改支持分类或话题或分类加话题的内...
一个查询IP信息的工具
    用于站长分析访问日志的时候使用。    作为网站站长,对蜘蛛的到来求之不得,一半不会屏蔽。所以很多程序员写爬虫的时候会伪造user-agent头信息,让...

热门话题

新手指南

帮助中心

we__center

个人主页

默认首页