网页抓取

网页抓取主要有三个方面： 1、搜集新出现的网页； 2、搜集那些在上次搜集后有改变的网页； 3、发现自从上次搜集后已经不再存了的网页，并从库中删除。

共 1 讨论,7天新增 0 个讨论,30天新增 0 个讨论

综合问题文章悬赏简介

系统能改进一下系统的验证码,现在的完全无法防御注册机灌水，搞那个手工移动拼接的。

验证码

赞同0  2922 浏览  4 评论 marco_hsu 2018-12-16 16:45

上次的版本记得后台可以看到官方的应用平台，怎么这次新本安装后看不到了？

新版

赞同0  2938 浏览  1 评论 哈哈23131 2015-02-12 02:37

文章在文章页中增加如下代码可以解析网易云音乐

var mediaRegex = [{"regex":"","controller":""}, {"regex":"music.163.com\/#\/song\\\?id=(\\\d+)","controll":""}]; jQuery(...

二次开发

赞同2  2754 浏览  1 评论 三叔 2020-01-10 14:56

文章 wecenter 页面静态化代码

function createHtmlFile($FilePath,$Content){ // 去掉文件名中的一些非法符号 $FilePath = preg_replace('/[ <>\'\"...

静态化

赞同5  3789 浏览  5 评论 sl514 2015-08-27 12:34

转载来源[虎嗅](http://www.huxiu.com) 搅局者360面临的巨额诉讼官司即将开庭。百度起诉奇虎360违反“Robots协议”（又称机器人协议或爬虫协议）抓取、复制其网站内容的不正当竞争行为，并索赔1亿元人民币。这个官司...

搜索引擎 搜索百度

赞同28  5291 浏览  30 评论 zhengqiang 2013-10-17 11:33

文章网站更换空间，网站搬家心得整理

**最新修改：该方法使得用户头像和图片无法更新成功，问题待解决** 如果只更换域名，只需要在后台修改地址即可，但如果要换空间，那么尝试我的方法： **旧网站空间操作：** 1. 确保后台已经关闭伪静态 2. 备份数据库和打包整站文件 ...

网站搬家

赞同5  3555 浏览  10 评论 commyleung 2014-07-05 12:35

文章没啥

嗯其他人都没事，就我有没啥

漏洞

赞同1  2205 浏览  2 评论 sl514 2016-02-14 14:51

文章 wecenter采集方案，数据导入插件分享

有时候为了做一些测试和演示站以及其他一些原因，想让网站内容变得丰富，页面变得更好看。就需要采集一些数据填充到网站里，所以给大家分享一个很好用的采集软件。后羿采集器 https://www.houyicaiji.com/这是一个小白...

采集 采集器

赞同0  2093 浏览  1 评论 君笑尘 2022-09-03 13:59