网页抓取

网页抓取主要有三个方面： 1、搜集新出现的网页； 2、搜集那些在上次搜集后有改变的网页； 3、发现自从上次搜集后已经不再存了的网页，并从库中删除。

共 1 讨论,7天新增 0 个讨论,30天新增 0 个讨论

综合问题文章悬赏简介

文章 WC文件缓存

最近发现数据库一直吃紧，于是写了文件缓存，把那些侧边的数据缓存到文件里周期更新。

二次开发 开发

赞同2  2827 浏览  7 评论 Alu 2016-03-17 12:56

文章建议后台增加“自动折叠空评论”的开关

现在后台有“自动展开评论”的设置，但很多回复都是空评论，导致自动展开的评论框影响面板美观。建议后台增加“自动折叠空评论”的开关

建议

赞同1  1541 浏览  4 评论 freemangl 2020-10-20 08:44

文章测试富文本的html

今天面试遇到一个问题，假设一个类中只声明一个int类型，那么这个对象多大，这里先写出解决方案，首先引入内存计算工具lucene-core，复制 <dependency> <groupId>org....

测试

赞同1  3326 浏览  1 评论 三叔 2019-03-14 16:50

文章 .

话题

赞同1  1678 浏览  0 评论 imningfeng 2019-06-14 15:16

文章附件图片结构你知道在那配置吗？

你可以找到：system\config\image.php 这里面有配置头像，话题，问题和文章上传图片的配置。其中 min square 是调用对应的裁剪的后图片，而非原图，在开发图片调用过程中尽量少调用原图，网页加载也快，图片也不会变形...

二次开发 图片

赞同6  3580 浏览  1 评论 Alu 2015-01-06 20:50

起因是这样的。前几天，站外调用插件突然无法使用了，求救多次，也没弄好。数据库直接调用又不会，于是，在百度的帮助下，我想到了使用php file_get_contents函数。（新手不太懂php）试了试，发现用蜘蛛模拟工具竟然能抓...

站外调用

赞同0  2274 浏览  3 评论 222111 2014-09-11 16:24

文章谈谈我对WE未来商业化发展的一些建议

@zhengqiang 首先感谢站长辛苦付出开发出了WE并且开源给大家使用。我以前也是码农，不过混不下去，改行做电商了。深知开发WE的不容易。谈谈我对WE的看法吧！以前作为一个码农我只考虑程序够不够优秀，总是在小代码小功能上打磨。但...

运营

赞同3  2665 浏览  4 评论 洽汇网 2014-07-07 15:41