网页抓取

网页抓取主要有三个方面: 1、搜集新出现的网页; 2、搜集那些在上次搜集后有改变的网页; 3、发现自从上次搜集后已经不再存了的网页,并从库中删除。

共 1 讨论,7天新增 0 个讨论,30天新增 0 个讨论

【问题】目前编辑器太多,导致各自接口不一样,无谓增加开发维护成本和系统错误;网站初始化后选择一种编辑器,日后最好不改变,否则会增加格式不统一的风险;问答网站是建立知识库,将来会进行较多文本搜索和分析。【建议】建议选择如下编辑模式:1. 选用...
官方可否尝试开发几套前端的模板,作为插件售卖?
一、平滑升级后台有必要存在平滑升级功能,不能保证用户的数据是否更改如:js、css是否为cdn处理。二、支付功能、悬赏功能、打赏功能三个功能其实就是营销功能,连支付都不能支付,我们拿什么钱敢买这个授权版呢,毕竟开源版就割成这样了,都没赚到钱...
求高手解答
WC_芋头_内容免登陆发布接口插件
WC免登陆发布插件;火车头或者别的采集发布工具,可以按照此数据结构 进行设计;这是问题的数据发布结构 data = { '__sign':'yu', 'type': 'cate', ...
你好,官方的编辑器能不能带自动保存的功能,比如写着写着中途有事情,可以从草稿里面导入,你看看discuz编辑器,多经典啊,用这么多年了
刚开始发现了wecenter感觉像是发现了新大陆一样! 我本身是做医疗的,想给医生和患者之间建立一个交流沟通的载体,并且没有在意太多细节(如:2W)…… 在本地机上修改测试,测试修改,现在感觉差不多,可以上线了…… 然鹅,最近看到了大家发的...

热门话题

盈利

颜色修改

新人引导

贴吧

权限控制