最后登录 1970-1-1
最后登录 2024-11-21
ml1691221 发表于 2016-3-2 11:46 我充值下载了。。但还有一个问题是会出现重复的xml文件,我设置的是翻页4次也就是一个用户爬取5页,有5个文 ...
您需要 登录 才可以下载或查看,没有帐号?立即注册
Fuller 发表于 2016-3-2 14:47 请注意这个容忍度是“下级线索”的,如果定义了下级线索,抓取本级的时候会为下级生成线索,也就是网址 ...
ml1691221 发表于 2016-3-2 15:42 规则是我下下来的,就是资源区里300积分的那个。 完了我观察了好几次,有时候就是第一页翻到第二页成功了 ...
Fuller 发表于 2016-3-2 15:56 我同事说你拼接出来的网址,那样的网址似乎不太正确
ml1691221 发表于 2016-3-2 19:59 http://weibo.com/u/1748277610?is_all=1#_0 http://weibo.com/u/1870722257?is_all=1#_0 http://weibo.c ...
Fuller 发表于 2016-3-2 21:14 现在还抓取不了?
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2024-11-22 08:22