最后登录 1970-1-1
Fuller 发表于 2019-11-29 23:38 也可以从断掉的那里开始爬,因为网址中含有页码,把断掉的网址构造出来
最后登录 2025-4-21
心诚泽霖 发表于 2019-11-30 09:21 好的,谢谢你,是不是我一旦关掉DS窗口就没法看哪些是断掉的了? 还有,我是不是只能按下面链接1.1这个来 ...
您需要 登录 才可以下载或查看,没有帐号?立即注册
Fuller 发表于 2019-11-30 10:12 快捷采集是可以看线索状态的,但是,这个情况看不了,因为即使没有出现你要的内容,也会出现今天的内容, ...
心诚泽霖 发表于 2019-11-30 10:19 这个抓取错误的有办法批量导出吗?网址太多了,一个一个看确实很麻烦
Fuller 发表于 2019-11-30 10:30 目前还没有导出功能
心诚泽霖 发表于 2019-11-30 11:18 好的,非常感谢! 还想问个问题,想我这种爬取 原创+关键词 微博,处理快捷采集的“微博关键词搜索结果 ...
Fuller 发表于 2019-11-30 15:54 通常不用“原创”这个筛选条件,而是把所有的相关微博都采集下来,然后过滤一下,凡是转发别人的就不要 ...
心诚泽霖 发表于 2019-11-30 17:10 之前发现所有微博太多了,爬取速度太慢,所以想只爬取原创微博 再请教个问题,对于那种抓取出错的网址, ...
Fuller 发表于 2019-11-30 20:02 你的这些网址,每一个是采集单页还是要翻页?失败比例太高了,不太正常。你的网络速度怎么样?用集搜客网 ...
心诚泽霖 发表于 2019-11-30 20:41 基本上都有翻页的,用集搜客爬取之前我都会登陆微博的。我的宽带速度还可以啊,200M的宽带,非晚上高峰期 ...
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2025-4-21 15:23