目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
我采集南京行政许可信息中断,如何继续采集
我要采集[url]http://app.nanjing.gov.cn/cxnj/xkcf/xkcf_bm_gq.jsp?n=GONGSHANG[/url]这样的网站信息,页数很多,但是我采集到1000页左右中断,我看下每页的网址都是一样的,请我我如何才能从1000页往后去采集
采集过程中 中断了,还有未采集数据,如何继续抓取?
采集过程中 中断了,还有未采集数据,如何继续抓取? [attach]2224[/attach]
我在采取数据的时候如果突然中断了采集,该怎么继续刚刚哪里采集
中断之后还能继续采集么
如何继续抓取翻页网页
我已经会采集当前页面的数据,但是需要翻页到后面的页码去采集,要怎么操作
如何采集onlink以及后续使用
kplb=2 二级采集,群里人员建议用onlink,现在疑问如下: (1)如何采集到onlink,我用增加内容,点击测试没有采集到onlink内容; (2)采集到onlink后如何用到二级采集任务中,是不是要先写好二级采集任务,然后怎么替换成onlink的链接呢?
连续动作后打数机没有继续采集数据
页面有“显示更多”才能看到完全的内容,规则里设置了单击的连续动作,但是显示出来后就不再采集数据了,哪里出问题了呢?
DS打数机中间停止后怎么继续
如题,我用DS打数机采集数据,中间断电了导致采集停止,我怎么继续采集?
抓取过程中网页挂掉,如何刷新页面继续抓取?
如图所示: [attach]8780[/attach] 网页抓取过程中,网页挂掉,打数机显示匹配失败,如何能刷新此页面继续抓取
爬取大量数据无故中断能否继续爬下去?
但是我们发现最后只爬到今年的4月,请问如何接着四月继续爬往年的数据,而不是激活线索重新开始爬取。
求助,采集到的数据断断续续
求助,采集搜狗上的阅读数信息时,结果数据断断续续,不完整
设置好之后,打数机不能翻页继续采集。
[i=s] 本帖最后由 小北男孩 于 2019-8-23 19:40 编辑 [/i] 网址是这个 https://www.wipo.int/branddb/en/# 测试成功抓取数据的 规则编号:品牌库采集规则 [attach]11252[/区域定位和记号定位试了好多都无法成功翻页 [attach]11253[/attach] 这是表格内容 我只采集的11254[/attach][attach]11255[/attach] 翻页有这上下两部分,都试过无法翻页,数据采集结果一直都是储存的第一页的数据
有什么办法能让爬虫在中断的地方继续爬数据吗
[table=98%] [tr][td]网速太慢导致爬虫爬到一半浏览器加载不出来就停止采集了,有什么办法能让爬虫在中断的地方继续爬数据吗
有什么办法能让爬虫在中断的地方继续爬数据吗
网速太慢导致爬虫爬到一半浏览器加载不出来就停止采集了,有什么办法能让爬虫在中断的地方继续爬数据吗
如何跳过匹配失败,继续执行剩余的线索?
如何跳过匹配失败,继续执行剩余的线索? [attach]3610[/attach]