目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
关键内容一定要勾选吗?
如果你需要完整且全面的数据,最好每个抓取规则都设置关键内容(一个整理箱设置至少一个关键内容),这是检验规则有效性的一种方法,能知道哪些页面采集失败了,并且能从中分析出失败的原因进而修改规则,重新激活失败线索进行补采,这样就能把你需要的数据采集全
关键内容能不能只用文本来判断
几个网页结构相似,但是又不同。用网页左上角的文本,amazon.com, amazon .com.de.利用文本的不同,勾选关键内容,在同一个主题下 ,自动执行不同规则。 但是貌似试过不行,求教为什么?
抓取规则不勾关键内容会怎样
测试的时候提示要勾关键内容,我想问抓取规则不勾关键内容会怎样
勾选了关键内容的话是不是如果翻页翻到某一页如果没有相关内容会中断掉?
勾选了关键内容的话是不是如果翻页翻到某一页如果没有相关内容会中断掉?
勾了关键内容后,如果采不到是会停下来的么?
勾了关键内容后,如果采不到是会停下来的么?
为一定能抓到的抓取内容设置“关键内容”
这个是什么意思? [align=center][attach]918[/attach][/align]
想问下选词的时候怎么才能选中全部
选词的时候点选的全部只是这一页的全部,想要直接全选所有词该怎么弄?
关于展开全部内容的问题
为什么模拟点击没有展开全部内容呢? 任务名:广州农村商业银行美篇2 [attach]12746[/attach]
能不能选择网页里一部分数据爬取?
比如每个页面有20个数据 我只想要前10个就好了
需要下拉页面才能加载全部内容的网页如何提取全部元素?
[b]问[/b]:我在抓取一个需要下拉页面才能加载全部内容的网页,采集的时候它只会提取没有完全加载前的元素。Grande, Helvetica, Arial, sans-serif]1,自动滚屏:只需在DS打数机上打开自动滚屏参数,就能在抓取的时候Helvetica, Arial, sans-serif]但是,有些网页,滚到底下的时候,上面的就消失了,如果一直滚到底才抓取,上面的抓不全
关键内容抓取不下来
filter[/url] 主题名是:平台1 设置关键内容抓取后,抓取的文本并不是想要的文本。。。不知道是怎么回事,请大牛帮忙解答,万分感谢! [attach]10004[/attach]
选定一个微博博主用关键词搜索结果,部分内容无法抓取。
选定人民日报的微博,搜索日本,结果显示1042条,翻页经常出错,我是把几次结果拼起来的。更让我无语的是,很多内容没有被抓取到。 我试了下第一页,发现就缺了七八条微博没有被抓到。难道点选DIV的时候有什么问题。 求教大神,如何解决部分微博正文没有被抓取的问题。另外,怎么翻页会顺畅些。我的操作是更换Xpath的选项,经常不灵。论坛里面的教程没看懂。
能不能搜索一个网站的关键词
能不能搜索一个网站的关键词
列表数据能全部抓取,对应网页内容只能抓取第一个,怎么解决?
=s] 本帖最后由 shengcongzhu 于 2017-1-12 11:34 编辑 [/i] 医生列表可以翻页抓取全部内容医生详情只能抓取第一个 求大神指点,谢谢
快速爬取为什么不能爬取微博超级话题爬取全部话题内容?
请问为什么选择了爬取全部内容,始终无法全部采集 [attach]15752[/attach] 采集了好几次都会在某一个地方中断