目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
被参照和参照节点应该都是线索对应的节点的子节点
出现这个报错了 请问要怎么解决呢
怎样参与讨论获积分?
我在会员中心看到 [align=center][attach]1801[/attach] [align=left]我需要积分,可以参与这个活动吗
参与用户信息爬取,规则问题
主要目标是爬取参与用户的一下信息: 用户名(text做映射) [color=Red]LV等级用(用Span下attributes
我参与了知乎讨论为什么没有给我积分?
我是根据会员中心的这个告示做的 [align=center][attach]1802[/attach] [/align]
新人请多多关照
请问有谁知道这个软件能不能爬取拼多多的数据啊
按照教程,把抓取的照片匹配到了表格中,但是照片都显示不出来,请问怎么办呢?
按照教程,把抓取的照片匹配到了表格中,但是照片都显示不出来,请问怎么办呢?
照片跟XML怎么合起来?
下载的图片在另一个文件夹,xml文件有几千个,怎样他们都合并到excel中?
照片跟XML怎么合起来
我用一个规则抓到了xml文件和照片,我想要把它们关联起来,就是照片和对应的信息要一一对应起来,怎么做到呢?
按照教程翻页翻不了
按照教程设置完抓取规则后,在爬虫线索哪里用记号线索设置翻页。不过设置好了之后用DS大数机搜,发现翻不了页
js参数翻页问题
网站是利用js参数做的翻页,每一页的url都是不变的。
调度参数设置失败
没有运行爬虫群,也没有正在调度中,为什么不能修改参数呢? [attach]8085[/attach]
调度设置参数说明
本帖最后由 ym 于 2019-5-28 10:03 编辑 [/i] 很多用户会用爬虫群来实现自动采集入库,可能有些参数用得不对如果一开始不太清楚每个参数怎么设置的情况下,可以先不做修改直接点击确认,因为每一个参数都会有默认值,这些默认值对大部分网页是通用的后面发现采集数据不完整或遇到反爬或需要额外调整的情况,可以重新修改参数值。DS打数机的配置菜单或高级设置菜单所设定的参数,再来填写调度设置的相关参数。[b]参数值范围说明[/b][/align][/td][td=346][align=left][b]参数作用[/b][/align
爬的时候有没有网页快照
爬完后,是否能获取网页快照数据。
按照教程无法爬翻页数据
https://www.matta.org.my/members 这个网址下面那个next我不知道用哪个节点作为翻页记号,求解。
抓取淘宝按照时间评价故障
目的:想抓取按照时间排序的商品评价 一级规则:time-goto (跳转累计评价页面) 二级规则:time-sort(选择按照时间排序) 三级规则:time-grab (抓取前20各评价和商品名称) 故障说明:运行规则,抓取完第一条线索商品评价后