目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
抓取出错?
[attach]7235[/attach]
抓取出错!!
规则名:《奶粉-天猫》(一级规则),《奶粉-产品详情》(二级规则) 请问为什么一级线索抓取不了了,同时二级线索抓的东西也没出现
翻页抓取京东数据中途出错
求助各路大神 翻页抓取京东数据抓取到第14也的时候出错: 等待采集任务 根据线索编号搜索的网页信息为第一页的信息
爬取拉勾网数据出错
爬取拉勾网数据时总是出错,被迫停止,不知道咋回事
Youtube快捷采集 抓取出错
[attach]14272[/attach] 如图,用的快捷采集抓取youtube数据,一开始的任务正常运转,之后一直采集失败
测试正常但抓取出错
主题名:睿洋 线索页面:[url]https://www.qixin.com/company-chart/structure/6bbc3c8b-3430-4ff7-9deb-2a9c819a1946[/url] 我猜想可能是因为页面是需要左右横拉移动才能显示完全的关系???
多个关键词抓取出错
我的采集任务叫“油气储运关键词检索”,在输入动作里设置了多个关键词,用“;;”分隔,但是运行结果并不是按输入的关键词检索的,请问这里应该如何设置?
采集数据出错
采集过程都显示抓取成功。抓了2次,第二级故意线索等待时间变长。为什么数据还是这样。是我超时时间设置的问题吗
携程网机票抓取出现匹配出错
要抓取的携程网网页中的机票,设置的抓取规则相当简单,只有两个一个规则和样例复制,没有翻页。改变抓取网址是自己将某一天的网址批量导入到规则里的,直接导进了爬虫数据。以往都很好用,但是今天出现了匹配失败的问题,重新制作了规则后,仍然有大部分网页出现问题。
网页抓取到某一页后抓取出错,匹配失效,DS打数机不见报错
如图,想抓取知乎某一用户专栏发布的文章的所有评论,评论区的结构比较统一,设置了内容标记、翻页、下一页的定位标记映射、样例复制,能成功抓取前几页(500多条评论里只能抓到前80多条),后面貌似出现了循环抓取前面评论的情况,并且在打数机的规则验证下显示“匹配失效”,想请教一下大神是哪里出错了,应该怎么改正?另外如果页数多于50页的话能全部抓取完吗?
抓取亚马逊商品列表,出错
[i=s] 本帖最后由 tuesday1 于 2018-9-22 08:25 编辑 [/i] 规则名:汽车_亚马逊商品表 亚马逊的商品搜索列表,对不同的搜索词,页面的显示有稍稍不同,也做了嵌套,但是规则还是不能通用。 对于这个网址是可以的: https://www.amazon.cn/s/ref=amb_link_1?ie=UTF8&bbn=1774808071&rh=i%3Aautomotive%2Cn%3A2126200051%2Cn%3A1774808071%2Cn%3A%212146614051%2Cn%3A%212146613051%2Cn%3A1947899051&pf_rd_m=A1AJ19PSB66TGU&pf_rd_s=merchandised-search-left-9&pf_rd_r=T9WWTQ3H46E0WQZ2K46T&pf_rd_r=T9WWTQ3H46E0WQZ2K46T&pf_rd_t=101&pf_rd_p=a0c4b942-e3cf-4771-ba92-67136b3ea67e&pf_rd_p=a0c4b942-e3cf-4771-ba92-67136b3ea67e&pf_rd_i=1947899051 对于这个网址就不行:https://www.amazon.cn/s/ref=amb_link_85?ie=UTF8&bbn=1774812071&rh=i%3Aautomotive%2Cn%3A1947899051%2Cn%3A%212146613051%2Cn%3A%212146614051%2Cn%3A1774812071%2Cn%3A255995071&pf_rd_m=A1AJ19PSB66TGU&pf_rd_s=merchandised-search-left-9&pf_rd_r=T9WWTQ3H46E0WQZ2K46T&pf_rd_r=T9WWTQ3H46E0WQZ2K46T&pf_rd_t=101&pf_rd_p=a0c4b942-e3cf-4771-ba92-67136b3ea67e&pf_rd_p=a0c4b942-e3cf-4771-ba92-67136b3ea67e&pf_rd_i=1947899051
DS打数机运行翻页规则,出现抓取错误
规则名:点评_商户列表 问题说明: 可以正常翻页,正常抓取,但是一个线索下面, 中间会出现某个页面是无效网址页面,导致该条线索抓取中断; 不过正常浏览是不会出现这种情况。至于是不是这个原因,导致抓取错误,还烦请帮忙查看下,谢谢。
抓取表格数据 发现抓取结果有错误
抓取表格数据 发现抓取结果有错误 1 有少抓一行的情况,也有单个格 抓串行的 , 怎么解决 。 谢谢
抓取规则校验时出错怎么办?
[b]现象描述[/b]: 在MS谋数台的“创建规则”工作台上,右边有个按钮“校验”,用来查看、测试和校验抓取规则。点击“校验”按钮以后,在MS谋数台下部的窗口中显示自动生成的校验规则,右边有个按钮“验证规则”,点击以后出现以下提示:] [align=left][b]原因分析[/b]:[/align] [align=left]这个提示表示整理箱中的抓取内容没有设置“关键内容”,至少给一个抓取内容设置“关键内容”以后,生成的校验规则才不是空的,如果校验规则是空的,就会出现以上提示。align=left]上图的问题在于显示的内容不好理解,下个版本将修正这个问题,显示提示:[i]没有定义校验规则,因为没有为抓取内容设置
抓取规则校验时出错怎么办
=viewthread&tid=690&page=1&extra=#pid1340]制作规则的常遇问题[/url] > 抓取规则校验时出错怎么办[/size][b][size=2] [/size][/b] 这个提示表示整理箱中的抓取内容没有设置“关键内容”,至少给一个抓取内容设置“关键内容”以后,生成的校验规则才不是空的,如果校验规则是空的,就会出现以下提示。