目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
层级抓取
层级采集时有数据没有爬下来,提示”抓取失败(超时)……”。然后我按建议的将滚屏次数换成了4、滚屏速度换成了-1(然而我并不知道这是啥意思),然后重新抓取,有时在打数机那儿会提示“抓取成功,但爬虫规则还有优化空间以提高抓取速度。
层级抓取
使用层级抓取时,第二层比第一层搜集到的线索个数多,虽然使用VLOOKUP,也能使他们合并的正好,但是能否解释一下,为何第二层线索多于第一层
层级抓取问题
层级抓取设置的第二级抓取内容只有三个,但最后爬数据显示的是整个二级页面的内容,为什么啊 [attach]3934[
层级抓取问题
做完了样例映射但没有抓取到网页上所有的信息。定位之后抓到的结果不正确。第一级任务名为 第一级名字, 第二级任务是app_information
层级抓取失败
[attach]4386[/attach] 而我的出现这情况 [attach]4387[/attach] 2、第一级抓取的网址抓不完全3、第一级抓取的网址有部分是错误的,出现非正常网址如:/gp/slredirect/picassoRedirect.htmlqualifier=1483667904&id=4686482199134860&widgetName=sp_btf4、第二级抓取图片只有显示一张
层级抓取问题
层级抓取后,第二级网页只抓到一条内容,第一级网址是全的,是怎么回事啊?看了下两级规则是连起来的,主题命名也没错,求解? [attach]8833[/attach]
层级抓取问题
[attach]3935[/attach] 这是什么原因啊?
层级抓取问题
在层级抓取中,如果想要抓取二级网址里面的全部文本内容,是要在二级规则里面将所有信息一一做映射吗,要映射的内容太多,有没有什么简单的方法一次将所有内容映射
层级抓取错误
我的一级规则名称是 浙数文化 二级规则名称是 浙数文化文章评论详情 目前一级规则可以抓取,设置页数爬虫 但是二级规则测试正常但是抓取数据不行
做不了层级抓取
[attach]10888[/attach] 做层级时,始终没法翻页与层级抓取
怎样做层级抓取
帮忙看看,我一个网页里面有两种结构,第一种是详情,我最终要抓取的数据,第二种相对于一个链接,这个链接抓取的数据中的url又是第一种结构的线索
层级抓取匹配失败
层级抓取时,为什么按照教程弄规则弄完后,用打数机抓取的时候只抓到第一条线索之后就说匹配失败?
层级抓取附件内容
如何用层级抓取附件内容 附件链接地址的规则是科技政策汇项目详情 下一级怎么获取这个附件的内容
层级抓取翻页问题
[i=s] 本帖最后由 Eating66 于 2018-2-28 22:23 编辑 [/i] 两层抓取时,设置了翻页,但只输出了两页
层级抓取,怎么集搜
层级抓取,集搜怎么弄