目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
层级抓取
层级采集时有数据没有爬下来,提示”抓取失败(超时)……”。
层级抓取
使用层级抓取时,第二层比第一层搜集到的线索个数多,虽然使用VLOOKUP,也能使他们合并的正好,但是能否解释一下,为何第二层线索多于第一层
多层级搜索
第一层[url=http://bbs.xiaomi.cn/t-365844]http://bbs.xiaomi.cn/t-365844[/url] 第二层[url=http://bbs.xiaomi.cn/u-detail-6472890]http://bbs.xiaomi.cn/u-detail-6472890[/url] 第三层[url=http://u-thread-6472890]http://bbs.xiaomi.cn/u-thread-6472890[/url] 第一层的帖子发布时间为2011-09-10, 第三层的作者是“[color=rgb(51, 51, 51)][font=arial,][url
层级采集问题
1.两层规则的情况下,采集到的数据是怎么存放?
层级抓取问题
层级抓取设置的第二级抓取内容只有三个,但最后爬数据显示的是整个二级页面的内容,为什么啊 [attach]3934[
层级采集问题
218.94.78.91:19001/REG/f/announcement/announcementShow[/url],我的第一级规则名建设项目,第二级规则名建设项目2,爬虫采集的时候第一级采集全采集下来了,第二级采集只是其中我做规则的那条信息,请帮忙看一下,我也是根据教程[b]采网址做层级采集——以大众点评为例来学习的。
层级抓取问题
第一级任务名为 第一级名字, 第二级任务是app_information
层级抓取失败
[attach]4386[/attach] 而我的出现这情况 [attach]4387[/attach] 2、第一级抓取的网址抓不完全3、第一级抓取的网址有部分是错误的,出现非正常网址如:/gp/slredirect/picassoRedirect.htmlqualifier=1483667904&id=4686482199134860&widgetName=sp_btf4、第二级抓取图片只有显示一张
层级抓取问题
层级抓取后,第二级网页只抓到一条内容,第一级网址是全的,是怎么回事啊?看了下两级规则是连起来的,主题命名也没错,求解? [attach]8833[/attach]
层级抓取问题
[attach]3935[/attach] 这是什么原因啊?
层级抓取问题
在层级抓取中,如果想要抓取二级网址里面的全部文本内容,是要在二级规则里面将所有信息一一做映射吗,要映射的内容太多,有没有什么简单的方法一次将所有内容映射
层级抓取错误
我的一级规则名称是 浙数文化 二级规则名称是 浙数文化文章评论详情 目前一级规则可以抓取,设置页数爬虫 但是二级规则测试正常
层级抓取的时候,第二层失败
层级抓取的时候,第一层搜集链接都是对的,第二层在爬数据的时候把第一层的所有线索都访问了,但是在数据存放目录里面却只有一条数据第一个规则名:京东层级测试第一级 地址:[url]https://search.jd.com/Search?91&pvid=065b2b91557b4f3dafe5f4271d5267a0[/url] 第二个规则名:京东层级测试第二级
第一层级数据内容和第二层级数据内容关联
你好, 抓取的第一层级内容和第二层级内容分别存放在两个不同文件夹下的不同文件中,有把这两部分内容关联起来的方法吗如果都是1对1应该没有问题,如果第二层级内容有空的,数据会不会就串行了。例如: 第一层级:1.黄石国家公园 2.海军陆战队军港 第二层级:1.简介 2.空
层级采集的二层规则可以有多个上级线索吗
我想问一下,层级抓取中,第二层可以有多个上级线索吗?(比如,规则一第一层和规则二第一层 的下一级都可以是规则第二层吗)