目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
爬取到的结果总是顺序错乱是怎么回事呢?
建立规则之后,可以正常爬取数据,我根据得到的结果,去对照原始网页,发现与爬取的结果顺序有所差异,比如原始网页是1234,爬下来的结果可能是而且爬取的结果,还有很多重复的条数。
连续点击的顺序是怎么样遍历的
attach]2311[/attach] 实际上我需要的是每个尺寸对应每个颜色的库存,但是跑出来的结果是跳开的,帮忙看看什么情况
样例复制抓取的数据与网页上的顺序不一致
如题,抓取一个表格数据,做啦样例复制,点 测试 得到的表格 顺序和原表不一致 样例1没有class值,样例二有,原版就是这样间隔有class值的,该怎样定位?
请问一下提取下来的数据和网站的数据顺序不一致怎么办
规则名:违法违规629下午 提取下来的数据和网站上的数据顺序不一致, [align=center]比如[/align]这个是网站的数据: [align=left][attach]9644[/attach][/align] [align=left][align=center]这个是提取下来的数据,[/align][/align] [align=left][attach]9645[/attach][/align] [align=left]数据的顺序不一致,请问这样要怎么办?
爬虫路线有多个线索时执行顺序
爬虫路线有多个线索时执行顺序
层级抓取的,设置爬虫群需不需要考虑先后顺序
层级抓取的,设置爬虫群需不需要考虑先后顺序
线索执行顺序问题咨询
请问集搜客在会员中心批量导入线索时,导入的线索顺序是和excel表格里是一样的吗?还是只是在没有重复记录的时候才是顺序一样的?
规则的连续动作是怎样确定先后顺序的?
,规则二, a,点击国家和地区那个下拉框 b,点击CN-中国 c,输入条件 d,点击检索 规则二里地四个动作是怎么确定顺序的
数据采集、爬虫路线、连续动作三者的执行顺序
一、基本概念 1.1 数据采集 数据采集指的是我们在“创建规则”工作台定义的抓取内容。1.2 爬虫路线 爬虫路线指的是在“爬虫路线”工作台定义的线索,包括下级线索、翻页线索和模拟点击等。
天猫评论按时间顺序采集方法
/a/text(),'累计评价')] 2,点击排序框://*[@class='tm-current'] 3,点击时间排序://*[@class='tm-r-time'],这个还需打开[/size][size=16px]高级设置取消模拟点击,设置上延时
同一主题名下多个规则执行顺序
同一个主题名有多个规则,每个网址按照什么顺序去匹配找到适合的规则?
天猫淘宝如何按时间顺序搜集评论
天猫淘宝如何按时间顺序搜集评论,如题我想按时间排序后抓取最近的评论该怎么样操作
天猫评论采集如何按时间顺序进行?
1、采集天猫商品的评论,如何按时间顺序进行?2、试采集了5页,按理说每页天猫评论只有20条,也就是共100条数据,但采集完毕却有800多条数据是怎么回事?
怎么爬取网页深一层数据?
快速爬虫只能获取网页第一层数据,当网页内有链接,就无法爬取二层网页数据,该怎么爬取呢?
关于模拟动作层级顺序和在一个页面抓取多个数据错乱的问题
第一个问题: [attach]5971[/attach] 想要抓取“商品介绍”和“规格与包装”两个页面的数据。因为“规则与包装”页面要抓取的项目较多,我采取的是边测试边继续添加抓取内容的方式。发现一个问题,在刚开始添加抓取内容的时候数据都是正确的,但是添加到接近或者超过一半的时候会出现数据错乱的现象,即添加抓取内容的名称和顺序是对的[attach]5973[/attach]整理箱设计(从网页上“存储”部分开始分成两个整理箱) [attach]5975attach]第二个整理箱数据重复循环第一个整理箱的前三个数据和所有数据项都在一个整理箱里面的情况一样 请问数据错乱的问题应该怎么解决