目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
定位问题 测试和获取结果不一样
测试是好的 是我想要的数据,可是实际采集的时候就不是了 这里是不是该用到定位什么的 具体该怎么做 麻烦告知
测试结果正确, 但采集结果中数据缺失
=s] 本帖最后由 wangyong 于 2017-9-1 19:22 编辑 [/i] 规则名:戴尔主题内容 如测试结果所显示
测试结果中部分内容缺失
如果不定位标志,缺失的评论主题名、评论版块处显示的是评论内容,定位标志的话,则显示空白,这是什么原因导致的呢
测试规则时出现这样的结果?
[i=s] 本帖最后由 w228258549 于 2017-9-7 09:29 编辑 [/i] [attach]7671[/attach] 这是什么原因造成的?
主题名:senvol材料,测试结果与本地保存结果不同
senvol.com/5_material-results/ 采集表格内数据全部采集下来,规则名senvol材料,测试输出信息都是正确的
怎么快速对比测试结果和页面的数据是否一致
样例复制选好后,能不能直观的在页面上看到筛选的结果?经常有漏掉的节点,一个个看着测试和页面很麻烦。
做样例复制后,测试结果的产品数量和网页不符
做完[color=rgb(51, 51, 51)][size=3]样例复制进行测试,但是测试结果中只有31个商品信息。
规则测试没问题,但是采集结果有漏采。。。
[i=s] 本帖最后由 ym 于 2015-9-25 16:07 编辑 [/i] 问1:我的规则总是测试没问题,但是在打数机出来的结果就不对了谋数台上去查找原,工具->加载规则->按线索号,加载后会提示错误,要根据网页的具体情况调整映射关系 问3:总是这两个出不来结果2和7就比较难看了,但是,可以猜到你没有用定位标志映射,如果用了的话,也会想9和10,就容易找一个节点。attach]162[/attach] [/align] 答6:要用开发者模式写自定义过程,这个功能虽然开放了,但是还只是内测阶段鼠标悬浮到那里以后,按alt键,用上下键选择文件菜单中的冻结页面,就会把它冻结住,就能定义规则了,但是DS打数机有个环节目前还没有测试好
用了样例复制,点测试出来的结果不对。
用了样例复制,点测试出来的结果不对。如图所示,这是什么原因?
测试第1页正常,但文件夹中没有抓到任何结果
] 本帖最后由 verygood 于 2017-4-5 12:34 编辑 [/i] 是抓取百度搜索“辱母杀人案”的搜索结果[attach]6052[/attach] 结果文件中什么都没有: [attach]6053[/attach]
测试没问题,但是在打印机出来的结果就不对了
[b]问[/b]:我的总是测试没问题,但是在打印机出来的结果就不对了 [b]答[/b]:MS谋数台上,内容都是加载稳定了下来后才采集,DS打数机要提高速度,没有过多等待,如果要确保一个信息一定要采集到,就要设置“关键内容”
请教一个xpath问题,保存或测试后,修改结果回到原样
请教一个xpath的问题,我要抓这个数据,但是他格式不一样[attach]620[/attach] xpath这样写,测试可以达到效果,为什么输出结果就不行了呢?621[/attach] [attach]622[/attach] [attach]623[/attach] 在测试单箱没有问题,但是只要一保存或者一测试,所有的修改结果都被删掉了?
求助:定位编号不一致,但是测试抓取的结果内容一致
抓取微博地址和粉丝的数据 微博地址和粉丝数量的定位编号不一致 测试完毕后 为什么微博粉丝抓取的结果也是微博地址
在Python3.5下安装和测试Scrapy爬网站
Scrapy测试,敲一个基于Scrapy框架的爬虫程序[/b][/size] [size=3]新建一个Scrapy爬虫项目-*- coding: utf-8 -*- # Scrapy spider 模块 # 采集安居客房源信息 # 采集结果保存在bbsExtra.extractHTML(response.body) # 打印采集结果result).encode('gbk','ignore').decode('gbk')) # 保存采集结果print("采集结果文件:" + file_path)[/code] [size=3]启动爬虫,进入项目目录
测试页面js 测试插件js
测试页面js 测试插件js 这2个选项是做什么用?