采集时发现数据会漏，怎样解决

正版额外

我做了一个规则，套用去采几百个网址，采完之后，看到有些字段是空的，但是规则测试时都能抓到呀，为啥批量采就是空的呢

ym · 发表于 2016-11-3 10:23:03

出现这种情况，是爬虫生成的数据规则不太适用，一般有如下几种解决方法：
1、对于抓漏的字段，要分析一下它的网页结构dom，如果是有多种网页结构，可以自定义xpath来解决，也可以做多个规则来解决。
2、如果是定位不准确的话，规则里做上定位标志映射，可以精确采集范围，参考教程《定位标志精确采集范围》

正版额外 · 发表于 2016-11-3 10:35:22

好的，我检查一下规则，谢谢了

Fuller · 发表于 2016-11-3 10:42:09

正版额外发表于 2016-11-3 10:35
好的，我检查一下规则，谢谢了

如果委实解决不了，可以把主题名帖出来，有管理员权限的开发人员会帮你诊断一下问题

共 3 个关于本帖的回复最后回复于 2016-11-3 10:42

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页