本帖最后由 ym 于 2016-5-24 14:56 编辑

常见问题 > 制作规则—常见问题导航 > 制作规则的常遇问题 > 输出信息有重复/缺漏,怎么解决

最低学历、工作经验都是不限,招聘人数
1人,不知道为什么不显示,求教
qq截图201512031721.png

举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2015-12-3 17:56

ym 版主 发表于 2015-12-3 17:56:06 | 显示全部楼层
本帖最后由 ym 于 2016-5-24 14:55 编辑

首先分析一下出现这种情况的原因:
学历、经验、人数这三个抓不到数据,是因为定位到的class值相同,均为[@class='fl'],并且前面还有多个[@class='fl']节点,自动生成的xpath路径无法识别是哪一个[@class='fl'](因为没有指定次序),就默认是第一个[@class='fl']节点下的text(),而这个text()又刚好是空白的,所以会出现抓到空白的情况
1.1.png

解决方法:
方法一:右击整理箱,快捷菜单里选择首选项,再选择绝对定位
1.2.png
然后重新做内容映射给这三个抓取内容,再点击测试,就能抓到信息了,
1.3.png
数据规则里的xpath路径从class值定位变为用绝对路径定位,用li[position()=**]区分开了
1.4.png

方法二:双击抓取内容,勾选高级设置,选择自定义xpath,再选择文本内容、兼做定位,把自己写的xpath填进去并保存,如果没有语法错误的话,点击测试在输出窗口就能抓到目标信息,并且数据规则里的xpath也一并更新
1.5.png



举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 18:24