快捷导航
二级规则测试的时候没问题,但是爬取结果有部分数据出现了信息错位,不知道怎么解决,求各位大佬帮助,规则名:知乎谷歌华为一级,知乎谷歌华为二级

1558352206(1).png
1558352297(1).png
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2019-5-20 23:12

Fuller 管理员 发表于 2019-5-20 23:12:33 | 显示全部楼层
定位标志20190520231008.png
右边那一栏数据,即使用上定位标志映射,也容易混淆,因为他们的class都一样。这种可以用自定义xpath,用contains()函数,基于网页上的文字“收录”,“感谢”,“参与”等进行定位。自定义xpath的一些案例参看:https://www.gooseeker.com/doc/thread-701-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 在限定论域的时候,为什么“任何一个”表示
  • 数理逻辑是讲什么的?
  • 内容分析法中的抽样
  • 豆瓣电影的情感分析
  • 一本在线图书——社交网络分析介绍

热门用户

GMT+8, 2020-2-29 09:27