快捷导航
二级规则测试的时候没问题,但是爬取结果有部分数据出现了信息错位,不知道怎么解决,求各位大佬帮助,规则名:知乎谷歌华为一级,知乎谷歌华为二级

1558352206(1).png
1558352297(1).png
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2019-5-20 23:12

Fuller 管理员 发表于 2019-5-20 23:12:33 | 显示全部楼层
定位标志20190520231008.png
右边那一栏数据,即使用上定位标志映射,也容易混淆,因为他们的class都一样。这种可以用自定义xpath,用contains()函数,基于网页上的文字“收录”,“感谢”,“参与”等进行定位。自定义xpath的一些案例参看:https://www.gooseeker.com/doc/thread-701-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 采集知乎上关于华为鸿蒙的问题和回答
  • 分词和分类检索平台使用手册
  • 用爬虫采集机场出租车进场出场数据的公告
  • 摘取泉港区政府工作报告中的数字遇到的问题
  • 调度设置参数说明

热门用户

GMT+8, 2019-9-21 09:07