主题名是   b高血压医生列表_个人
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2017-10-3 10:09

沙发
Fuller 管理员 发表于 2017-10-1 18:25:34 | 只看该作者
你想给哪个抓取内容设置成这个样子?
举报 使用道具
板凳
whusim 中级会员 发表于 2017-10-1 18:46:13 | 只看该作者
贡献值
举报 使用道具
地板
Fuller 管理员 发表于 2017-10-1 21:19:06 | 只看该作者

你的规则,给“贡献值”这个抓取内容生成的规则是
  1. following-sibling::div[position()=3]//*[@class='blue']/text()
复制代码
那么,你应该改写成:
  1. following-sibling::div//span[contains(text(), '贡献值')]/a/text()
复制代码
去掉position()=3有利于提高适应性,position函数最容易引起不适应问题





举报 使用道具
5#
whusim 中级会员 发表于 2017-10-3 10:09:18 | 只看该作者
Fuller 发表于 2017-10-1 21:19
你的规则,给“贡献值”这个抓取内容生成的规则是那么,你应该改写成:去掉position()=3有利于提高适应性 ...

谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 10:16