3 9568

自定义xpath问题

木木西里数据 于 2021-11-12 10:24 发表 [复制链接]
合肥工业大学-列表页-招标信息-S2Y
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2021-11-12 11:13

木木西里数据 金牌会员 发表于 2021-11-12 10:25:24 | 显示全部楼层
无法采集到showQuickDetail("2021/11/11/","20KVULWQEP5BD94A"); 中的20KVULWQEP5BD94A
举报 使用道具
gz51837844 管理员 发表于 2021-11-12 11:07:16 | 显示全部楼层
木木西里数据 发表于 2021-11-12 10:25
无法采集到showQuickDetail("2021/11/11/","20KVULWQEP5BD94A"); 中的20KVULWQEP5BD94A

关于xpath中特殊字符的转义,可以参考这个贴子:【新提醒】XPath中特殊标点符号的转义 - 使用交流 - 集搜客GooSeeker网络爬虫
对于你想取的那个字串:20KV.。。。。。。。
可以使用自定义xpath:
image.png



举报 使用道具
wangyong 版主 发表于 2021-11-12 11:13:39 | 显示全部楼层
木木西里数据 发表于 2021-11-12 10:25
无法采集到showQuickDetail("2021/11/11/","20KVULWQEP5BD94A"); 中的20KVULWQEP5BD94A
  1. concat('http://zb.hfut.edu.cn/provider/#/publish/',substring-before(substring-after(./td/div/a/@onclick,',"'),'"'))
复制代码


用这个xpath
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 02:01