快捷导航
如图所示,我用class定位和#text定位都不能准确采到{联系方式}的链接,求大家给我看看怎么操作的,而且用#text定位测试时会提示确认xpath的正确性,第一次使用高级设置,感谢各位指点,拜谢
微信图片_20190423202829.png
微信图片_20190423202810.png
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2019-4-24 18:05

Fuller 管理员 发表于 2019-4-23 21:47:38 | 显示全部楼层
自定义xpath的一组教程参看:https://www.gooseeker.com/doc/thread-701-1-1.html

文本定位用函数test(),而不是#text

xpath的函数和完整的用法应该在百度上找点更全面的资料
举报 使用道具
Fuller 管理员 发表于 2019-4-23 21:47:38 | 显示全部楼层
自定义xpath的一组教程参看:https://www.gooseeker.com/doc/thread-701-1-1.html

文本定位用函数test(),而不是#text

xpath的函数和完整的用法应该在百度上找点更全面的资料
举报 使用道具
Fuller 管理员 发表于 2019-4-23 21:47:39 | 显示全部楼层
自定义xpath的一组教程参看:https://www.gooseeker.com/doc/thread-701-1-1.html

文本定位用函数test(),而不是#text

xpath的函数和完整的用法应该在百度上找点更全面的资料
举报 使用道具
mohany 中级会员 发表于 2019-4-24 16:47:53 | 显示全部楼层
Fuller 发表于 2019-4-23 21:47
自定义xpath的一组教程参看:https://www.gooseeker.com/doc/thread-701-1-1.html

文本定位用函数test() ...

用a标签找到了,采下来是a标签的所有数据,怎么用substring-before和substring-after筛选这个数据啊,不知道这段代码放在哪里,老师可以给我说一下怎么筛选吗,十分感谢
1556095377.jpg
举报 使用道具
Fuller 管理员 发表于 2019-4-24 18:05:35 | 显示全部楼层
mohany 发表于 2019-4-24 16:47
用a标签找到了,采下来是a标签的所有数据,怎么用substring-before和substring-after筛选这个数据啊,不 ...

这个网页结构是很规整的,根本不用做自定义xpath,用A节点下的href节点做一个内容映射。因为网页上的A节点太多,容易采集不准确,但是要采集联系方式,再用一个定位标志映射精确选定一下位置就行了。你看,含有联系方式这个A节点的LI节点具有@class='contactinfo-page'这个很好的定位标志。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 摘取泉港区政府工作报告中的数字遇到的问题
  • 调度设置参数说明
  • 集搜客网络爬虫软件实现自动网页截屏
  • 怎样使用搜狐新闻搜索列表快捷工具抓取关键
  • 用于清洗文本内容的Excel函数公式

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2019-7-18 01:34