本帖最后由 FedRex 于 2017-10-26 11:57 编辑

求解,为什么前面的用这种xpath可以定位,后面例如小区介绍的却定不了位

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2017-10-26 16:43

沙发
bowieD 金牌会员 发表于 2017-10-26 11:42:58 | 只看该作者
本帖最后由 bowieD 于 2017-10-26 11:47 编辑

可以把主题名和网址贴出来看看,这个xptah是所有li节点下text()节点中包含“小区介绍”的text()节点
举报 使用道具
板凳
FedRex 初级会员 发表于 2017-10-26 12:02:11 | 只看该作者
本帖最后由 FedRex 于 2017-10-26 12:03 编辑
bowieD 发表于 2017-10-26 11:42
可以把主题名和网址贴出来看看,这个xptah是所有li节点下text()节点中包含“小区介绍”的text()节点 ...

图三是主题名和规则,我主要问题是如果没做xpath定位,抓数据的时候网页里的小区内容里的结构会变化,想利用文本精确定位,就不会出现该抓小区介绍的,却抓到了配套设施的内容,但是不知道例如小区介绍的xpath该怎么写才能定位成功
举报 使用道具
地板
bowieD 金牌会员 发表于 2017-10-26 14:23:27 | 只看该作者
本帖最后由 bowieD 于 2017-10-26 14:26 编辑
FedRex 发表于 2017-10-26 12:02
图三是主题名和规则,我主要问题是如果没做xpath定位,抓数据的时候网页里的小区内容里的结构会变化,想利 ...

后面的信息都不是li节点,全部都是div节点,所以你那么些肯定是定位不到的,试试这个//*[@id='house_feature']/div/div[contains(./div/text(),'小区介绍')]/div[last()]/text()

或者这个//*[@class='baseattribute clear'][contains(./div/text(),'小区介绍')]/div[last()]/text()
应该都可以


举报 使用道具
5#
FedRex 初级会员 发表于 2017-10-26 15:50:47 | 只看该作者
bowieD 发表于 2017-10-26 14:23
后面的信息都不是li节点,全部都是div节点,所以你那么些肯定是定位不到的,试试这个//*[@id='house_featu ...

谢谢,我用的是类似于这个xpath://div[contains(./div/text(),'小区介绍')]/div[last()]/text(),可以吗

举报 使用道具
6#
数据集 高级会员 发表于 2017-10-26 15:59:27 | 只看该作者
FedRex 发表于 2017-10-26 15:50
谢谢,我用的是类似于这个xpath://div[contains(./div/text(),'小区介绍')]/div[last()]/text(),可以吗 ...

能定位到就可以,xpath前面最好不要用“//“,用.//或//*
举报 使用道具
7#
FedRex 初级会员 发表于 2017-10-26 16:43:53 | 只看该作者
数据集 发表于 2017-10-26 15:59
能定位到就可以,xpath前面最好不要用“//“,用.//或//*

嗯嗯,谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-22 22:05