Lucky嗨嗨 初级会员 发表于 2017-10-11 21:52:34 | 显示全部楼层
Fuller 发表于 2017-10-11 21:29
你的xpath表达式用了绝对定位两个斜线就表示从网页最顶上的html节点开始定位。
而是应该相对于每个样例的 ...

帮帮我吧,很急!
举报 使用道具
Fuller 管理员 发表于 2017-10-11 22:48:22 | 显示全部楼层

你的第一级规则没有按照我说的修改。另外,修改的时候,只要“内容表达式”就行了,兼做定位
举报 使用道具
Lucky嗨嗨 初级会员 发表于 2017-10-11 23:02:29 | 显示全部楼层
本帖最后由 Lucky嗨嗨 于 2017-10-12 15:49 编辑
Fuller 发表于 2017-10-11 22:48
你的第一级规则没有按照我说的修改。另外,修改的时候,只要“内容表达式”就行了,兼做定位
...

我又改了一下,您能再帮我看看嘛?遇到一个新的问题,就是对摘要的定位,我做了定位但是测试的时候还是有一个摘要没有爬取下来,如图所示,我在想,用xpath精确定位的时候根据两种结构的摘要,我将两个结构的xpath合并了,可是在定位标志映射的时候也是两种结构,我只 映射了一种普遍的结构,而另一种结构还是没法做定位标志映射啊!难道定位映射也可以做两个?
图片1.png
举报 使用道具
Lucky嗨嗨 初级会员 发表于 2017-10-12 01:15:07 | 显示全部楼层
Fuller 发表于 2017-10-11 22:48
你的第一级规则没有按照我说的修改。另外,修改的时候,只要“内容表达式”就行了,兼做定位
...

您好,我在做定位的时候,因为百度搜索“地质信息产品”的时候出现了两种不同的摘要结构,我做的定位只适用于普通的,而之前没有爬出来的摘要该怎么做定位啊?
举报 使用道具
Lucky嗨嗨 初级会员 发表于 2017-10-12 16:16:12 | 显示全部楼层
Fuller 发表于 2017-10-11 22:48
你的第一级规则没有按照我说的修改。另外,修改的时候,只要“内容表达式”就行了,兼做定位
...

我又改了一下,您能再帮我看看嘛?遇到一个新的问题,就是对摘要的定位,我做了定位但是测试的时候还是有一个摘要没有爬取下来,如图所示,我在想,用xpath精确定位的时候根据两种结构的摘要,我将两个结构的xpath合并了,可是在定位标志映射的时候也是两种结构,我只 映射了一种普遍的结构,而另一种结构还是没法做定位标志映射啊!难道定位映射也可以做两个?
图片1.png
举报 使用道具
Lucky嗨嗨 初级会员 发表于 2017-10-12 18:56:31 | 显示全部楼层
Fuller 发表于 2017-10-11 22:48
你的第一级规则没有按照我说的修改。另外,修改的时候,只要“内容表达式”就行了,兼做定位
...

能再帮我看看嘛?可能是回复的位置不太对,你可能没看到……13楼的

举报 使用道具
Fuller 管理员 发表于 2017-10-12 21:44:18 | 显示全部楼层
Lucky嗨嗨 发表于 2017-10-12 18:56
能再帮我看看嘛?可能是回复的位置不太对,你可能没看到……13楼的

这次怎么不用自定义xpath了?因为定位标志有变化,就不要用定位标志映射,用自定义xpath吧
举报 使用道具
Lucky嗨嗨 初级会员 发表于 2017-10-12 21:51:11 | 显示全部楼层
Fuller 发表于 2017-10-12 21:44
这次怎么不用自定义xpath了?因为定位标志有变化,就不要用定位标志映射,用自定义xpath吧
...

可是只用自定义xpath摘要还是不全,还是像上图中的一样,那个缺失的摘要没有……

举报 使用道具
Fuller 管理员 发表于 2017-10-12 22:19:35 | 显示全部楼层
Lucky嗨嗨 发表于 2017-10-12 21:51
可是只用自定义xpath摘要还是不全,还是像上图中的一样,那个缺失的摘要没有……

...

针对那个缺失的摘要,看看xpath有什么特别在自定义xpath在增加一个 | 式子
举报 使用道具
Lucky嗨嗨 初级会员 发表于 2017-10-12 22:28:41 | 显示全部楼层
Fuller 发表于 2017-10-12 22:19
针对那个缺失的摘要,看看xpath有什么特别在自定义xpath在增加一个 | 式子
...

现在增加的 | 式子就是针对哪个缺失的摘要的,不知道为啥还是不行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 19:31