这种问题如何解决?

error:选用含有class或id的DOM节点做定位标志映射

error:选用含有class或id的DOM节点做定位标志映射
举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2019-8-19 19:01

xandy 论坛元老 发表于 2015-12-28 15:37:34 | 显示全部楼层
本帖最后由 ym 于 2016-6-17 11:44 编辑

你需要选择的是红框里头的
做定位标志映射,必须选择具有@class或@id的节点,具体参看教程定位标志映射
1226选用含有class或id...回答.png
举报 使用道具
Fuller 管理员 发表于 2015-12-28 20:51:23 | 显示全部楼层
所谓定位标志,就是@class和@id,含有他们的html节点,比如上图的A节点,选中以后做定位标志映射。就能在抓取规则的xpath表达式中用上这个class或者id,就能提高抓取精度
举报 使用道具
betainfo2019 初级会员 发表于 2019-8-19 17:24:47 | 显示全部楼层
Fuller 发表于 2015-12-28 20:51
所谓定位标志,就是@class和@id,含有他们的html节点,比如上图的A节点,选中以后做定位标志映射。就能在抓 ...

那要是他没有@class和@id的节点   找他的父辈节点?
举报 使用道具
Fuller 管理员 发表于 2019-8-19 17:49:27 | 显示全部楼层
betainfo2019 发表于 2019-8-19 17:24
那要是他没有@class和@id的节点   找他的父辈节点?

可以用它的父辈或者更高级节点。但是,不要太远,太远的话,如果中间层次有变化,就会影响到规则的适应性
举报 使用道具
betainfo2019 初级会员 发表于 2019-8-19 18:05:26 | 显示全部楼层
Fuller 发表于 2019-8-19 17:49
可以用它的父辈或者更高级节点。但是,不要太远,太远的话,如果中间层次有变化,就会影响到规则的适应性 ...

那我能问您一下为什么会出现我加载统一规则    在相同的网页结构中   会出现如下不同的list定位内容啊???
而且我这个规则    对应的一个网址好用    一个网址不好用
111.jpg
222.jpg
举报 使用道具
wangyong 版主 发表于 2019-8-19 18:17:02 | 显示全部楼层
这个规则名是什么?两个不同的网址也发一下吧
举报 使用道具
betainfo2019 初级会员 发表于 2019-8-19 18:26:14 | 显示全部楼层
wangyong 发表于 2019-8-19 18:17
这个规则名是什么?两个不同的网址也发一下吧

我弱弱地问一句 我没有分享规则名你也能看到吗????两个网址

https://b2b.hc360.com/supplyself/712801027.html

https://b2b.hc360.com/supplyself/696061310.html

规则名:慧聪_商品明细

还有个问题 加载规则的时候出现这个问题
333.jpg
举报 使用道具
wangyong 版主 发表于 2019-8-19 18:56:26 | 显示全部楼层
1,第一个网址加载直接报错了,这两个页面结构不同,分析一下换别的定位标志
2,管理员可以根据规则名加载其他账号的规则
3,这个网址时间长了会跳转,然后存规则的时候就存跳转后的网址了
举报 使用道具
betainfo2019 初级会员 发表于 2019-8-19 19:01:44 | 显示全部楼层
wangyong 发表于 2019-8-19 18:56
1,第一个网址加载直接报错了,这两个页面结构不同,分析一下换别的定位标志
2,管理员可以根据规则名加载 ...

万分感谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 14:54