请问为什么谋数台显示出的xpath比之前多了<context>//*[@id='m']</context>
xpath直接写//*[@id='productMainName']突然定位不到位置了


举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2020-6-29 14:42

沙发
Fuller 管理员 发表于 2016-10-2 15:03:38 | 只看该作者
<context>表示这个dom节点位于iframe中,iframe还可以嵌套,表示多层iframe
举报 使用道具
板凳
liang616611974 新手上路 发表于 2018-11-8 18:38:27 | 只看该作者
哪有什么解决方案吗
举报 使用道具
地板
Fuller 管理员 发表于 2018-11-8 19:14:26 | 只看该作者
liang616611974 发表于 2018-11-8 18:38
哪有什么解决方案吗

你遇到的问题是发生在什么时候?

集搜客爬虫把XPath扩展了了一下,增加了<context>,每个<context>代表一个iframe,这个xpath的应用场景是有限制的。可以用在爬虫路线那里,也可以用在连续动作那里。但是不能用在数据规则那里,因为数据规则那里一定是在某个iframe内的,不会跨iframe,所以就用不上<context>
举报 使用道具
5#
ykmbllw 初级会员 发表于 2020-6-28 16:11:26 | 只看该作者
Fuller 发表于 2018-11-8 19:14
你遇到的问题是发生在什么时候?

集搜客爬虫把XPath扩展了了一下,增加了,每个代表一个iframe,这个xpa ...

CLASS定位中带了   <context>    怎么把这个数据提取出来     或者怎么写XPANTH  才正确
举报 使用道具
6#
内容分析应用 金牌会员 发表于 2020-6-28 17:06:16 | 只看该作者
ykmbllw 发表于 2020-6-28 16:11
CLASS定位中带了       怎么把这个数据提取出来     或者怎么写XPANTH  才正确
...

采集iframe中的内容,这是GooSeeker网络爬虫的特色。iframe中的内容跟普通网页内容一样做直观标注定义采集规则。只是要注意一点:来自不同iframe的抓取内容要放在不同的整理箱中。在MS谋数台的创建规则工作台上可以创建多个整理箱,如果要从iframe中抓取内容,给每个iframe都创建一个整理箱

举报 使用道具
7#
ykmbllw 初级会员 发表于 2020-6-29 09:51:02 | 只看该作者
内容分析应用 发表于 2020-6-28 17:06
采集iframe中的内容,这是GooSeeker网络爬虫的特色。iframe中的内容跟普通网页内容一样做直观标注定义采 ...

使用样例复制的时候  定位会被改变了
举报 使用道具
8#
内容分析应用 金牌会员 发表于 2020-6-29 14:42:17 | 只看该作者
ykmbllw 发表于 2020-6-29 09:51
使用样例复制的时候  定位会被改变了

你提供一个规则名称或者网址,技术看一下。
网址要能访问才行


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 14:50