11#
jungle 新手上路 发表于 2016-9-7 11:01:19 | 只看该作者
Fuller 发表于 2016-9-7 09:58
是的,也不用做层级,也不用做样例复制,因为容器节点的定位标志映射相当于样例复制 ...

都做了映射,但是只能抓取第四天的数据,而且第四天的每站的数据都是相同的,用的是绝对定位,哪里出问题了?谢谢

3.png (24.59 KB, 下载次数: 716)

3.png
举报 使用道具
12#
ym 版主 发表于 2016-9-7 11:05:34 | 只看该作者
jungle 发表于 2016-9-7 11:01
都做了映射,但是只能抓取第四天的数据,而且第四天的每站的数据都是相同的,用的是绝对定位,哪里出问题 ...

估计要做嵌套样例复制,参考教程http://www.gooseeker.com/doc/article-151-1.html
另外,抓到相同数据的话,说明有相同的定位值,这种可以找唯一的标志值做映射,参考http://www.gooseeker.com/doc/article-177-1.html
或者自定义xpath解决http://www.gooseeker.com/doc/article-269-1.html
举报 使用道具
13#
jungle 新手上路 发表于 2016-9-7 11:10:45 | 只看该作者
ym 发表于 2016-9-7 11:05
估计要做嵌套样例复制,参考教程http://www.gooseeker.com/doc/article-151-1.html
另外,抓到相同数据的 ...

恩,嵌套样例复制是需要做哪部分,具体思路可以说下吗?谢谢啦
举报 使用道具
14#
Fuller 管理员 发表于 2016-9-7 11:42:11 | 只看该作者
jungle 发表于 2016-9-7 11:01
都做了映射,但是只能抓取第四天的数据,而且第四天的每站的数据都是相同的,用的是绝对定位,哪里出问题 ...

不应该用绝对定位,你用偏好class试试怎样?
举报 使用道具
15#
jungle 新手上路 发表于 2016-9-7 12:18:46 | 只看该作者
Fuller 发表于 2016-9-7 11:42
不应该用绝对定位,你用偏好class试试怎样?

偏好class也不行,您用我的规则试下,谢了
举报 使用道具
16#
Fuller 管理员 发表于 2016-9-7 15:53:33 | 只看该作者
jungle 发表于 2016-9-7 12:18
偏好class也不行,您用我的规则试下,谢了

我正在测别的主题,还没有测试你这个规则,我加载上来看了,几个问题:
1,第一站,第二站,这些不要勾关键内容
2,每一站作为一个嵌套的容器节点
3,定位标志既有 id,也有class的时候,要选择那个通用的,双击抓取内容,就出现下图的高级配置
我粗略看了一下,抓取结果基本上达到预期



举报 使用道具
17#
jungle 新手上路 发表于 2016-9-7 18:02:37 | 只看该作者
Fuller 发表于 2016-9-7 15:53
我正在测别的主题,还没有测试你这个规则,我加载上来看了,几个问题:
1,第一站,第二站,这些不要勾关 ...

做了您说的1,2,3步,测试的时候又报这个错误,您帮我看下规则,谢谢

4.png (11.09 KB, 下载次数: 702)

4.png
举报 使用道具
18#
xandy 论坛元老 发表于 2016-9-8 15:59:30 | 只看该作者
本帖最后由 xandy 于 2016-9-8 16:01 编辑
jungle 发表于 2016-9-7 18:02
做了您说的1,2,3步,测试的时候又报这个错误,您帮我看下规则,谢谢

先把思路理一下, 确实做嵌套样例复制。


给攻略和detail做定位映射,等同的效果分别是给攻略包含的内容做样例复制、给detail包含的内容做样例复制。

理解如下图:


测试结果应该是这样的——


你要先了解“通过定位标志来采集相同结构的内容”,以及“嵌套样例复制”的知识点

举报 使用道具
19#
Fuller 管理员 发表于 2016-9-8 17:29:20 | 只看该作者
jungle 发表于 2016-9-7 18:02
做了您说的1,2,3步,测试的时候又报这个错误,您帮我看下规则,谢谢

这个错误的意思是你做定位标志映射所使用的DOM节点与内容映射所使用的DOM节点不在一棵DOM分支上,而是各自分属不同分支
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-19 02:25