上层规则抓取了相关地区,然后在下层规则里面抓取对应某一地区的一些其他详细信息,但是在下层规则里面无法抓到地区,这种情况如何区分下层的一些特定结果数据是哪一个地区的
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2016-11-3 10:59

沙发
Fuller 管理员 发表于 2016-9-6 11:42:09 | 只看该作者
通过解析结果文件中的网址就能对应上。

在上层规则中,结果文件中肯定存储了下层线索的网址。这个网址与下层结果文件的fullpath字段对应
举报 使用道具
板凳
quyixuan 金牌会员 发表于 2016-9-6 12:41:03 | 只看该作者
上层规则的下级线索和下层规则对应的<fullpath>字段是相同的,可以将结果导出到excel,然后通过excel技巧将两个结果的这两个字段连接起来,就可以找到数据对应的地区了
举报 使用道具
地板
Joker_Bobo 新手上路 发表于 2016-11-3 10:35:36 | 只看该作者
Fuller 发表于 2016-9-6 11:42
通过解析结果文件中的网址就能对应上。

在上层规则中,结果文件中肯定存储了下层线索的网址。这个网址与下 ...

如果上层规则是button按钮,带有OpenWindow(‘’)怎么进行下层抓取?

举报 使用道具
5#
Fuller 管理员 发表于 2016-11-3 10:39:02 | 只看该作者
Joker_Bobo 发表于 2016-11-3 10:35
如果上层规则是button按钮,带有OpenWindow(‘’)怎么进行下层抓取?

这个不能用层级抓取,只能用连续动作中的连续点击。跟这个问题类似《我想把页面上所有“更多”点击一遍,怎么做?
举报 使用道具
6#
Joker_Bobo 新手上路 发表于 2016-11-3 10:56:24 | 只看该作者
Fuller 发表于 2016-11-3 10:39
这个不能用层级抓取,只能用连续动作中的连续点击。跟这个问题类似《我想把页面上所有“更多”点击一遍, ...

我这是第二层的分层抓取,如果用连续点击的话,不是要一个个的自己手动点么,我第二级页面是两个表格的,每行一个按钮,这样点合适么?而且我只需要下一级里面的一个字段啊

举报 使用道具
7#
quyixuan 金牌会员 发表于 2016-11-3 10:59:08 | 只看该作者
Joker_Bobo 发表于 2016-11-3 10:56
我这是第二层的分层抓取,如果用连续点击的话,不是要一个个的自己手动点么,我第二级页面是两个表格的, ...

连续动作不一定要把所有的都点击一遍,你想点击哪里用xpath精准定位到那个控件就行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 20:59