上层规则抓取了相关地区,然后在下层规则里面抓取对应某一地区的一些其他详细信息,但是在下层规则里面无法抓到地区,这种情况如何区分下层的一些特定结果数据是哪一个地区的
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2016-11-3 10:59

沙发
Fuller 管理员 发表于 2016-9-6 11:42:09 | 只看该作者
通过解析结果文件中的网址就能对应上。

在上层规则中,结果文件中肯定存储了下层线索的网址。这个网址与下层结果文件的fullpath字段对应
举报 使用道具
板凳
quyixuan 金牌会员 发表于 2016-9-6 12:41:03 | 只看该作者
上层规则的下级线索和下层规则对应的<fullpath>字段是相同的,可以将结果导出到excel,然后通过excel技巧将两个结果的这两个字段连接起来,就可以找到数据对应的地区了
举报 使用道具
地板
Joker_Bobo 新手上路 发表于 2016-11-3 10:35:36 | 只看该作者
Fuller 发表于 2016-9-6 11:42
通过解析结果文件中的网址就能对应上。

在上层规则中,结果文件中肯定存储了下层线索的网址。这个网址与下 ...

如果上层规则是button按钮,带有OpenWindow(‘’)怎么进行下层抓取?

举报 使用道具
5#
Fuller 管理员 发表于 2016-11-3 10:39:02 | 只看该作者
Joker_Bobo 发表于 2016-11-3 10:35
如果上层规则是button按钮,带有OpenWindow(‘’)怎么进行下层抓取?

这个不能用层级抓取,只能用连续动作中的连续点击。跟这个问题类似《我想把页面上所有“更多”点击一遍,怎么做?
举报 使用道具
6#
Joker_Bobo 新手上路 发表于 2016-11-3 10:56:24 | 只看该作者
Fuller 发表于 2016-11-3 10:39
这个不能用层级抓取,只能用连续动作中的连续点击。跟这个问题类似《我想把页面上所有“更多”点击一遍, ...

我这是第二层的分层抓取,如果用连续点击的话,不是要一个个的自己手动点么,我第二级页面是两个表格的,每行一个按钮,这样点合适么?而且我只需要下一级里面的一个字段啊

举报 使用道具
7#
quyixuan 金牌会员 发表于 2016-11-3 10:59:08 | 只看该作者
Joker_Bobo 发表于 2016-11-3 10:56
我这是第二层的分层抓取,如果用连续点击的话,不是要一个个的自己手动点么,我第二级页面是两个表格的, ...

连续动作不一定要把所有的都点击一遍,你想点击哪里用xpath精准定位到那个控件就行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-25 06:57