问题:我悬浮结果的二级页面pageno全是0,抓前几页好着,后面第50也就失败
规则:我的悬浮样本1
我的悬浮样本2。
回答说二级没有翻页才为0,有没有别的方式可以匹配一级悬浮二级

举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-4-23 14:54

沙发
Fuller 管理员 发表于 2017-4-23 14:54:30 | 只看该作者
第一级规则的结果文件,注意看红框中的字段


第二级规则的前3次动作完成后生成的结果文件
第一次动作:

第二次动作

第三次动作


clueid在整个抓取过程中都是不变的,但是,我们可以使用actionno区分出来这是第几个动作,而prestamp区分出来上一级是哪个页面(对应于上一级的currentstamp)

我们再看翻到第二页,第一级如下


而第二级前3次动作的结果
第一次动作

第二次动作

第三次动作


此时,想使用pageno是不行的,到第二页时,第二级的结果文件pageno仍然是0,也就是说,pageno是指当前主题翻页数量,而不是上级主题传递过来的数字。此时只有依赖于prestamp和currentstamp来配对。prestamp是上级窗口打开时的时间戳和名称,是传递给下一级的。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-22 11:32