问题:我悬浮结果的二级页面pageno全是0,抓前几页好着,后面第50也就失败
规则:我的悬浮样本1
我的悬浮样本2。
回答说二级没有翻页才为0,有没有别的方式可以匹配一级悬浮二级

举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-4-23 14:54

沙发
Fuller 管理员 发表于 2017-4-23 14:54:30 | 只看该作者
第一级规则的结果文件,注意看红框中的字段


第二级规则的前3次动作完成后生成的结果文件
第一次动作:

第二次动作

第三次动作


clueid在整个抓取过程中都是不变的,但是,我们可以使用actionno区分出来这是第几个动作,而prestamp区分出来上一级是哪个页面(对应于上一级的currentstamp)

我们再看翻到第二页,第一级如下


而第二级前3次动作的结果
第一次动作

第二次动作

第三次动作


此时,想使用pageno是不行的,到第二页时,第二级的结果文件pageno仍然是0,也就是说,pageno是指当前主题翻页数量,而不是上级主题传递过来的数字。此时只有依赖于prestamp和currentstamp来配对。prestamp是上级窗口打开时的时间戳和名称,是传递给下一级的。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 06:16