11#
Fuller 管理员 发表于 2017-10-25 22:29:40 | 只看该作者
chengyiling 发表于 2017-10-25 20:30
您好,我也想抓取评论下方的回复,请问怎么设置连续点击动作的xpath呢,十分感谢
...

可能要规划好几个主题:
1,主题A:上面定义连续动作,点击“共xx条回复”,目标主题是B
2,主题B:抓取回复的回复,同时点击“更多xx条回复”,目标主题还是B,这个过程相当于翻页

现在最麻烦的是主题A上的动作的XPath,刚才我写的那个Xpath能点,但是会跳着点。

比如,网页上的“共XX条回复”一共有5个点击位置
  1. 1  2  3  4  5
复制代码
用那个xpath,点击了1以后,1的“共xx条回复”不显示了。那么点击位置剩下
  1.    2  3  4  5
复制代码
DS打数机第二次点击的时候,本来想点击第二个位置,此时第二个位置是“3”,那么就把“2”跳过去了。我现在还不知道有什么办法解决这个问题,明天我问问同事

举报 使用道具
12#
chengyiling 初级会员 发表于 2017-10-26 17:06:01 | 只看该作者
Fuller 发表于 2017-10-25 22:29
可能要规划好几个主题:
1,主题A:上面定义连续动作,点击“共xx条回复”,目标主题是B
2,主题B:抓取 ...

您好,您还记得我问您的微博下方评论的回复怎么抓吗?我现在的问题是,在点击“共XX条回复”之前是不是需要设置“查看更多”的点击动作?让全部的评论先显示出来?还是那个“共XX条回复”已经可以把隐藏的全部点击了呀?谢谢
举报 使用道具
13#
数据集 高级会员 发表于 2017-10-26 17:19:11 | 只看该作者
那就先不设置“查看更多”的点击动作,可以把这个动作单独设置到一个规则里面,放在点击“共XX条回复”的规则之后。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-17 11:24