我的需求是模拟点击,翻页爬取
模拟点击规则:smtfeedback
翻页爬取规则:downsmtfeedback
现在模拟点击没有问题,翻页中出现部分页无法匹配。
请大神帮忙看看

举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2017-2-22 16:54

沙发
xandy 论坛元老 发表于 2017-2-22 15:08:10 | 只看该作者
翻页爬取规则:downsmtfeedback,其中样例复制没做好,你将样例1映射给了第一个DIV,样例2映射给了第三个DIV。
如下图所示:

将样例2重新映射给第二个DIV就行了。
举报 使用道具
板凳
DAYUE888 中级会员 发表于 2017-2-22 15:10:22 | 只看该作者
好的 谢谢
举报 使用道具
地板
DAYUE888 中级会员 发表于 2017-2-22 15:57:29 | 只看该作者
第7页就开始一直匹配失败 我已经重新映射了
举报 使用道具
5#
xandy 论坛元老 发表于 2017-2-22 16:21:23 | 只看该作者
你的翻页线索定位没做好,要将包含整个翻页框的DIV节点映射给翻页线索,如下图所示:

举报 使用道具
6#
xandy 论坛元老 发表于 2017-2-22 16:23:10 | 只看该作者
另外,你重新加载downsmtfeedback规则的时候,先不着急后续分析。
1,先不勾内容定位
2,点击Feedback
3,等评论页面的内容都加载出来后再进行后续分析
举报 使用道具
7#
DAYUE888 中级会员 发表于 2017-2-22 16:54:04 | 只看该作者
好的我试试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 16:09