为什么在去哪儿门票评论那里爬虫爬到第二页就不能爬了,自动结束了?规则按照平常翻页的制定的啊!
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2019-3-4 17:22

沙发
wangyong 版主 发表于 2019-3-4 14:17:16 | 只看该作者
是用快捷采集采的还是自己做的规则?
举报 使用道具
板凳
cassiechan 中级会员 发表于 2019-3-4 14:24:33 | 只看该作者
wangyong 发表于 2019-3-4 14:17
是用快捷采集采的还是自己做的规则?

自己做的
举报 使用道具
地板
cassiechan 中级会员 发表于 2019-3-4 14:24:59 | 只看该作者

规则名是:衡山去哪儿
举报 使用道具
5#
wangyong 版主 发表于 2019-3-4 16:54:57 | 只看该作者
cassiechan 发表于 2019-3-4 14:24
规则名是:衡山去哪儿

规则需要做以下修改
1,取消原来的样例复制映射
2,修改整理定位为偏好@class
3,选择第一条评论对应的div,也就是class='mp-comments-item'的div节点对整理箱顶节点做定位标志映射



举报 使用道具
6#
cassiechan 中级会员 发表于 2019-3-4 17:22:54 | 只看该作者
wangyong 发表于 2019-3-4 16:54
规则需要做以下修改
1,取消原来的样例复制映射
2,修改整理定位为偏好@class

好的,谢谢~
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 12:35