设置了两个规则,第一级规则采集网页上的链接,第二级规则采集所链接的网页内容,但是链接有很多页所以在第一级规则设置了翻页采集,步骤应该没问题,但是显示自身翻页只爬出了第一页的链接,求解
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-3-30 21:52

沙发
ym 版主 发表于 2017-3-30 21:52:50 | 只看该作者
本帖最后由 ym 于 2017-3-30 21:54 编辑

直接测试你的第一级规则,翻页没有问题。
你说只翻了一页,要么是网速问题,要么你是用爬虫群采集,规则的调度设置了同一线索内翻页次数为1,这种情况要改为不限制就好了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 02:53