快捷导航
翻页采集一共586页,只采集到180页就结束了是什么原因
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2021-7-21 16:20

wangyong 版主 发表于 2021-7-21 16:04:03 | 显示全部楼层
规则名发一下
举报 使用道具
maomao 论坛元老 发表于 2021-7-21 16:20:38 | 显示全部楼层
可能的原因:
1. 手工翻一下这个网页,能翻到最后吗?有些网页实际有翻页限制,翻到某一页,就不让往下翻了

2.  打开180页,或者181页,对着这个页面加载任务,看看有没有错误。

如果有错误,要修改规则,一般是要加上定位映射,使规则的适应性更好。
非样本页面加载规则.png



非样本页面加载规则2.png



举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Jupyter Notebook使用sklearn的TF-IDF算法
  • 基于TSC 理论的网络社区中知识动员模式研究
  • 网页数据采集使用嵌套整理箱获得有层次的数
  • 我国旅游管理研究的知识来源与结构—基于文
  • 面向用户评论的关键词抽取研究-以美团为例

热门用户

GMT+8, 2021-7-30 11:39