这是目标网页:https://book.douban.com/review/best/?icn=index-reviewer测试的时候不会没有跳着抓取


采集结果是跳着


哪里出了问题呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-10-26 18:52

沙发
Fuller 管理员 发表于 2016-10-26 18:52:06 | 只看该作者
可能的原因:
1)样例复制映射的时候,第一个样例和第二个样例对应的节点不是相邻的兄弟,而是跳开的
2)奇偶行的@class值不一样,MS谋数台生成抓取规则的时候,往往会自动选择@class或者@id作为定位标志,他自动选的不合适,需要点击“创建规则”工作台上的“定位”按钮来修改定位偏好,比如,换一下偏好id,或者偏好class等

如果还解决不了,把主题名帖出来,我帮你诊断一下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-22 13:39