本帖最后由 Leehomchan 于 2018-5-30 19:18 编辑

按照教程中的方法进行设置,抓取数据时,能够抓取第一页的数据然后转到第二页,然后就出现错误提示,"抓取失败,抓取规则不合适或超时时间设置太短”,将超时时间设置为40s后依然出现错误提示,请教下究竟是哪里出现了问题?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-5-30 22:42

沙发
数据集 高级会员 发表于 2018-5-30 21:23:37 | 只看该作者
第一页和第二页的结构有细微的差别,需要给列表做上定位映射,精确采集范围,做法如下图所示,创建一个叫“样例”的容器,把采集字段放到这个容器下,用这个名为样例的容器做样例复制,再给列表做上定位映射。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
Leehomchan 初级会员 发表于 2018-5-30 21:38:13 | 只看该作者
谢谢你,不过怎么创建样例容器,这个“Box clearfix”从哪来的
举报 使用道具
地板
数据集 高级会员 发表于 2018-5-30 21:51:35 | 只看该作者
本帖最后由 数据集 于 2018-5-30 21:59 编辑

1,创建样例容器就跟创建字段一样的,右键列表-》添加-》包容,再为容器命名,随便取一个名字都行,然后再右键产品名-》移动-》右移,这样依次把采集的字段右移到容器中去
可参考《整理箱怎样同时使用定位映射和样例复制?》


2,“Box clearfix”就是UL节点的class值,右键UL节点-》定位标志映射-》列表


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
Leehomchan 初级会员 发表于 2018-5-30 22:42:43 | 只看该作者
非常感谢您,已经解决,看来爬虫前也需要分析页面结构,不是一味照着教程走
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-22 01:16