想请教一下,在阿里巴巴上,以网页列表中第一个商品图片的@src节点做内容映射下载图片,以第二个进行样例复制,为什么后面有一大段商品的图片无法采集?(规则名“阿里巴巴检索”)
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-6-24 12:53

沙发
Artin2016 初级会员 发表于 2016-6-24 11:19:45 | 只看该作者

测试中的一段输出信息,从这个开始,下面的图片都没有了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
Fuller 管理员 发表于 2016-6-24 12:21:28 | 只看该作者
Artin2016 发表于 2016-6-24 11:19
测试中的一段输出信息,从这个开始,下面的图片都没有了

在DS打数机上设置滚屏参数,滚屏次数不能是0,就会打开滚屏,图片没有滚到的话就不会显示
举报 使用道具
地板
Artin2016 初级会员 发表于 2016-6-24 12:53:33 | 只看该作者
Fuller 发表于 2016-6-24 12:21
在DS打数机上设置滚屏参数,滚屏次数不能是0,就会打开滚屏,图片没有滚到的话就不会显示 ...

多谢了,回复好快。滚屏方面倒是还没学到,稍后试一下。

前面我自己琢磨这个问题,在阿里巴巴那个网页上,所有商品列表中带图片网址的节点都有两个,有些是@src(也是我进行映射的)和@data-jssrc,有些是@data-src和@data-jssrc(表示不明白src和data-src是否是同一个东西),而且在工作台上的HTML元素属性中的排列顺序也不一样。我就一直在想是不是这些轻微的变化导致结果不同,然后我就试着给IMG区块加了个定位标志,结果问题不知怎么就解决了,所以现在图片都可以采集了。稍后我试一试滚屏参数。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 15:55