提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2018-5-26 11:49

沙发
数据集 高级会员 发表于 2018-5-24 18:23:44 | 只看该作者
加载你的规则报错了,内容映射失效了,重新映射再给抓取内容做上定位标志映射,选择定位标志的节点最好选择抓取内容的父级节点

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
wangyong 版主 发表于 2018-5-24 18:29:56 | 只看该作者
本帖最后由 wangyong 于 2018-5-24 18:31 编辑


1,先选择body下的div给整理箱顶节点做上定位标志映射
2,排名和时间分别要做自定义xpath,参考教程:https://www.gooseeker.com/doc/article-269-1.html

大类排名xpath:
  1. .//*[@class='pdTab']//tr[contains(./td[1]/text(),'Amazon 売れ筋ランキング')]/td[2]
复制代码
上架时间xpath:
  1. .//*[@class='pdTab']//tr[contains(./td[1]/text(),'Amazon.co.jp での取り扱い開始日')]/td[2]
复制代码


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
yxjun1984 禁止发言 发表于 2018-5-25 18:32:29 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
5#
Fuller 管理员 发表于 2018-5-25 19:09:21 | 只看该作者
yxjun1984 发表于 2018-5-25 18:32
我运行了20多条线索都没什么问题啊,您重新加载出现问题,请问问题出在哪里呢?
...

采集的时候虽然没有报错,但是有可能定位不准,采集到不想用的内容。加载规则的时候,如果定位不准,就直接报错了。出现这种情况的话,就要用上定位标志映射,可以精准定位,参看教程《定位标志精确采集范围》。

你按照楼上说的,给抓取内容尽量用上定位标志映射,除非没有合适的定位标志
举报 使用道具
6#
yxjun1984 禁止发言 发表于 2018-5-26 11:16:34 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
7#
Fuller 管理员 发表于 2018-5-26 11:49:56 | 只看该作者
yxjun1984 发表于 2018-5-26 11:16
整体箱子做顶级定位映射是什么意义和作用?

可以替代样例复制映射,要比样例复制映射更好,用法参看《定位标志采集列表数据
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-12-4 16:39