设置好以后,样例无法复制,无法抓取一页的数据
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2024-7-12 11:18

沙发
Fuller 管理员 发表于 2024-7-12 10:48:23 | 只看该作者
把你的规则名字发出来,管理员会从后台测试的
举报 使用道具
板凳
我爱不灭 新手上路 发表于 2024-7-12 10:51:05 | 只看该作者
一个京东老人食品,谢谢
举报 使用道具
地板
我爱不灭 新手上路 发表于 2024-7-12 10:52:31 | 只看该作者
就是我按照教程设置好以后,进行一页的内容抓取的时候,无法复制样例。按照教程设置,点击测试干啥的,都还是显示样例那一个商品
举报 使用道具
5#
Fuller 管理员 发表于 2024-7-12 11:10:53 | 只看该作者
我爱不灭 发表于 2024-7-12 10:52
就是我按照教程设置好以后,进行一页的内容抓取的时候,无法复制样例。按照教程设置,点击测试干啥的,都还 ...


点击“测试”按钮,切换到“采集规则”这里看,就能看到生成的采集规则,是xslt文件,即使看不懂,可以大概看一下,红色箭头这里可以看到规则中使用了一个特定商品的编号。所以,其他商品就采集不到了。要避免特殊商品编号出现在规则中。

这里的编号出现在class属性中,那么可以选择“只用id”,避免使用class。再做上样例映射,就能采集到所有的了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
6#
Fuller 管理员 发表于 2024-7-12 11:16:31 | 只看该作者
还有一种方法:使用定位映射精确采集内容,可以让采集规则更加有适应性。参看教程:https://www.gooseeker.com/doc/article-527-1.html

下图可以看到,含有特殊商品编号的采集内容是“价格”


那么,看界面下部的DOM结构,可以看到爬虫自动使用了下面箭头指向的class属性,而上面箭头指向的class属性是 @class = 'p-price',这个属性就更通用,可以在这个DOM节点上做定位映射,映射给“价格”

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
7#
我爱不灭 新手上路 发表于 2024-7-12 11:18:06 | 只看该作者
我试试,谢谢大神!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的
  • 下载支持win7的集搜客网络爬虫软件
  • 遇到“无法识别的应用”告警怎么办?

热门用户

GMT+8, 2024-9-8 10:30