网址:https://www.costco.com/all-vitamins-supplements.html

这个列表里的价格可以抓,但是其他的内容包括产品标题和评价数都会提示出错。
麻烦大大看一下,演示一下该怎么操作

谢谢!
举报 使用道具
| 回复

共 11 个关于本帖的回复 最后回复于 2019-5-7 14:39

沙发
jxaa060970 新手上路 发表于 2019-4-27 05:03:26 | 只看该作者
本帖最后由 jxaa060970 于 2019-4-27 05:18 编辑

只成功了一次,一刷新又是老毛病。
提示定位上下文节点时遇到异常

检查自定义Xpath正确性, 我没有自定义啊
举报 使用道具
板凳
Fuller 管理员 发表于 2019-4-27 07:31:24 | 只看该作者
jxaa060970 发表于 2019-4-27 05:03
只成功了一次,一刷新又是老毛病。
提示定位上下文节点时遇到异常

把你的主题名发出来。

管理员加载你的规则一定会失败,你可以截个图,标一下哪些是你想抓取的,怎样做的内容映射
举报 使用道具
地板
jxaa060970 新手上路 发表于 2019-5-1 12:09:34 | 只看该作者
Fuller 发表于 2019-4-27 07:31
把你的主题名发出来。

管理员加载你的规则一定会失败,你可以截个图,标一下哪些是你想抓取的,怎样做的 ...
主题名:costco抓取29135

产品列表里的信息,除了价格以外用绝对定位抓取都会得到一样的错误。
另外这个定位方式怎么控制呢?怎么时灵时不灵,经常切换不了规则,然后重复出现一样的错误。

谢谢!

WeChat Screenshot_20190430210622.png (78.3 KB, 下载次数: 810)

WeChat Screenshot_20190430210622.png

WeChat Screenshot_20190430210611.png (84.25 KB, 下载次数: 798)

WeChat Screenshot_20190430210611.png

WeChat Screenshot_20190430210547.png (266.52 KB, 下载次数: 820)

抓产品标题

抓产品标题
举报 使用道具
5#
jxaa060970 新手上路 发表于 2019-5-6 16:19:17 | 只看该作者
Fuller 发表于 2019-4-27 07:31
把你的主题名发出来。

管理员加载你的规则一定会失败,你可以截个图,标一下哪些是你想抓取的,怎样做的 ...

求大大解答
举报 使用道具
6#
Fuller 管理员 发表于 2019-5-6 16:52:00 | 只看该作者

我分析一下
举报 使用道具
7#
Fuller 管理员 发表于 2019-5-6 16:53:27 | 只看该作者
主题名修改了吗?怎么查不到了
举报 使用道具
8#
Fuller 管理员 发表于 2019-5-6 16:55:12 | 只看该作者
上面几个截图,我猜想你的操作过程是这样:
1,重新加载以前定义的规则
2,有加载失败的信息,但是你没有按照提示重新映射内容,修复这些信息
3,而是直接点击测试按钮,那么就会报一些错误
你把最新的主题名发出来,我加载试试
举报 使用道具
9#
Fuller 管理员 发表于 2019-5-6 16:56:58 | 只看该作者
这个网站我访问不了,需要登录吗?
举报 使用道具
10#
Fuller 管理员 发表于 2019-5-6 16:57:34 | 只看该作者
可以了,原来要翻墙
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 18:45