为什么好多设的二级页面里的商品图片无法采集,出错无效的XPATH

举报 使用道具
| 回复

共 21 个关于本帖的回复 最后回复于 2016-12-7 18:03

沙发
scraper 论坛元老 发表于 2016-12-6 18:56:23 | 只看该作者
你检查下你的规则, 是否把一些不是图片网址的给抓下来了
举报 使用道具
板凳
Fuller 管理员 发表于 2016-12-6 19:09:31 | 只看该作者
主题名是什么?
举报 使用道具
地板
18873028857 初级会员 发表于 2016-12-7 16:14:35 | 只看该作者
scraper 发表于 2016-12-6 18:56
你检查下你的规则, 是否把一些不是图片网址的给抓下来了

才发显,二级页面里的网页结构不一样,有的可以抓,有的不可以抓,这个有好方法解决吗?
举报 使用道具
5#
18873028857 初级会员 发表于 2016-12-7 16:15:29 | 只看该作者
Fuller 发表于 2016-12-6 19:09
主题名是什么?

yangtian003
举报 使用道具
6#
xandy 论坛元老 发表于 2016-12-7 16:16:34 | 只看该作者
18873028857 发表于 2016-12-7 16:14
才发显,二级页面里的网页结构不一样,有的可以抓,有的不可以抓,这个有好方法解决吗?
...

如果网页结构不一样的话,可以在同一个主题下建几个规则,参看这个《怎么在同一个主题名下建立多个规则
举报 使用道具
7#
18873028857 初级会员 发表于 2016-12-7 16:17:51 | 只看该作者

如果可以看到我的yangtian003的话,请你看下我做的yangtian004及yangtian004-1,根本无法抓取下节的图片,硬抓都抓不到
举报 使用道具
8#
Fuller 管理员 发表于 2016-12-7 16:19:37 | 只看该作者



这个爬虫路线加载不了,目的是做什么?
举报 使用道具
9#
18873028857 初级会员 发表于 2016-12-7 16:20:32 | 只看该作者
xandy 发表于 2016-12-7 16:16
如果网页结构不一样的话,可以在同一个主题下建几个规则,参看这个《怎么在同一个主题名下建立多个规则》 ...

谢谢
举报 使用道具
10#
18873028857 初级会员 发表于 2016-12-7 16:22:09 | 只看该作者
Fuller 发表于 2016-12-7 16:19
这个爬虫路线加载不了,目的是做什么?

我是做商品的详细图片及描述类
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 13:44