我想问一下有没有大师爬过京东无线端的搜索结果页,我现在有一个问题,我爬虫的目的是找出每一款商品所属的店铺,其他类目的都可以,但是搜李宁羽绒服的时候问题就来了,第一款商品是自营的,没有显示店铺名称,而第二款就有店铺名称,怎么解决这个问题?

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-11-29 17:47

沙发
HJLing 版主 发表于 2016-11-29 17:19:58 | 只看该作者
用自定义xpath或者用两个规则编号不同的规则
具体你的不一样是怎样 截图或者直接发网址看看
举报 使用道具
板凳
chenhg 初级会员 发表于 2016-11-29 17:31:33 | 只看该作者
附加图片


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
HJLing 版主 发表于 2016-11-29 17:47:30 | 只看该作者
如果只是差了店铺名称 其他结构都一样 可以用第三方店铺做样本页面 也采集店铺名称 但不要勾选关键内容 这样对于自营的页面这个字段就是空的
如果其他信息的结构也有差别 可以建立两个规则 参加教程《怎么在同一个主题名下建立多个规则
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-25 15:12