快捷导航
采集美国亚马逊商品的图片,例如  https://www.amazon.com/Intex-Krystal-Cartridge-Filter-110-120V/dp/B005QIYL7E/ref=sr_1_4?ie=UTF8&qid=1465866929&sr=8-4&keywords=pool+pump#immersive-view_1465875175218
直接映射左侧的图片采集的是小图 我想要大图

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2019-5-20 14:50

HJLing 版主 发表于 2016-8-19 15:55:51 | 显示全部楼层
本帖最后由 HJLing 于 2016-8-19 16:00 编辑

可以比较大图和小图网址的区别
如第一张图 html里的网址是https://images-na.ssl-images-amazon.com/images/I/41u7kGtFU-L._SS40_.jpg
对应的大图网址是https://images-na.ssl-images-amazon.com/images/I/41u7kGtFU-L.jpg

那在做内容映射时可以自定义xpath去掉“_SS40_”这部分 具体可用concat和substring-before函数
函数使用方法可参考http://www.gooseeker.com/doc/thread-1852-1-1.html
举报 使用道具
a88865843 禁止发言 发表于 2019-5-20 14:50:42 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 采集知乎上关于华为鸿蒙的问题和回答
  • 分词和分类检索平台使用手册
  • 用爬虫采集机场出租车进场出场数据的公告
  • 摘取泉港区政府工作报告中的数字遇到的问题
  • 调度设置参数说明

热门用户

GMT+8, 2019-9-21 08:22