快捷导航
iHaier图片20190110093649.png
如图,由于item specifies里 找到item type后把后面的wig爬取出来,但是item type的位置每个产品页面是不一样的。
小弟不会xpath,大神们能帮忙写一下吗?万分感谢!
网址:
https://www.aliexpress.com/item/ ... b_test=searchweb0_0,searchweb201602_5_10065_10068_10890_319_10546_317_10548_10696_453_10084_454_10083_10618_431_10307_537_536_10059_10884_10887_100031_321_322_10103,searchweb201603_53,ppcSwitch_0&algo_expid=80278645-bfee-4876-802e-4fd2403b2c9f-0&algo_pvid=80278645-bfee-4876-802e-4fd2403b2c9f

举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2019-1-21 13:57

Fuller 管理员 发表于 2019-1-10 11:01:09 | 显示全部楼层
你定义的规则的主题名是什么?把主题名贴出来,我告诉你怎么做。

自定义xpath的时候,先不用自定义,而是做正常的内容标注,等生成抓取规则以后,把里面的xpath拷贝出来,做编辑,填到自定义xpath那里
举报 使用道具
Brad764 初级会员 发表于 2019-1-11 15:42:34 | 显示全部楼层
Fuller 发表于 2019-1-10 11:01
你定义的规则的主题名是什么?把主题名贴出来,我告诉你怎么做。

自定义xpath的时候,先不用自定义,而是 ...

非常感谢:
规则名:Brad详细信息

需求:抓取详情里指定文字后面的信息
举报 使用道具
Fuller 管理员 发表于 2019-1-11 19:48:38 | 显示全部楼层
Brad764 发表于 2019-1-11 15:42
非常感谢:
规则名:Brad详细信息

定位20190111194708.png

似乎不用自定义xpath,用定位标志映射就行了,我观察似乎每个参数类型都有独立的id值,如果每个商品都统一用这些id编码,那么用这个id值做定位标志映射最合适
举报 使用道具
Brad764 初级会员 发表于 2019-1-21 10:41:55 | 显示全部楼层
Fuller 发表于 2019-1-11 19:48
似乎不用自定义xpath,用定位标志映射就行了,我观察似乎每个参数类型都有独立的id值,如果每个商品都 ...

好的非常感谢,我试试
举报 使用道具
Brad764 初级会员 发表于 2019-1-21 13:57:30 | 显示全部楼层
Fuller 发表于 2019-1-11 19:48
似乎不用自定义xpath,用定位标志映射就行了,我观察似乎每个参数类型都有独立的id值,如果每个商品都 ...

您好,我刚试了一下,不同的产品页面同样是“Item Type”的ID值不一样,因为它的顺序是变化的。我只想抓取Item Type后面的文字,请问如何定位?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运用爬虫群,快速采集数据
  • 集搜客网络爬虫使用proxy切换IP防封锁
  • 用网络爬虫软件自动下载网页上的文件
  • 怎样用爬虫爬取亚马逊商品评论?
  • 新版集搜客网络爬虫图片下载功能

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2019-3-23 12:13