如图,由于item specifies里 找到item type后把后面的wig爬取出来,但是item type的位置每个产品页面是不一样的。
小弟不会xpath,大神们能帮忙写一下吗?万分感谢!
网址:
https://www.aliexpress.com/item/ ... b_test=searchweb0_0,searchweb201602_5_10065_10068_10890_319_10546_317_10548_10696_453_10084_454_10083_10618_431_10307_537_536_10059_10884_10887_100031_321_322_10103,searchweb201603_53,ppcSwitch_0&algo_expid=80278645-bfee-4876-802e-4fd2403b2c9f-0&algo_pvid=80278645-bfee-4876-802e-4fd2403b2c9f

举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2019-1-21 13:57

沙发
Fuller 管理员 发表于 2019-1-10 11:01:09 | 只看该作者
你定义的规则的主题名是什么?把主题名贴出来,我告诉你怎么做。

自定义xpath的时候,先不用自定义,而是做正常的内容标注,等生成抓取规则以后,把里面的xpath拷贝出来,做编辑,填到自定义xpath那里
举报 使用道具
板凳
Brad764 初级会员 发表于 2019-1-11 15:42:34 | 只看该作者
Fuller 发表于 2019-1-10 11:01
你定义的规则的主题名是什么?把主题名贴出来,我告诉你怎么做。

自定义xpath的时候,先不用自定义,而是 ...

非常感谢:
规则名:Brad详细信息

需求:抓取详情里指定文字后面的信息
举报 使用道具
地板
Fuller 管理员 发表于 2019-1-11 19:48:38 | 只看该作者
Brad764 发表于 2019-1-11 15:42
非常感谢:
规则名:Brad详细信息



似乎不用自定义xpath,用定位标志映射就行了,我观察似乎每个参数类型都有独立的id值,如果每个商品都统一用这些id编码,那么用这个id值做定位标志映射最合适
举报 使用道具
5#
Brad764 初级会员 发表于 2019-1-21 10:41:55 | 只看该作者
Fuller 发表于 2019-1-11 19:48
似乎不用自定义xpath,用定位标志映射就行了,我观察似乎每个参数类型都有独立的id值,如果每个商品都 ...

好的非常感谢,我试试
举报 使用道具
6#
Brad764 初级会员 发表于 2019-1-21 13:57:30 | 只看该作者
Fuller 发表于 2019-1-11 19:48
似乎不用自定义xpath,用定位标志映射就行了,我观察似乎每个参数类型都有独立的id值,如果每个商品都 ...

您好,我刚试了一下,不同的产品页面同样是“Item Type”的ID值不一样,因为它的顺序是变化的。我只想抓取Item Type后面的文字,请问如何定位?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 17:02