你好,我要采集美亚上的卖家信息,做了个三级规则,
美亚销售商信息-1
美亚销售商信息-2
美亚销售方信息-3

美亚销售商信息-2 出错了,27个链接,只对了4个,是哪里出了问题?




举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-12-14 19:07

沙发
Fuller 管理员 发表于 2020-12-14 19:07:45 | 只看该作者


红框是两个网页块,如果你只想采集供应商信息,而不需要商品信息,建议把“商品名”删除,并且用右边网页块上的定位标志做一个定位映射给detail,这样就会把规则适应性提高。

另外,因为有些商品的卖家就是亚马逊官方,这个规则要做两个,任务名相同,当爬虫运行的时候,会自动选择,一个用于采集有商家的,一个用于采集amazon官方的。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 12:17