11#
LPG123 初级会员 发表于 2018-5-14 16:38:42 | 只看该作者

举报 使用道具
12#
LPG123 初级会员 发表于 2018-5-14 16:45:36 | 只看该作者
还没有保存
马上
举报 使用道具
13#
LPG123 初级会员 发表于 2018-5-14 16:45:49 | 只看该作者
好了
举报 使用道具
14#
LPG123 初级会员 发表于 2018-5-14 16:46:21 | 只看该作者
描述我做好了,图片的title采集不出来
举报 使用道具
15#
bowieD 金牌会员 发表于 2018-5-14 16:53:09 | 只看该作者
LPG123 发表于 2018-5-14 16:46
描述我做好了,图片的title采集不出来

1、加载进去规则报错了,报错的是产品详情整理箱的内容,给产品详情整理箱的抓取内容重新做一下内容映射

2、图片的title采集,把定位方式改成绝对定位就可以了

1.png (44.87 KB, 下载次数: 506)

1.png
举报 使用道具
16#
LPG123 初级会员 发表于 2018-5-14 17:38:07 | 只看该作者
不能用绝对的,这个只是一个产品,我要采集好多产品的
举报 使用道具
17#
bowieD 金牌会员 发表于 2018-5-14 17:49:26 | 只看该作者
LPG123 发表于 2018-5-14 17:38
不能用绝对的,这个只是一个产品,我要采集好多产品的

照着说的修改就可以了
举报 使用道具
18#
LPG123 初级会员 发表于 2018-5-14 22:22:53 | 只看该作者
绝对定位只能够采集本产品的Size和color,不能采集其他的产品,速卖通产品采集3规则
举报 使用道具
19#
Fuller 管理员 发表于 2018-5-15 09:14:14 | 只看该作者
LPG123 发表于 2018-5-14 22:22
绝对定位只能够采集本产品的Size和color,不能采集其他的产品,速卖通产品采集3规则 ...



网页结构方面,有些来自于网站模板,是固定的,可以用来做采集规则,有些内容是每个编辑自己写的,不能用来做采集规则,因为每个网页都会不一样。我认为只有红框那个DIV是这个网站模板中的,其他都是店家自己写的。在这种情况下,如果要自定义xpath,定位到红框中的那个DIV就行了,用XPath把这个DIV中的所有文本提取出来,要么在采集规则中用函数截取内容,要么导入到excel中后,用excel函数截取内容。我倾向于后者,因为excel更灵活。而且这样的采集规则会很简单,适应性很高。也就是说用红框中的那个div做内容映射,把一个商品的所有详情文字都采集下来
举报 使用道具
20#
bowieD 金牌会员 发表于 2018-5-15 09:45:35 | 只看该作者
LPG123 发表于 2018-5-14 22:22
绝对定位只能够采集本产品的Size和color,不能采集其他的产品,速卖通产品采集3规则 ...

采集不了其他产品不是绝对定位的原因,是因为不能产品的网页结构不一样,规则不能适应,需要自定义xpath去给每个抓取字段定位
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 01:05