京东商品评论星级抓取问题

jinna1993 · 2016-12-14 10:12 上传

抓取京东商品评论星级时，用了xpath函数 ——*//*[contains(@class,'grade-star g-star')]/@class ，抓手机商品时可以采集，但是换乘其他商品就不行了。另外换成洗衣机之后，好多信息有些评论的信息也采不到了，是不是因为后面的没有商城自动识别的关键词这一栏？

手机主题名是——苹果5S金色16G评论，洗衣机主题名——TCLXQB55-36SP评论

求大大帮助，谢谢~

Fuller · 发表于 2016-12-14 10:39:55

得用上定位标志映射，电商网站是比较好抓的，因为都有很好的定位标志。

另外，没有必要自己做规则了，有现成的数据DIY，京东评论已经上线了，还会有更多电商上线数据DIY

xandy · 发表于 2016-12-14 11:51:01

本帖最后由 xandy 于 2016-12-14 11:53 编辑

我看了下你的规则，主要存在以下几个问题

1、评论星级抓不到
2、评论内容、回复数、购买渠道和点赞数抓不全
原因是：
1、评论星级的xpath没有写好

有些评论里头只有p-comment，有些既有p-tabs又有p-comment，之前对评论只有内容映射而没有定位，所以碰到有p-tags的，评论就抓取不全了。
这个页面第一页的评论第一条评论没有标签，所以就翻到第二页作为样本页面来做规则（放心，抓的时候还是从第一页开始抓）。
2、第二页的第一条数据没有地区，而地区和会员是存在一个div里头（@class='type-item'），所以这两个用一个采集字段来抓，到时候用excel的数据分列功能将会员等级和地区分开。
3、抓不全的内容都加上定位标志，提高规则的适用性。

xandy · 发表于 2016-12-14 11:59:38

改动如下——

现在测试就完整了

jinna1993 · 发表于 2016-12-15 00:03:18

谢谢~~~

京东商品评论星级抓取问题

共 4 个关于本帖的回复最后回复于 2016-12-15 00:03

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

京东商品评论星级抓取问题

共 4 个关于本帖的回复 最后回复于 2016-12-15 00:03

推荐板块

精彩推荐

热门话题

热门用户

共 4 个关于本帖的回复最后回复于 2016-12-15 00:03