做了两级规则,第一级在淘宝宝贝详情页上点击“累计评价”,然后进入第二级抓取评价内容,但是,第二级不生成结果文件
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-4-2 08:52

沙发
Fuller 管理员 发表于 2016-3-17 21:37:25 | 只看该作者
主要是在第一级上,点击“累计评价”没有点准

看上图,篮框内,没有勾选“完全匹配”,这个做法是对的。


但是,少了一步,要把红框所示的文字前后的空格都删除,一个网页上可能有10个空格,也可能是6个空格,你是看不清楚的,只要网页上与规则中的空格数量对不上,就匹配不到。既然不用“完全匹配”,那么只保留最关键的标志就行了,把前后空格都删除。


再点查看按钮,得到的xpath就不会像红框中的那么怪异了

举报 使用道具
板凳
maomao 论坛元老 发表于 2018-4-2 08:52:42 | 只看该作者
现在采集淘宝评论,用Gooseeker数据DIY,更方便快捷,输入商品网址,就可以采集了。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-24 03:16