做了两级规则,第一级在淘宝宝贝详情页上点击“累计评价”,然后进入第二级抓取评价内容,但是,第二级不生成结果文件
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-4-2 08:52

沙发
Fuller 管理员 发表于 2016-3-17 21:37:25 | 只看该作者
主要是在第一级上,点击“累计评价”没有点准

看上图,篮框内,没有勾选“完全匹配”,这个做法是对的。


但是,少了一步,要把红框所示的文字前后的空格都删除,一个网页上可能有10个空格,也可能是6个空格,你是看不清楚的,只要网页上与规则中的空格数量对不上,就匹配不到。既然不用“完全匹配”,那么只保留最关键的标志就行了,把前后空格都删除。


再点查看按钮,得到的xpath就不会像红框中的那么怪异了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
maomao 论坛元老 发表于 2018-4-2 08:52:42 | 只看该作者
现在采集淘宝评论,用Gooseeker数据DIY,更方便快捷,输入商品网址,就可以采集了。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-23 09:44