规则名叫淘宝模拟点击11,第二层叫淘宝模拟点击21
举报 使用道具
| 回复

共 14 个关于本帖的回复 最后回复于 2019-3-29 18:01

沙发
Fuller 管理员 发表于 2019-3-28 19:11:26 | 只看该作者
加载你第一个规则看了,没有问题的。应该是第二级规则有问题,给第二级规则的抓取内容做上定位标志映射,提高规则适应性。而且第二级规则的整理箱定位改成偏class





举报 使用道具
板凳
Fuller 管理员 发表于 2019-3-28 19:12:20 | 只看该作者
另外,你的第二级规则没有做样例复制,也没有翻页,只能抓取一个评论
举报 使用道具
地板
微米 初级会员 发表于 2019-3-28 21:59:50 | 只看该作者
那,想要抓取这淘宝评论,整个流程是什么样子的,先做模拟点击,做模拟点击第二级规则时怎么做样例复制,是完成第二级规则保存了,再做样例复制吗
举报 使用道具
5#
Fuller 管理员 发表于 2019-3-28 22:27:27 | 只看该作者
微米 发表于 2019-3-28 21:59
那,想要抓取这淘宝评论,整个流程是什么样子的,先做模拟点击,做模拟点击第二级规则时怎么做样例复制,是 ...

你是想学习定义规则的方法吗?如果只是想采集数据,用现成的快捷采集工具,就可以立即采集淘宝评论:https://www.gooseeker.com/res/da ... A%E9%87%87%E9%9B%86
用法在这里:https://www.gooseeker.com/doc/thread-5611-1-1.html

如果想定义规则,确实需要两级:
第一级:进入商品详情页,点击“累计评论”,目标主题是第二级
第二级:采集评论列表,并且翻页。

从第一级到第二级可以不用在连续动作上定义点击动作,而是像翻页一样做点击,参看:《网络爬虫模拟点击抓取京东评论
举报 使用道具
6#
微米 初级会员 发表于 2019-3-28 22:54:12 | 只看该作者
只是想采集数据,我用了那个快捷采集方法,可是不行啊,
举报 使用道具
7#
微米 初级会员 发表于 2019-3-28 22:58:43 | 只看该作者
https://www.gooseeker.com/secure/me/data.html
我出现的问题,采集状态不是已采集。
举报 使用道具
8#
微米 初级会员 发表于 2019-3-28 23:01:07 | 只看该作者
上面那个网址是我出现的问题,采了好几次都没成功
举报 使用道具
9#
maomao 论坛元老 发表于 2019-3-28 23:36:17 | 只看该作者
微米 发表于 2019-3-28 23:01
上面那个网址是我出现的问题,采了好几次都没成功

快捷采集淘宝之前,也要在GS浏览器登陆淘宝
举报 使用道具
10#
Fuller 管理员 发表于 2019-3-28 23:42:29 | 只看该作者
除了要登录淘宝,采集淘宝要比较紧密地检查采集状态的变化,淘宝特别容易出验证码,如果在DS打数机浏览器窗口中碰到了滑块验证码,要赶快手工滑一下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 19:30