快捷导航
本帖最后由 xandy 于 2016-12-6 11:55 编辑


【启动采集前的配置】

  • 预先登陆网站:否
  • 配置打码平台:否

【运行方法】— 详见数据DIY图文教程

  • 用GS爬虫浏览器或者是安装了爬虫软件的火狐浏览器访问天猫商品评论采集页面;
  • 输入一条网址,或者点击“输入多条网址”,然后点击“获取数据”;
  • 点击“启动采集”按钮,采集完成后点击“打包”按钮,就可以下载数据了。

【常见问题】— 欢迎跟帖留言
举报 使用道具
| 回复

共 18 个关于本帖的回复 最后回复于 2021-1-20 20:45

1358203415 初级会员 发表于 2019-6-25 08:38:42 | 显示全部楼层
采集不了
举报 使用道具
Fuller 管理员 发表于 2019-6-25 08:51:10 | 显示全部楼层

遇到什么问题了?给这个快捷采集工具添加的网址正确吗?
举报 使用道具
天秤座的逗比 新手上路 发表于 2019-6-28 11:53:29 | 显示全部楼层
不能自动翻页吗?
举报 使用道具
Fuller 管理员 发表于 2019-6-28 12:13:49 | 显示全部楼层
添加了网址后,要选择页数

快捷采集选择页数

快捷采集选择页数
举报 使用道具
13411175179 新手上路 发表于 2019-7-17 23:44:55 | 显示全部楼层
为什么打包不了
举报 使用道具
Fuller 管理员 发表于 2019-7-18 00:04:58 | 显示全部楼层
采集到数据了?采集状态是已采集吗?
举报 使用道具
MIYAlovemenoy 初级会员 发表于 2020-7-6 09:55:07 | 显示全部楼层
采集状态是已停止,是出现什么问题了吗?
举报 使用道具
Fuller 管理员 发表于 2020-7-6 10:14:58 | 显示全部楼层
MIYAlovemenoy 发表于 2020-7-6 09:55
采集状态是已停止,是出现什么问题了吗?

“已停止”一定是遇到故障了,没有最后完成,可能的原因是:1,没有事先在爬虫浏览器中登录天猫
2,采集过程中遇到了验证码
3,采集还在运行的时候,把爬虫窗口最小化了,就看不到内容了
4,爬虫规则不适合你这个网址,或者你添加的网址不是某一个商品的网址。请把网址发出来我们试试。

另外,你使用的是集搜客爬虫软件?还是集搜客数据管家?
举报 使用道具
MIYAlovemenoy 初级会员 发表于 2020-7-6 15:08:47 | 显示全部楼层
网址信息:https://s.taobao.com/search?q=%E7%BE%8E%E7%BC%9D%E5%89%82&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&spm=a21bo.2017.201856-taobao-item.1&ie=utf8&initiative_id=tbindexz_20170306
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 新闻内容分词后在Jupyter Notebook中使用TF
  • Jupyter Notebook使用sklearn的TF-IDF算法
  • 基于TSC 理论的网络社区中知识动员模式研究
  • 网页数据采集使用嵌套整理箱获得有层次的数
  • 我国旅游管理研究的知识来源与结构—基于文

热门用户

GMT+8, 2021-7-31 13:05