581#
bowieD 金牌会员 发表于 2017-12-13 15:55:40 | 只看该作者
大头阿头阿大头 发表于 2017-12-13 15:14
请问为什么采集完成后,打包那个按钮是灰色的,点不了?

采集完成之后,不要立即关闭爬虫群窗口,因为数据还在入库,需要等待一段时间后,待打包按钮变绿能进行打包再关闭。
举报 使用道具
582#
大头阿头阿大头 新手上路 发表于 2017-12-13 16:40:41 | 只看该作者
请问,为什么有时候粘贴了独立网址之后,还是显示让我“至少添加一条独立网址”呢?
举报 使用道具
583#
wangyong 版主 发表于 2017-12-13 17:43:27 | 只看该作者
添加了什么样的网址?是不是格式不对
举报 使用道具
584#
pashuju 新手上路 发表于 2017-12-16 10:32:36 | 只看该作者
用微博关键词搜搜索功能,选则日期2016-4-6到2016-4-30,为什么只能爬取出4.29和4.30的数据(最后一页)的数据,其他的爬取不到呢,谢谢。
举报 使用道具
585#
Fuller 管理员 发表于 2017-12-16 11:30:48 | 只看该作者
pashuju 发表于 2017-12-16 10:32
用微博关键词搜搜索功能,选则日期2016-4-6到2016-4-30,为什么只能爬取出4.29和4.30的数据(最后一页)的 ...

首先要检查有没有在GS浏览器中登录微博,一定要登录微博,否则,抓取的内容就会受到限制。

其次,要确保搜索结果分页数不要超过50页,如果内容很多,超过了,就要把搜索的时间范围缩短,分成多段进行搜索
举报 使用道具
586#
xiaokeshuihou 新手上路 发表于 2017-12-21 17:22:01 | 只看该作者
唔,请问采集状态显示采集中,然后采数机显示采集完成,等待下一批数据,这个时候应该如何操作呢?
举报 使用道具
587#
bowieD 金牌会员 发表于 2017-12-21 17:36:21 | 只看该作者
xiaokeshuihou 发表于 2017-12-21 17:22
唔,请问采集状态显示采集中,然后采数机显示采集完成,等待下一批数据,这个时候应该如何操作呢? ...

1,如果你加入了多条线索的话,爬虫群窗口就会获取其他线索继续采集。
2,如果你只有一条线索,采集的数据正在入库,不要关闭爬虫群窗口,等待结果入库完成就可以打包下载数据了。
举报 使用道具
588#
gz51837844 管理员 发表于 2018-1-11 19:46:22 | 只看该作者
昨天发布的爬虫V8.5.0, 采集微博更稳定, 请到集搜客官网下载
举报 使用道具
589#
12345tia 新手上路 发表于 2018-1-12 16:48:29 | 只看该作者
不知道这个里面有没有可以设置抓取微博评论的起、止时间,因为有的评论想抓取一个时间段的,如果没有,想请教一下大神该该怎么抓取一个时间段的微博评论呢?
举报 使用道具
590#
数据集二期 中级会员 发表于 2018-1-12 17:46:08 | 只看该作者
12345tia 发表于 2018-1-12 16:48
不知道这个里面有没有可以设置抓取微博评论的起、止时间,因为有的评论想抓取一个时间段的,如果没有,想请 ...

微博评论不能直接通过时间筛选,可以把评论全部采集下来,在采集评论的时候把时间抓下来,然后在excel里筛选。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 13:14