1131#
Fuller 管理员 发表于 2020-8-6 11:21:46 | 只看该作者
小马快跑 发表于 2020-8-6 10:59
采集过程中能中断吗,应该使用强制关闭还是安全关闭?中途关闭后已经采集的数据可以导出吗? ...

如果还在翻页采集中,强制关闭以后,翻页就中断了,后面页面的内容就采集不到了。

如果是采集单页,强制关闭会漏掉当前页

安全关闭会确保翻页完成或者单页采集完成才关闭。

无论是否强制关闭,只要数据已经打包了,都可以导出数据。爬虫运行的时候,有两个爬虫群窗口,一个是打包,一个是采集。采集那个强制关了,打包那个最好等几分钟,这样就能保证已经采集下来的数据可以导出来
举报 使用道具
1132#
hepeitong 新手上路 发表于 2020-8-11 02:41:17 | 只看该作者
请问是否可以按照博文发布时间采集固定时间段内的微博?
举报 使用道具
1133#
Fuller 管理员 发表于 2020-8-11 08:42:20 | 只看该作者
hepeitong 发表于 2020-8-11 02:41
请问是否可以按照博文发布时间采集固定时间段内的微博?

如果是关键词搜索,就可以,在高级搜索那里,可以设置时间段作为搜索条件。在集搜客微博搜索采集工具的界面上,也有对应的筛选条件。

如果是采集指定博主的某个时间段的微博,可以可以设置

其他情况没有这个筛选项
举报 使用道具
1134#
hepeitong 新手上路 发表于 2020-8-11 14:18:30 | 只看该作者
Fuller 发表于 2020-8-11 08:42
如果是关键词搜索,就可以,在高级搜索那里,可以设置时间段作为搜索条件。在集搜客微博搜索采集工具的界 ...

请教一下采集指定博主的某个时间段的微博在哪里设置?没找到
举报 使用道具
1135#
wangyong 版主 发表于 2020-8-11 14:32:08 | 只看该作者
hepeitong 发表于 2020-8-11 14:18
请教一下采集指定博主的某个时间段的微博在哪里设置?没找到



在微博博主页的高级搜索中可以设置搜索时间
举报 使用道具
1136#
JiahuiZhu 新手上路 发表于 2020-8-17 12:58:18 | 只看该作者
为什么一直是未采集呢
举报 使用道具
1137#
王建国 高级会员 发表于 2020-8-17 14:08:58 | 只看该作者
JiahuiZhu 发表于 2020-8-17 12:58
为什么一直是未采集呢

需要启动爬虫群采集,爬虫群窗口启动来了吗
举报 使用道具
1138#
Fuller 管理员 发表于 2020-8-17 15:07:38 | 只看该作者
JiahuiZhu 发表于 2020-8-17 12:58
为什么一直是未采集呢

在采集任务界面上都有一个“启动采集”按钮,点击就会运行爬虫群
举报 使用道具
1139#
ykl1031300815 新手上路 发表于 2020-9-4 12:03:35 | 只看该作者
采集微博博文数量,不知为什么显示当前共有0条数据可以采集,明明微博有相应博文
举报 使用道具
1140#
Fuller 管理员 发表于 2020-9-4 12:22:35 | 只看该作者
ykl1031300815 发表于 2020-9-4 12:03
采集微博博文数量,不知为什么显示当前共有0条数据可以采集,明明微博有相应博文 ...

用的是哪个工具?博主主页采集?还是关键词搜索采集?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-8 04:58