微博关键词搜索某时间段微博,抓取几页就显示无线索了,微博抓取应该能翻页50页的呀,为什么只能抓取几页就停止了呢

举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2020-11-13 14:53

来自 9#
wangyong 版主 发表于 2020-11-13 14:53:48 | 只看该作者
在集搜客新发布的数据管家软件中使用集搜客微博工具箱微博关键词搜索工具,可以输入关键词直接采集数据,使用的规则是集搜客团队已开发好的准确规则



输入关键词的同时也可以输入要采集的时间范围,同时用上细分条件这个功能,可以突破只能采集五十页数据的限制



数据结果展示:



使用过程中有什么问题或者其他建议欢迎跟帖交流~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
沙发
umsung 高级会员 发表于 2017-10-20 17:26:39 | 只看该作者
爬取数据的时候有没有登陆微博?如果没有登陆的话就只能翻几页
举报 使用道具
板凳
娜娜子 新手上路 发表于 2017-10-20 22:47:48 | 只看该作者
登陆了微博的
举报 使用道具
地板
Fuller 管理员 发表于 2017-10-21 08:57:43 | 只看该作者

网速怎么样?不要通过vpn或者proxy,这样会使网络不稳定
你要采集的网址是什么?
举报 使用道具
5#
娜娜子 新手上路 发表于 2017-11-4 11:41:32 | 只看该作者
这个网址:http://s.weibo.com/weibo/%25E5%258C%25BB%25E6%2582%25A3?topnav=1&wvr=6&b=1
举报 使用道具
6#
Fuller 管理员 发表于 2017-11-4 12:15:54 | 只看该作者
娜娜子 发表于 2017-11-4 11:41
这个网址:http://s.weibo.com/weibo/%25E5%258C%25BB%25E6%2582%25A3?topnav=1&wvr=6&b=1

这个关键词搜到的内容很多,要设置好时间段,分成多段,每段不要超过30页,这样就能比较全采集下来。你用微博采集工具箱的时候,时间段设置了多久?
举报 使用道具
7#
娜娜子 新手上路 发表于 2017-11-4 15:50:49 | 只看该作者
Fuller 发表于 2017-11-4 12:15
这个关键词搜到的内容很多,要设置好时间段,分成多段,每段不要超过30页,这样就能比较全采集下来。你用 ...

没有设置时间呢,是参数那个吗?我分时段采集试过,它读取几页会输入验证码,有些采集两三页就没有了
举报 使用道具
8#
Fuller 管理员 发表于 2017-11-4 16:40:59 | 只看该作者
娜娜子 发表于 2017-11-4 15:50
没有设置时间呢,是参数那个吗?我分时段采集试过,它读取几页会输入验证码,有些采集两三页就没有了
...

如果出验证码,说明你的IP已经被微博记下来了,需要:
1,清理爬虫的缓存。在GS浏览器的右上角,点击进入


2,换IP,如果是ADSL或者拨号上网,那么重新拨号就行

3,重新运行GS浏览器,访问和登录微博,再运行爬虫

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-21 12:53