431#
Fuller 管理员 发表于 2017-6-1 14:59:54 | 只看该作者
476181322 发表于 2017-6-1 12:04
你好,请问要怎么设置群爬虫并行呢?

采集微博还想并行,那么一定要记得在每台计算机上用不同的微博账号登录微博。
如果只有一台计算机,轻易不要并行,否则容易被微博封锁。最好在采集2000个网页以后清理cookie,如果能换IP就更好了
举报 使用道具
432#
小黄鸭 新手上路 发表于 2017-6-1 22:42:49 | 只看该作者
数据打包只显示前十条,其他的都要用积分,除了用积分还能有其他方法导出数据吗
举报 使用道具
433#
maomao 论坛元老 发表于 2017-6-1 23:17:50 | 只看该作者
小黄鸭 发表于 2017-6-1 22:42
数据打包只显示前十条,其他的都要用积分,除了用积分还能有其他方法导出数据吗 ...

可以购买旗舰版,打包下载数据不用积分。不限量
举报 使用道具
434#
墨鱼仔1994 新手上路 发表于 2017-6-13 08:24:03 | 只看该作者
你好,微博评论总共有400多条,手动可以把评论全部翻完,但第一次爬出来只有100多条,第二次爬只有20多条,这是怎么回事?
举报 使用道具
435#
maomao 论坛元老 发表于 2017-6-13 08:41:14 | 只看该作者
墨鱼仔1994 发表于 2017-6-13 08:24
你好,微博评论总共有400多条,手动可以把评论全部翻完,但第一次爬出来只有100多条,第二次爬只有20多条, ...

登录微博了吗?
举报 使用道具
436#
gz51837844 管理员 发表于 2017-6-13 08:50:22 | 只看该作者
墨鱼仔1994 发表于 2017-6-13 08:24
你好,微博评论总共有400多条,手动可以把评论全部翻完,但第一次爬出来只有100多条,第二次爬只有20多条, ...

你把微博评论网址发出来, 我们测试一下

举报 使用道具
437#
JcyRita 新手上路 发表于 2017-6-13 23:55:53 | 只看该作者
为什么搜索关键词,不管什么关键词,和什么时间,搜索出来的微博都是一样的
举报 使用道具
438#
maomao 论坛元老 发表于 2017-6-14 07:19:50 | 只看该作者
JcyRita 发表于 2017-6-13 23:55
为什么搜索关键词,不管什么关键词,和什么时间,搜索出来的微博都是一样的 ...

登录微博了吗?
举报 使用道具
439#
善良的手榴弹 新手上路 发表于 2017-6-21 23:33:01 | 只看该作者
为什么我在限定了爬取的时间之后,只能爬出20条数据呢?
举报 使用道具
440#
Fuller 管理员 发表于 2017-6-22 07:48:29 | 只看该作者
善良的手榴弹 发表于 2017-6-21 23:33
为什么我在限定了爬取的时间之后,只能爬出20条数据呢?

登录微博了吗?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-17 12:47