1161#
Fuller 管理员 发表于 2020-10-21 08:59:56 | 只看该作者
ghkd8566 发表于 2020-10-21 00:25
我是外国人所以我的写汉语不好。请您理解一下我吧。
下次的时候下载微博数据没问题。但是现在我下载微博数 ...

我看到数据库里面已经采集到很多数据了。你是不是已经导出过了?导出以后,如果没有新数据,就不能导出了。以前导出的数据可以在下载那里多次下载:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
1162#
Fuller 管理员 发表于 2020-10-21 09:01:40 | 只看该作者
如果在下载那里也没有看到数据,告诉我们一下,我让管理员重新激活一下下载状态
举报 使用道具
1163#
Daaandaaan 新手上路 发表于 2020-10-23 16:43:49 | 只看该作者
您好,我用工具箱爬取微博某话题下的全部评论,共有十几页,打数机显示已经滚动翻到最后一页了,并停止翻页显示“没有线索了”,但是采集状态还是“采集中”,而且点打包数据,显示只有20条可打包(积分够)是为什么?我花积分打包几次都是只有十几条评论,但明明遍历了很多页,怎么能获取全部的数据呢?
举报 使用道具
1164#
Fuller 管理员 发表于 2020-10-23 17:04:38 | 只看该作者
Daaandaaan 发表于 2020-10-23 16:43
您好,我用工具箱爬取微博某话题下的全部评论,共有十几页,打数机显示已经滚动翻到最后一页了,并停止翻页 ...

在后台看到的日志,你每次采集到的数据量比较小。

爬虫运行的时候,爬虫窗口一定要尽量放大,还要登录好微博。如果这些都没有问题。你把要采集的微博网址发出来,我试试
举报 使用道具
1165#
杨愿安 新手上路 发表于 2020-10-24 10:49:39 | 只看该作者
请问可以自定义抓取前几次翻页的评论吗?不需要那么多
举报 使用道具
1166#
Fuller 管理员 发表于 2020-10-24 22:22:34 | 只看该作者
杨愿安 发表于 2020-10-24 10:49
请问可以自定义抓取前几次翻页的评论吗?不需要那么多

用微博采集工具箱的话,不能限定翻页次数。微博采集规则可以单独下载下来运行,就像自己定义的规则一样运行,这样就能限定翻页次数。新浪微博的采集规则在这个版块中找:https://www.gooseeker.com/res/cr ... iew&resType=906
举报 使用道具
1167#
ujiaku2020 初级会员 发表于 2020-10-26 17:16:25 | 只看该作者
为什么每次采集大V粉丝数据都不全,一次任务,100个大V,理论应该1W条粉丝数据,但是最多只有5000多条?
举报 使用道具
1168#
wangyong 版主 发表于 2020-10-26 17:29:10 | 只看该作者
采集的时候有没有把爬虫窗口最小化?采集的时候不能最小化,要保持正常

另外检查一下数据存储目录下的harvestrecord文件里面有没有文件

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
1169#
acui123 新手上路 发表于 2020-10-27 13:27:58 | 只看该作者
请问,那个采集微博评论的为什么只能采集15条评论啊
举报 使用道具
1170#
wangyong 版主 发表于 2020-10-27 14:17:05 | 只看该作者
acui123 发表于 2020-10-27 13:27
请问,那个采集微博评论的为什么只能采集15条评论啊

采集的时候在爬虫软件里登录微博了吗?

添加的什么网址,我们测试一下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-10-19 06:24