1141#
Fuller 管理员 发表于 2020-8-17 15:07:38 | 只看该作者
JiahuiZhu 发表于 2020-8-17 12:58
为什么一直是未采集呢

在采集任务界面上都有一个“启动采集”按钮,点击就会运行爬虫群
举报 使用道具
1142#
ykl1031300815 新手上路 发表于 2020-9-4 12:03:35 | 只看该作者
采集微博博文数量,不知为什么显示当前共有0条数据可以采集,明明微博有相应博文
举报 使用道具
1143#
Fuller 管理员 发表于 2020-9-4 12:22:35 | 只看该作者
ykl1031300815 发表于 2020-9-4 12:03
采集微博博文数量,不知为什么显示当前共有0条数据可以采集,明明微博有相应博文 ...

用的是哪个工具?博主主页采集?还是关键词搜索采集?
举报 使用道具
1144#
ykl1031300815 新手上路 发表于 2020-9-4 14:39:29 | 只看该作者
Fuller 发表于 2020-9-4 12:22
用的是哪个工具?博主主页采集?还是关键词搜索采集?

关键词
举报 使用道具
1145#
damdadi 新手上路 发表于 2020-9-4 14:46:38 | 只看该作者
本帖最后由 damdadi 于 2020-9-4 14:53 编辑

请问,抓取全部微博内容后,很多条微博文字太多没有抓全,最后几个字是展开全文c,这个问题怎么解决?
举报 使用道具
1146#
小蜜蜂测试162 高级会员 发表于 2020-9-4 15:01:50 | 只看该作者

你加一下这个QQ群:813874590
把相关截图发一下
举报 使用道具
1147#
Fuller 管理员 发表于 2020-9-4 15:03:00 | 只看该作者

要预先在集搜客浏览器中登录微博,正在采集过程中,不能最小化爬虫窗口,还没有采集完成的时候,不要关闭窗口。可以加入qq群,让技术支持协助诊断一下:661795153
举报 使用道具
1148#
小蜜蜂测试162 高级会员 发表于 2020-9-4 15:03:16 | 只看该作者
damdadi 发表于 2020-9-4 14:46
请问,抓取全部微博内容后,很多条微博文字太多没有抓全,最后几个字是展开全文c,这个问题怎么解决? ...

把有展开全文字样的博文独立链接找到后,添加到展开全文的快捷采集:https://www.gooseeker.com/res/da ... 8%E9%87%87%E9%9B%86
举报 使用道具
1149#
Fuller 管理员 发表于 2020-9-4 15:04:20 | 只看该作者
damdadi 发表于 2020-9-4 14:46
请问,抓取全部微博内容后,很多条微博文字太多没有抓全,最后几个字是展开全文c,这个问题怎么解决? ...

在excel中,把这些网址过滤出来,添加到这个快捷采集工具中,会展开采集全文:https://www.gooseeker.com/res/datadiy.html?category=%E7%83%AD%E9%97%A8%E7%BD%91%E7%AB%99&web=%E6%96%B0%E6%B5%AA%E5%BE%AE%E5%8D%9A&rule=%E5%BE%AE%E5%8D%9A%E5%8D%9A%E6%96%87%E5%B1%95%E5%BC%80%E5%85%A8%E9%83%A8%E9%87%87%E9%9B%86
举报 使用道具
1150#
pighill 新手上路 发表于 2020-9-7 09:10:56 | 只看该作者
请问MAC电脑在终端如何手动打开多个窗口爬数据?我要爬500个博主信息,是否开的窗口越多,完成的越快呢?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-10-19 06:15