1171#
Fuller 管理员 发表于 2020-11-17 18:06:19 | 只看该作者
Hioooo 发表于 2020-11-17 18:02
请问微博关键词爬出来的数据有很多都是没有展开全文,这个有办法解决吗? ...

要用另一个爬虫工具配合:
1,在导出的结果文件中用筛选的方法,把含有“展开全文"字样的微博网址筛选出来
2,添加到 微博博文展开全部采集 这个快捷采集工具中
举报 使用道具
1172#
wannuo 新手上路 发表于 2020-11-18 00:22:23 | 只看该作者
您好,请问采集微博评论在结束后导出后数量是不对的,但是都显示采集完成,这个如何解决?是否会因为一次添加网址过多需要一个个进行采集?
举报 使用道具
1173#
wannuo 新手上路 发表于 2020-11-18 01:11:48 | 只看该作者
采集日志显示有一些重复内容没有采集,这些内容怎样可以正常采集呢
举报 使用道具
1174#
Fuller 管理员 发表于 2020-11-18 08:00:33 | 只看该作者
wannuo 发表于 2020-11-18 01:11
采集日志显示有一些重复内容没有采集,这些内容怎样可以正常采集呢

如果一条微博评论很多,比如,上万条,很可能会中断。如果这条微博是新近发的,评论采集成功率很高,我采集过2万条。如果微博是以前的,而且是很热门的话题,评论会有被删的情况,在删评论的位置很容易中断。
举报 使用道具
1175#
微博浪人 新手上路 发表于 2020-11-24 10:53:17 | 只看该作者
采集完毕后,不小心点了清空采集任务,导致刚采集的数据没了,求问可以恢复,急!!
举报 使用道具
1176#
gz51837844 管理员 发表于 2020-11-24 11:10:04 | 只看该作者
微博浪人 发表于 2020-11-24 10:53
采集完毕后,不小心点了清空采集任务,导致刚采集的数据没了,求问可以恢复,急!! ...

你的用户名就是这个“微博浪人”? 你是清空了哪个微博工具的任务?
一般来说,删除任务后, 系统会把任务对应的数据打上已删除的标记,在后面系统空闲的时候在删除。在这之前,是可以恢复的

举报 使用道具
1177#
微博浪人 新手上路 发表于 2020-11-24 14:24:27 | 只看该作者
gz51837844 发表于 2020-11-24 11:10
你的用户名就是这个“微博浪人”? 你是清空了哪个微博工具的任务?
一般来说,删除任务后, 系统会把任 ...

是这个微博采集工具箱—微博关键词搜索结果采集工具,请问在哪可以找到标记的数据?
举报 使用道具
1178#
gz51837844 管理员 发表于 2020-11-24 15:10:19 | 只看该作者
微博浪人 发表于 2020-11-24 14:24
是这个微博采集工具箱—微博关键词搜索结果采集工具,请问在哪可以找到标记的数据?
...

我让技术人员后台处理一下, 看看你删除的任务, 数据部分是不是还没有被系统永久删除

举报 使用道具
1179#
微博浪人 新手上路 发表于 2020-11-24 15:12:14 | 只看该作者
gz51837844 发表于 2020-11-24 15:10
我让技术人员后台处理一下, 看看你删除的任务, 数据部分是不是还没有被系统永久删除

...

好的,谢谢了
举报 使用道具
1180#
gz51837844 管理员 发表于 2020-11-24 15:25:47 | 只看该作者

已经恢复了, 你可以登录微博关键词搜索工具, 去打包和下载数据

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-20 02:25