1291#
gz51837844 管理员 发表于 2021-10-29 21:56:25 | 只看该作者
elsieanddonut 发表于 2021-10-29 21:52
请问,开始显示了很多数据,但过了会儿点打包显示没有可打包数据,这种情况该怎么办~ ...

你是在哪里看到“开始显示了很多数据”的?
以前碰到过鼠标点的太快,点了多次, 等于第1次点击打包成功,第2次点击就提示没有数据。
你看看可下载文件里有没有?
举报 使用道具
1292#
elsieanddonut 初级会员 发表于 2021-10-29 22:05:13 | 只看该作者
哦哦哦,我找到了,谢谢!
举报 使用道具
1293#
飞鸿 新手上路 发表于 2021-10-30 13:40:47 | 只看该作者
爬取的内容少了很多,好多​​​​这种...展开全文c  实际就是没爬取完整 这个能解决?
举报 使用道具
1294#
wangyong 版主 发表于 2021-10-30 16:18:40 | 只看该作者
飞鸿 发表于 2021-10-30 13:40
爬取的内容少了很多,好多​​​​这种...展开全文c  实际就是没爬取完整 这个能解决? ...

集搜客微博采集工具箱中通过微博关键词搜索结果采集工具微博博主主页采集工具或者其他微博工具采集微博数据时会采集下带有“展开全文”的数据

在采集结果中通过Excel将含有“展开全文”的数据筛选出来后


将其对应的“博文独立网址”添到微博博文展开全部采集中就可以将“展开全文”后的数据完整采集下来


数据展示:

举报 使用道具
1295#
yyrr_03 初级会员 发表于 2021-11-2 10:41:02 | 只看该作者
关于关键词爬去,按完打包按钮,它打包的是部分的数据,没有打包所有时间段的数据怎么办QUQ
举报 使用道具
1296#
gz51837844 管理员 发表于 2021-11-2 11:00:50 | 只看该作者
yyrr_03 发表于 2021-11-2 10:41
关于关键词爬去,按完打包按钮,它打包的是部分的数据,没有打包所有时间段的数据怎么办QUQ ...

如果微博内容特别多,点击细分条件,设置成一小时一个时间段,这是最细的。到底时间段选多长,要看微博数量,要确保一个时间段内不要超过翻页50页,微博有限制,最多翻页50页,超过了就采集不到了。

对于你说的特定时间段的数据没有的情况, 你可以针对特定的时间段添加新的任务,启动采集

举报 使用道具
1297#
mistds 初级会员 发表于 2021-11-3 23:58:38 | 只看该作者
你好,我想请问一下数据管家如何启动多个爬虫群,谢谢!
举报 使用道具
1298#
gz51837844 管理员 发表于 2021-11-4 07:09:04 | 只看该作者
mistds 发表于 2021-11-3 23:58
你好,我想请问一下数据管家如何启动多个爬虫群,谢谢!

下图示例如果通过”设置“->”爬虫群“来做配置:


这篇教程《用爬虫群采集数据》介绍了如何启动爬虫群
举报 使用道具
1299#
12345wjl 新手上路 发表于 2021-11-12 15:55:04 | 只看该作者
如何爬取在博主主页中搜索关键词后的结果
举报 使用道具
1300#
wangyong 版主 发表于 2021-11-12 16:34:36 | 只看该作者
12345wjl 发表于 2021-11-12 15:55
如何爬取在博主主页中搜索关键词后的结果


在博主主页中选择全部后,在搜索框中进行搜索,搜索完后,把网址输入到博主主页采集工具
https://weibo.com/dfjb?profile_f ... 7%BE%8E%E5%9B%BD#_0
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 14:50