2 10535

新浪微博关键词抓取?

w228258549 于 2017-12-1 09:57 发表 [复制链接]
想要抓取新浪微博上所有关于某一关键词的帖子,但一般抓取的数据都不完整,要怎么办啊?怎么才能抓取全部的数据呢?
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2021-2-22 22:32

yangwenge 金牌会员 发表于 2017-12-1 10:00:34 | 显示全部楼层
创建抓取任务的时候,可以设定时间范围,把时间范围设置小一些,比如,一个小时,越细越容易保证完整,因为最可能出问题的是翻页过程,很可能翻页到一半,微博网站速度跟不上,就翻页中断了。如果时间范围小,翻页数量少,容易翻页成功
举报 使用道具
maomao 论坛元老 发表于 2021-2-22 22:32:37 | 显示全部楼层
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 00:48