GooSeeker
产品
资源
教程
视频教程
使用交流
资讯
开启辅助访问
切换风格
登录
|
注册
快捷导航
搜索
搜索
本版
文章
帖子
用户
资讯
常见问题
使用交流
python交流
视频教程
资源发布公告
数学建模交流
论坛
›
搜客社区
›
使用交流
2
2338
新浪微博关键词抓取?
w228258549
于 2017-12-1 09:57
发表
[复制链接]
w228258549
积分
694
精华
0
威望
268
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
想要抓取新浪微博上所有关于某一关键词的帖子,但一般抓取的数据都不完整,要怎么办啊?怎么才能抓取全部的数据呢?
举报
使用道具
|
回复
共 2 个关于本帖的回复 最后回复于
4 天前
yangwenge
积分
1289
精华
0
威望
478
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
yangwenge
金牌会员
发表于 2017-12-1 10:00:34
|
显示全部楼层
创建抓取任务的时候,可以设定时间范围,把时间范围设置小一些,比如,一个小时,越细越容易保证完整,因为最可能出问题的是翻页过程,很可能翻页到一半,微博网站速度跟不上,就翻页中断了。如果时间范围小,翻页数量少,容易翻页成功
举报
使用道具
回复
支持
反对
maomao
积分
3914
精华
0
威望
1764
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
maomao
论坛元老
发表于
4 天前
|
显示全部楼层
看看这篇帖子
采集微博关键词搜索,怎样才能采集更多
?
举报
使用道具
回复
支持
反对
返回列表
B
Color
Image
Link
Quote
Code
Smilies
高级模式
您需要登录后才可以回帖
登录
|
立即注册
发表回复
回帖后跳转到最后一页
回复
推荐板块
使用交流
常见问题
数学建模交流
python交流
视频教程
精彩推荐
用Jupyter Notebook的模板管理数据分析过程
Jupyter Notebook在机器学习领域的项目目录
统计学中的二项分布、负二项分布、几何分布
连续动作:自动搜索关键词采集信息—以人民
利用重加载防止采集微博博主消息列表中断
热门话题
1
【集微库】微博采集工具箱使用常见问题
2
有没有办法采集机场的出租车信息?
3
【求助】关于采集阿里巴巴国际站访客详情分
4
集搜客文本分词标注工具(V1版)
5
新浪微博_博主主页
6
怎样使用快捷采集(以采集京东评论为例)
7
集搜客GooSeeker 网络爬虫版本发布公告
8
猫途鹰的评论星级抓取不成功,只有与我样本
9
微信数据采集攻略
10
泰國網頁資訊爬取問題
热门用户
Fuller
帖子:8969
访问主页>>
wangyong
帖子:1378
访问主页>>
ym
帖子:1678
访问主页>>
GMT+8, 2021-2-26 14:26
快速回复
快速发帖
返回顶部
返回列表
共 2 个关于本帖的回复 最后回复于 4 天前