今天尝试用数据管家抓取新浪微博关键词搜索结果, 整个过程很流畅,很好用。
这里把步骤记录下来做个分享:
1. 从集搜客官网或技术交流QQ群,下载数据管家软件, 然后一键安装。
2. 运行数据管家。如果是第一次运行集搜客爬虫软件或者数据管家,可以按提示输入爬虫账号和密码
3. 进入微博工具箱关键词工具(注:第一次会提示登录集搜客官网), 输入关键词和起始日期,点击"确认添加"。
(因为微博翻页限制最大50页。如果本次结果很多而超过50页,可以点击"细分条件", 把时间细分,这样爬虫可以采集很多个50页。参见这个帖子:微博关键词采集 ,在设置细分条件的地方有分段时间粒度,那个是什么意思?)
4. 登录微博:在数据管家新打开一个网页tab窗口, 访问新浪微博并登录
5. 点击关键词工具页面的"启动采集"按钮, 数据管家会打开2个新的tab窗口开始采集。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
|
|
|
共 2 个关于本帖的回复 最后回复于 2020-7-28 11:27