9 19635

微博签到经纬度数据

数据爬呀爬 于 2019-11-21 15:14 发表 [复制链接]
在使用微博关键词采集和博主主页信息、博主详细信息采集之后还是无法获取签到地点的经纬度,该怎么办呢
举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2021-6-30 15:28

Fuller 管理员 发表于 2019-11-21 15:39:04 | 显示全部楼层
在本网站上搜索 “微博签到”,能看到很多以前的讨论。可以在这个网页上搜索:https://www.gooseeker.com/tuto/tutorial.html

比如这篇,看看有没有帮助:https://www.gooseeker.com/doc/thread-13390-1-1.html

要变成经纬度其实挺容易的,在百度地图接口上就能进行翻译,用地址名作为输入,就能翻译成经纬度
举报 使用道具
数据爬呀爬 初级会员 发表于 2019-11-21 15:53:39 | 显示全部楼层
这一篇之前我也看过,就是自定义翻页采集对吧,那经纬度需要用到百度地图接口吗?不能在采集的时候进行设置而得到吗
举报 使用道具
Fuller 管理员 发表于 2019-11-21 16:56:27 | 显示全部楼层
数据爬呀爬 发表于 2019-11-21 15:53
这一篇之前我也看过,就是自定义翻页采集对吧,那经纬度需要用到百度地图接口吗?不能在采集的时候进行设置 ...

我看到这些签到地点全部是一些大地方,没有某某路某某号这种详细的地址,所以,这样也不会有几个地名,手工翻译就行了吧?
举报 使用道具
数据爬呀爬 初级会员 发表于 2019-11-21 18:28:44 | 显示全部楼层
这样的啊,那当然也可以,只是比较繁琐一些。那我先试试看吧
举报 使用道具
数据爬呀爬 初级会员 发表于 2019-11-24 14:39:18 | 显示全部楼层
我试了下,是可以在百度地图上面直接找到地点,但是因为地点比较多的话就不可能一直重复这个操作的,是不是还有别的办法呢
举报 使用道具
Fuller 管理员 发表于 2019-11-24 15:41:49 | 显示全部楼层
数据爬呀爬 发表于 2019-11-24 14:39
我试了下,是可以在百度地图上面直接找到地点,但是因为地点比较多的话就不可能一直重复这个操作的,是不是 ...

你一共有多少个地点?
举报 使用道具
数据爬呀爬 初级会员 发表于 2019-11-24 16:33:10 | 显示全部楼层
目前还没有确定,但是肯定有好几百上千吧,因为都是很具体的地点,景区、博物馆等各方面的点
举报 使用道具
Fuller 管理员 发表于 2020-2-22 19:16:18 | 显示全部楼层
已经上线了4个微博签到数据的快捷采集,不用做规则,直接使用:
1,微博签到采集_主页
2,微博签到采集_探索此地
3,微博签到采集_此地热议
4,微博签到采集_来过此地的人

用这些工具把微博数据采集下来以后,可以把里面的地址信息找出来,然后再在百度地图api上翻译成经纬度。

找的过程中,可以手工找,手工去查百度得到经纬度。如果数量很大,那就要写一个程序翻译经纬度,或者委托我们做处理
举报 使用道具
Fuller 管理员 发表于 2021-6-30 15:28:35 | 显示全部楼层
Fuller 发表于 2020-2-22 19:16
已经上线了4个微博签到数据的快捷采集,不用做规则,直接使用:
1,微博签到采集_主页
2,微博签到采集_探 ...

使用Python程序翻译经纬度的方法参看这篇:《Jupyter Notebook怎样获取微博签到地的经纬度并在地图上显示》。
其实最麻烦的是在数据整理上,采集下来的地址信息不规范,需要转换成规范的地址,把规范的地址交给百度地图,通过api可以获得经纬度。用Jupyter Notebook编写Python程序,可以体验到交互式数据加工
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 16:26