需要 以下的内容:
微博用户数据
序号字段名标识符
1用户IDuserID
2地址adress
3性别gender
4创建时间creationT
5签到时间checkT
6签到点IDpoiid
微博用户签到数据
序号字段名标识符
1用户IDuserID
2地点location
3性别gender
4年龄age
5经度x
6纬度y
7日期date
8时间time
9签到时间checkinTime
10签到点IDpoiid

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-2-22 19:16

来自 2#
Fuller 管理员 发表于 2020-2-22 19:16:50 | 只看该作者
已经上线了4个微博签到数据的快捷采集,不用做规则,直接使用:
1,微博签到采集_主页
2,微博签到采集_探索此地
3,微博签到采集_此地热议
4,微博签到采集_来过此地的人

用这些工具把微博数据采集下来以后,可以把里面的地址信息找出来,然后再在百度地图api上翻译成经纬度。

找的过程中,可以手工找,手工去查百度得到经纬度。如果数量很大,那就要写一个程序翻译经纬度,或者委托我们做处理
举报 使用道具
板凳
Fuller 管理员 发表于 2019-11-26 22:15:43 | 只看该作者
最近采集微博签到信息的很多,难道有什么研究课题?
最容易实现的采集方案是:
1,先选定好签到景点,进入这个景点的网页,翻页采集所有签到人的网址
2,把所有博主的网址导入采集博主信息的工具(https://www.gooseeker.com/res/softdetail_8.html ),采集他的基本资料。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 04:00