怎样抓取微博上关于出租车的相关数据?
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2019-9-13 16:25

沙发
www12345 新手上路 发表于 2019-9-13 15:13:21 | 只看该作者


举报 使用道具
板凳
Fuller 管理员 发表于 2019-9-13 16:25:23 | 只看该作者
你要用微博上的数据解答数学建模竞赛题吗?今天刚好是比赛的日子,如果是这样,你的思路很特别。

如果要采集文本的话,必须做文本表示处理,才能用文本跟其他维度的数据一起运算。有这两个工具:
1,微博采集工具箱:可以根据关键词搜索采集,或者其他的采集方式
2,分词和文本分析:分词和基于人工操作的文本特征出来,还可以把导出的特征词做进一步处理,最终将文本表示成一定格式,用于多维度分析

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 00:25