本帖最后由 马涌河畔 于 2021-6-4 10:53 编辑

我在知网上看到一篇论文: 《Social Media Data-Based Sentiment Analysis of Tourists’ Air Quality Perceptions》(中文:基于社交媒体数据的游客空气质量感知情感分析)
这篇论文使用gooseeker收集2011年1月至2017年12月新浪微博上游客发布的195个中国5A级旅游目的地空气质量评论27 500条
然后利用Gooseeker、ROST CM ( Content Mining System )和BosonNLP ( Natural Language Processing )工具进行内容分析

如果我想在微博上收集游客有关城市空气质量的博文和评论, 应该怎么弄呢?
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2021-6-4 10:35

内容分析应用 金牌会员 发表于 2021-6-4 10:26:21 | 显示全部楼层
本帖最后由 内容分析应用 于 2021-6-4 10:37 编辑

可以这样做:
1. 在微博上搜索某个城市空气的话题, 比如:西安空气


QQ截图20210604102426.png

举报 使用道具
内容分析应用 金牌会员 发表于 2021-6-4 10:30:00 | 显示全部楼层
本帖最后由 内容分析应用 于 2021-6-4 10:58 编辑

2. 把上一步搜索到的话题添加到微博工具箱的话题广场讨论内容工具, 采集话题相关的博文和网址,博文内容就可以用于后续的分析

QQ截图20210604105822.png

举报 使用道具
内容分析应用 金牌会员 发表于 2021-6-4 10:35:08 | 显示全部楼层
本帖最后由 内容分析应用 于 2021-6-4 10:36 编辑

3. 把上一步采集到的博文做个筛选, 选出博文评论数大于0的, 把博文网址添加进微博评论工具, 采集这些博文的评论
QQ截图20210604103449.png

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 21:54