最近听到好几个博士去做辅导员的传闻, 我想用爬虫软件爬取微博话题-博士当辅导员是屈才吗, 并且做下情感分析。
举报 使用道具
| 回复

共 11 个关于本帖的回复 最后回复于 2021-2-3 12:01

沙发
内容分析应用 金牌会员 发表于 2021-2-3 10:18:41 | 只看该作者
可以用集搜客微博工具箱的话题工具,先把这个话题的微博内容采集下来。


举报 使用道具
板凳
内容分析应用 金牌会员 发表于 2021-2-3 10:20:22 | 只看该作者

采集到的微博内容, 打包下载excel文件




举报 使用道具
地板
马涌河畔 金牌会员 发表于 2021-2-3 10:26:14 | 只看该作者
本帖最后由 马涌河畔 于 2021-2-3 10:28 编辑
内容分析应用 发表于 2021-2-3 10:20
采集到的微博内容, 打包下载excel文件

是用那个集搜客分词和情感分析软件做进一步的分析吗?我试试看

举报 使用道具
5#
马涌河畔 金牌会员 发表于 2021-2-3 10:49:19 | 只看该作者

用分词工具生成了词云图,看来比较多的是认为屈才



举报 使用道具
6#
Fuller 管理员 发表于 2021-2-3 10:50:17 | 只看该作者
马涌河畔 发表于 2021-2-3 10:26
是用那个集搜客分词和情感分析软件做进一步的分析吗?我试试看

先做好数据收集工作,用科学的数据收集和抽样的方法。
常见的数据源有三大类:
1,公共传播数据源,比如,互联网,自媒体,报纸杂志等等
2,各种调查和问卷
3,控制实验

用集搜客网络爬虫可以最有效和低成本地完成第一类数据的收集。其中有一个集搜客软件工具值得关注:集搜客百度拓词,可以帮你展开公众传播数据源,发现最好的数据。
举报 使用道具
7#
Fuller 管理员 发表于 2021-2-3 10:58:39 | 只看该作者
马涌河畔 发表于 2021-2-3 10:49
用分词工具生成了词云图,看来比较多的是认为屈才

这个不能这样分析,如果采集了一个知乎上的关于博士当辅导员是否屈才的话题,那一定是一个吐槽大会,整个分析就被带偏了。所以,这个分析不能用来做这个决策:当辅导员是否屈才。

而是应该去分析其他方面,比如,假定认为屈才,
1,那么有哪些方面跟屈才有关。可以建立一个分类,形成一个qualitative data变量,使用描述性统计,用数字化或者图形化的方法做一下解读
2,也可能会有其他衡量的变量,除了qualitative data以外,还有些变量是quantitative的,可以做分布分析、集中度分析等等描述性分析。

总之,
1,首先要明确研究目的
2,然后确定研究对象
3,然后确定测量变量
4,然后根据变量的特点进行解读
举报 使用道具
8#
Fuller 管理员 发表于 2021-2-3 11:06:26 | 只看该作者
《统计学》很有意思,值得花时间好好学习一下。京东上有这本书《统计学》。这本是中文版,我没有看过,不知道翻译的怎么样。原版叫Statistics for Engineering and the Sciences,我看过,里面大量的例子,相当好的一本书
举报 使用道具
9#
马涌河畔 金牌会员 发表于 2021-2-3 11:12:10 | 只看该作者
Fuller 发表于 2021-2-3 10:50
先做好数据收集工作,用科学的数据收集和抽样的方法。
常见的数据源有三大类:
1,公共传播数据源,比如 ...

我试试用集搜客的百度拓词工具来拓展下, 看看相关的话题及链接

举报 使用道具
10#
马涌河畔 金牌会员 发表于 2021-2-3 11:40:10 | 只看该作者
以“博士当辅导员”作为核心词, 用拓词工具拓展了1次,得到了相关的拓展搜索词和话题。



举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 12:01