GooSeeker
产品
资源
教程
视频教程
使用交流
资讯
开启辅助访问
切换风格
请
登录
后使用快捷导航
没有帐号?
立即注册
登录
|
注册
快捷导航
资讯
常见问题
使用交流
python交流
视频教程
资源发布公告
数学建模交流
论坛
›
搜客社区
›
使用交流
7
15543
内容分析的抽样怎么做
丁道师
于 2020-2-10 15:52
发表
[复制链接]
[只看楼主]
[打印]
[上一主题]
[下一主题]
丁道师
积分
242
精华
0
威望
94
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
内容分析的抽样怎么做
收藏
0
转播
支持
0
反对
0
举报
使用道具
|
回复
共 7 个关于本帖的回复 最后回复于 2020-3-9 09:48
ym
积分
5311
精华
24
威望
1760
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
沙发
ym
版主
发表于 2020-2-10 16:00:21
|
只看该作者
本帖最后由 ym 于 2020-2-10 16:06 编辑
抽样首先要确定研究总体,包括研究主题和时间跨度,通常是根据研究问题来确定这些范围。确定研究总体后,就是从总体里抽取有代表性的样本,抽样的步骤主要有以下3步:
1、确定从哪些媒介来源上获取样本
2、对选定的时间范围里的时间日期进行抽样
3、确定样本的分析单位
举报
使用道具
回复
支持
反对
Fuller
积分
24025
精华
0
威望
6706
金钱
6
最后登录 2025-4-21
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
板凳
Fuller
管理员
发表于 2020-2-10 16:01:14
|
只看该作者
怎样抽样,虽然有一些一般性的指导原则,但是更需要实践经验,即使两个人一起学习了抽样方法,但是他们抽样做的好坏一定有很大差别。
在学习抽样的一般性指导原则前,先记住这些:抽样的原本目的是为了降低分析成本,建设研究目标是某个地区的15万家医院,每家都研究,成本是支撑不了的,所以,必须挑一些有代表性的出来研究,怎么挑?就是不要被带偏了
举报
使用道具
回复
支持
反对
ym
积分
5311
精华
24
威望
1760
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
地板
ym
版主
发表于 2020-2-10 16:24:30
|
只看该作者
来源抽样,就是对研究主题的数据来源进行选择,比如要选取的媒介渠道有新闻、电视、互联网、书籍等等
举报
使用道具
回复
支持
反对
ym
积分
5311
精华
24
威望
1760
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
5
#
ym
版主
发表于 2020-2-10 16:24:55
|
只看该作者
日期抽样,就是要选择哪一段时间的资料,常用的日期抽样方法有
1、从一个任意的时间点以后,每个n次选择一个样本。但n的选择结果不能是周期性,否则抽样就不具有代表性。比如,对报纸抽样,用7作为间隔数,抽样结果就全是周末出版的,没有涵盖到一周的其他日期,这样就没有代表性。
2、把月按周分段,把周按天分段,从每周里随机抽取不超过两天的样本,合起来就可以代表一个月的总体分布样本。
3、从每个月的日期里随机抽样,可以组成一种“混合周”。比如,从一个月的所有星期一中随机抽取一个星期一,再从星期二里随机抽取一个星期二,以此类推,直至把一周的所有日期都抽齐。
举报
使用道具
回复
支持
反对
ym
积分
5311
精华
24
威望
1760
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
6
#
ym
版主
发表于 2020-2-10 16:32:45
|
只看该作者
分析单位,就是从前面的抽样结果中确定要分析的基本单位,比如文章、段落、句子、词语都是可以作为分析单位的。
在复杂的内容分析里,可以采用多种分析单位,每种分析单位都要有对应的类目系统,用于测量不同的指标
举报
使用道具
回复
支持
反对
微舆情
积分
685
精华
0
威望
296
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
7
#
微舆情
高级会员
发表于 2020-3-9 09:32:16
|
只看该作者
抽样方法从总体上可以分为随机抽样和非随机抽样
一般来讲,量化内容分析要求尽量使用随机抽样方法,但在实际研究中研究者的判断和以往研究的经验也往往是确定抽样方法的根据。
举报
使用道具
回复
支持
反对
微舆情
积分
685
精华
0
威望
296
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
8
#
微舆情
高级会员
发表于 2020-3-9 09:48:21
|
只看该作者
相比传统媒体内容分析,在网络内容分析中,由于网络更新和替换的速度快,因此网络内容分析更强调样本下载的及时性和编码时间的统一性
举报
使用道具
回复
支持
反对
返回列表
B
Color
Image
Link
Quote
Code
Smilies
高级模式
您需要登录后才可以回帖
登录
|
立即注册
发表回复
回帖并转播
回帖后跳转到最后一页
回复
推荐板块
使用交流
常见问题
数学建模交流
python交流
视频教程
精彩推荐
360或火绒等杀毒软件导致GooSeeker爬虫软件
话题分析(NMF模型和LDA模型)软件的安装和
运行Apple无法验证的程序的方法
文本聚类分析软件的安装和使用方法
利用AI阅读和分析文本:扣子COZE记录用户反
热门话题
1
【集微库】微博采集工具箱使用常见问题
2
怎样使用快捷采集(以采集京东评论为例)
3
集搜客文本分词标注工具(V1版)
4
有没有办法采集机场的出租车信息?
5
获得积分的好方法:转发小程序、QQ群、微信
6
【求助】关于采集阿里巴巴国际站访客详情分
7
GooSeeker分词,情感分析和关键词抽取平台使
8
新浪微博_博主主页
9
怎样采集抖音关键词搜索后的数据
10
集搜客GooSeeker 网络爬虫版本发布公告
热门用户
Fuller
帖子:10607
访问主页>>
wangyong
帖子:1731
访问主页>>
gbkuce
帖子:0
访问主页>>
GMT+8, 2025-4-22 16:51
快速回复
快速发帖
返回顶部
返回列表
共 7 个关于本帖的回复 最后回复于 2020-3-9 09:48