|
意见领袖的定义是什么?具有什么特征?基于特征识别模型来判断,所以,识别意见领袖主要是一个基于模型计算判断的过程,这篇讨论很有参考价值:意见领袖是如何影响普通人的消费行为的? - 经济学
而集搜客网络爬虫在这类项目中只是解决微博数据的爬取问题。如果有了一个初步的特征模型,可以更加有选择地爬数据。即便还没有一个明确的模型,从微博上爬取如下方面的数据都会用于模型计算:
1,博主的粉丝和关注
2,博主的详细资料
3,博主发表的微博内容
4,爬转发和评论,用于统计博主参与的微博
5,爬#话题
6,根据关键词爬微博使用集微库-微博采集工具箱将上面的内容爬下来以后,基于特征模型对数据抽取和统计,也可能用更加复杂的算法,判断一个博主是否为意见领袖
|
|
共 1 个关于本帖的回复 最后回复于 2016-10-14 16:33