集搜客GooSeeker网络爬虫 › 官方文档 ›资讯 › 查看内容

探究大数据和互联网金融风控模型

2015-11-7 23:39| 发布者: Fuller| 查看: 9805| 评论: 0|来自: 大数据文摘

摘要: 近两年来，“大数据”一词广受热议，提高了企业对数据及数据所产生的价值的重视，整体上推进了我国在各项商务应用和政务应用中数据支持的比重，提升了量化决策和科学决策的水平。 ... ... ... ... ... ...

这是一篇读书笔记，原文来自大数据文摘微信公众号文章

1. 大数据的词义

原文作者这样说：

大数据一词由维克托迈尔-舍恩伯格教授提出。有一种观点认为大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。

然而，各界对于大数据定义存在较大差异，比较通用的观点是用4V特点来描述：

Volume（大量）

Velocity（高速）

Variety（多样）

Value（价值）

然后对互联网数据源分别作了如下评论。

2. 社交网数据对互联网金融风控模型的贡献

社交数据的特点：

非结构化
多维度

原文作者认为：

在互联网金融领域现阶段，分析这些数据产生个人信用的评分，和P2P公司实际业务所需要的评分模型，还有一定差距。

原文较大篇幅想说明网络大数据的效用有限，其实就是一个费效比的问题，也就是投入产出比。那么归根到底还是没有完全掌控挖掘网络数据价值的方法，而其中焦点问题是数据拼接：就是自己业务系统中的传统数据与网上的行为数据进行拼接。拼接难度一方面在于处理技术难度；另一方面是脱敏（不包含姓名等个人隐私信息）等管控造成的。