快捷导航

城市要素库时空分析系统开发设计要点

2018-4-23 10:34| 发布者: xandy| 查看: 768| 评论: 0|原作者: 集搜客GooSeeker

摘要: 自从发布了GooSeeker城市要素库时空分析项目启动的文章后,陆续收到了很多朋友的私信,有感兴趣的,有交流技术的,也有质疑的,说实话,我们GooSeeker开发团队是在做一次数字城市建设的尝试,数据源全部来自于开放的 ...

自从发布了GooSeeker城市要素库时空分析项目启动的文章后,陆续收到了很多朋友的私信,有感兴趣的,有交流技术的,也有质疑的,说实话,我们GooSeeker开发团队是在做一次数字城市建设的尝试,数据源全部来自于开放的互联网,通过加工整理围绕城市要素建设数据互联,同时作为共享的数据集和数据分析资源,让大家可以切实地去使用和探索,下面介绍一下城市要素库的几个技术要点。


城市要素库设计理念

最初为什么要设计城市时空分析要素库,是有以下几个原因:

1. 很多数据交易平台在做数据货架,将数据以商品的形式进行“兜售”,有些数据是真的有“价值”,但是都是独立的包,新鲜度也有限

2. 大数据维度过于庞大,即使数据在某个地方,很多人也难于找到

3. 数据需求是直接的,但是要把散落在多块的数据整理起来,数据处理并不容易。

4. 受“数据立方”的启发,提供数据探索可视化


对于上面提到1,2,3点,我们进行了部分用户调研,得到了下面的反馈:

1. 数据货架上数据无法精准化击中用户的数据需求。

2. 把先有数据再有使用目的用户排除,先有使用目的用户往往找不到自己想要的数据,算是一道坎。

3. 针对2,就算找到了数据却不会处理也是一道坎。

4. 具体来聊聊“数据立方”,假设我们有与城市相关的要素数据,结合“描述维”、“度量维”、“时间维”、“地理维”,我们可以全方位了解不同地区(省、市、区/县等)对应的数据,进行时间和空间上的对比分析


为了规范化,为此我们进行了概念上的统一:

● 描述维:指对数据本身的描述项。比如我们浏览招聘信息,这些招聘数据的描述维有:发布这条招聘信息公司的性质/公司规模/公司行业、招聘的工作经验/最低学历要求、该招聘岗位所属的行业/职业分类等;

● 度量维:基于描述项的统计维度。比如基于公司信息描述维层面上公司数的统计,基于招聘信息描述维层面上职位数的统计、平均薪酬的统计等;

● 时间维:分年、季、月、周、日的统计计算;

● 地理维:全国、省、市、区/县的统计计算,再细的话就是某个具体的地理点了

基于数据立方体的特性,你可以对数据探索进行无限地想象。


城市要素库建设情况

目前城市要素库已经上线了“招聘、房产、环境、气象、城建”相关的数据。后面在数据丰富度上、查询性能上、用户互动上、界面UI以及交互上都会进行持续优化。

如下图所示,红框部分分别对应“描述维”、“度量维”、“时间维”和“地理维”。

怎么用上城市要素库

城市要素库会把基于地理位置的数据在地图上直接可视化,让你可以很直接地看出数据的分布情况,使用操作很简单,下面介绍一下:

1, 选择不同“描述维”、“度量维”、和“时间维”,查询到对应的地理分布数据

2, 地图的粒度可以进行放大和缩小

3, 可以通过“地理维”快速定位到某个地区

4, 可以保存为图片插入到你的分析案例中,或者一键分享给你的小伙伴

5, 将数据加入到对比台进行城市间的对比分析

6, 查看数据集介绍并下载结构化的数据


城市要素库就是一个全方位的地理数据探索系统。房产方面,你可以看全国不同地区不同时间的二手房分布情况、房价情况等;招聘方面,你可以看不同规模公司给出的平均薪酬如何;城建方面,可以了解不同基础设施在全国各地的分布情况等等。


随着数据的丰富,在这个项目中我们会有专门的团队探索这些数据的应用,结合可视化分析工具,将过程和成果分享出来。项目探索传送门:可视化城市要素大数据时空探索分析


鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-10-17 03:08