本帖最后由 内容分析应用 于 2021-2-24 10:23 编辑
昨天分享了一个COVID-19数据分析的数据集: [数据分析案例分享]我如何使用Jupyter,Python,Pandas和Matplotlib进行自己的COVID-19数据分析
今天再分享一个数据集:COVID-19 Analysis With Python, 这个数据集使用python的pandas,numpy ,matplotlib,plotly进行数据提取与转换,数据探索分析和数据可视化(Data Wrangling, Exploratory Data Analysis and Data Visualization)
Step 1, 导入包(Importing required Packages)
- import pandas as pd
- import matplotlib.pyplot as plt
- import plotly.express as px
- import numpy as np
- import plotly
- import plotly.graph_objects as go
- from plotly.subplots import make_subplots
复制代码 Step 2, 数据获取(Gathering Data)
- import requests
- # Getting Data
- url_request = requests.get("https://services1.arcgis.com/0MSEUqKaxRlEPj5g/arcgis/rest/services/Coronavirus_2019_nCoV_Cases/FeatureServer/1/query?where=1%3D1&outFields=*&outSR=4326&f=json")
- url_json = url_request.json()
- df = pd.DataFrame(url_json['features'])
复制代码 原文示例是用requests获取某网站提供的json数据。
注:数据获取部分,可以使用更强大的通用版爬虫工具:集搜客爬虫软件,并且微博工具箱和快捷采集都是添加网址, 采集完成后直接导出excel。
|
|
|
|
|
共 2 个关于本帖的回复 最后回复于 2021-2-24 10:30