新冠疫情可视化
程序员文章站
2022-06-01 12:50:35
...
import pandas as pd
import matplotlib.pyplot as plt
import folium # 用来绘制地图,并在地图上打点,画圈,做颜色标记的工具类
import folium.plugins as plugins
import numpy as np
import datetime
# 导入数据
data=pd.read_csv(r'C:\Users\a\Desktop\2019ncov5600\2019_nCoV_data.csv')
data
# 查看数据信息
data.info()
# 数据清洗
# (1)删除无用列:Sno编号列没有用,要删去
data.drop(['Sno'],axis=1,inplace=True) # drop([]),默认情况下删除某一行;如果要删除某列,需要axis=1;参数inplace 默认情况下为False,表示保持原来的数据不变,True 则表示在原来的数据上改变
# (2)填充空白值:部分国家对应的地区为NAN,需要填充为空白字符串
data.fillna('',inplace=True)
# (3)删除无用行:部分国家/地区,受感染人数为0,也被列在表格中,需要删去
data.drop(data[data['Confirmed']==0].index.to_list(),axis=0,inplace=True) # index() 函数用于从列表中找出某个值第一个匹配项的索引位置
# (4)查看受影响的国家/地区的数量
countries = data['Country'].unique().tolist()
print(countries)
# (5)中国有China, Mainland China两个写法,需要统一;另外还有一些你懂的问题需要修正
data['Country'].replace({'Mainland China':'China','*':'China','Macau':'China','Singapore':'China','*':'China'},inplace=True)
countries=data['Country'].u
上一篇: mysql数据库操作常用sql语句
下一篇: 疫情数据可视化(简单版本)