欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

新冠疫情可视化

程序员文章站 2022-06-01 12:50:35
...
import pandas as pd
import matplotlib.pyplot as plt
import folium # 用来绘制地图,并在地图上打点,画圈,做颜色标记的工具类
import folium.plugins as plugins
import numpy as np
import datetime


# 导入数据
data=pd.read_csv(r'C:\Users\a\Desktop\2019ncov5600\2019_nCoV_data.csv')
data


# 查看数据信息
data.info()


# 数据清洗

# (1)删除无用列:Sno编号列没有用,要删去
data.drop(['Sno'],axis=1,inplace=True) # drop([]),默认情况下删除某一行;如果要删除某列,需要axis=1;参数inplace 默认情况下为False,表示保持原来的数据不变,True 则表示在原来的数据上改变


# (2)填充空白值:部分国家对应的地区为NAN,需要填充为空白字符串
data.fillna('',inplace=True)


# (3)删除无用行:部分国家/地区,受感染人数为0,也被列在表格中,需要删去
data.drop(data[data['Confirmed']==0].index.to_list(),axis=0,inplace=True)  # index() 函数用于从列表中找出某个值第一个匹配项的索引位置


# (4)查看受影响的国家/地区的数量
countries = data['Country'].unique().tolist()
print(countries)


# (5)中国有China, Mainland China两个写法,需要统一;另外还有一些你懂的问题需要修正
data['Country'].replace({'Mainland China':'China','*':'China','Macau':'China','Singapore':'China','*':'China'},inplace=True)
countries=data['Country'].u
相关标签: Python数据分析