新冠病毒数据分析报告
新冠病毒数据分析报告
数据链接:https://www.kaggle.com/su*rajkumar/novel-corona-virus-2019-dataset/kernels
1.概述:数据开始日期2020/1/22,数据截止日期2020/3/22。首先对整体做出大概分析和展现,再分别对中国和其他国家做出描述性分析
2.基本特征:
图(1)
2.1表1是此次数据的基本特征,经过检查发现国内省份并无缺失(调查发现*原有1例,但已经治愈。获取数据中并没有出现*),对于其他国家主要针对国家,不关心省份,数据基本完整。
图(2)
图(3)
2.2图(2)(3)是对于国内外的一个整体展示分析,可知,截止3月22日,意大利确诊人数已经达到69176反超中国。
2.3由图(3)可知,随着时间的推移,在2月12日上升坡度较大,在3月12日确诊人数数量急剧上升,反观治愈人数数量稳步上升,死亡人数,也是在3月12开始出现逐渐上升,可知3月12日病毒肆虐最为严重,达到了爆发点。
图(4)
图(5)
图(6)
图(7)
图(8)
图(9)
3 国内:
3.1.
据图5可知,国内在2月12-13之间斜率近乎垂直,可知病毒传染人数极度增加,且前面提到世界也在12-13日病毒传染人数急剧增加,由此可推断,在12-13日世界感染人数的增加量主要来与中国。
验证推断:
country=df[df['Country/Region']=='Mainland China']
country1=country[country['ObservationDate']=='02/12/2020']['Confirmed'].sum()
country2=country[country['ObservationDate']=='02/13/2020']['Confirmed'].sum()
print(country2-country1)
other_country1=df[df['ObservationDate']=='02/12/2020']['Confirmed'].sum()
other_country2=df[df['ObservationDate']=='02/13/2020']['Confirmed'].sum()
print(other_country2-other_country1)
根据计算,国内12-13日感染人数为15133人,世界感染人数为15148人,可以证明图3世界感染人数突然小幅上升的主要原因是,在这一天国内感染人数增加幅度大,从侧面反映出至少在2.12-2.13之间病毒主要在国内传播。
3.2.确诊人数在三月初斜率基本水平,即感染新增人数逐渐的减少,在2月20日到23日之间,康复人数基本成阶梯式上升,随后
康复人数逐渐上升。死亡人数一直处于一个偏低的状态。
3.3如图(5)(6)(7)(8)可知,确诊/死亡/康复在湖北省的人数都远高于其他省,众所周知,此次病毒首次发现也是在湖北,在图(9)中可知,省份康复率都高达75%以上, 死亡率也在10%左右。
图(10)
图(11)
图(12)
图(13)
4.国外:
4.1 如图(10) (11) (12) 分别取确诊/死亡/康复前20的国家,显然截止3/22日,意大利的确诊人数已经达到了69176人,死亡人数也是远高于其他国家,在康复人数的数量伊朗排名第一。
4.2
根据图(13)所示,虽然伊朗和韩国的康复率是远高于其他国家,但最多只有40%,而国内的康复率基本达到75%以上。在死亡率上国外最高为10%,与国内湖北省基本持平。
5.总结:
时间2020/1/22-2020/3/22。分别进行三方面描述;1是世界整体病毒传播情况,2是对于国内病毒的传播情况,3是对于一部分其他国家,都对其进行了展示与分析,根据目前情况来看,在病毒发展初期,中国传播较快,确诊人数也快速增加,从三月初开始,国内疫情得到控制,康复人数稳步上升,确诊人数几乎不再增加,相反国外传播势头迅猛,以意大利为首确诊人数反超国内,并且,观察数据可知,美国截止3/22日共有25681人,可康复率仅有2%左右,预测美国将在未来与意大利的确诊人数会大幅上涨。
上一篇: 深入学习Java编程中的字符串的进阶使用
下一篇: 大型门户网站实现的十四大技术小结