欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

新冠病毒数据分析报告

程序员文章站 2024-03-08 11:11:46
...

新冠病毒数据分析报告

数据链接:https://www.kaggle.com/su*rajkumar/novel-corona-virus-2019-dataset/kernels

1.概述:数据开始日期2020/1/22,数据截止日期2020/3/22。首先对整体做出大概分析和展现,再分别对中国和其他国家做出描述性分析

2.基本特征
新冠病毒数据分析报告

                    图(1)

2.1表1是此次数据的基本特征,经过检查发现国内省份并无缺失(调查发现*原有1例,但已经治愈。获取数据中并没有出现*),对于其他国家主要针对国家,不关心省份,数据基本完整。

新冠病毒数据分析报告

                                                   图(2)

新冠病毒数据分析报告

                                                  图(3)

2.2图(2)(3)是对于国内外的一个整体展示分析,可知,截止3月22日,意大利确诊人数已经达到69176反超中国。

2.3由图(3)可知,随着时间的推移,在2月12日上升坡度较大,在3月12日确诊人数数量急剧上升,反观治愈人数数量稳步上升,死亡人数,也是在3月12开始出现逐渐上升,可知3月12日病毒肆虐最为严重,达到了爆发点。
新冠病毒数据分析报告

                                                   图(4)

新冠病毒数据分析报告

                                                    图(5)

新冠病毒数据分析报告

                                                   图(6)

新冠病毒数据分析报告

                                                     图(7)

新冠病毒数据分析报告

                                                     图(8)

新冠病毒数据分析报告

                                                      图(9)

3 国内:

3.1.
据图5可知,国内在2月12-13之间斜率近乎垂直,可知病毒传染人数极度增加,且前面提到世界也在12-13日病毒传染人数急剧增加,由此可推断,在12-13日世界感染人数的增加量主要来与中国。

验证推断:

country=df[df['Country/Region']=='Mainland China']        
country1=country[country['ObservationDate']=='02/12/2020']['Confirmed'].sum()        
country2=country[country['ObservationDate']=='02/13/2020']['Confirmed'].sum()       
print(country2-country1)
       
other_country1=df[df['ObservationDate']=='02/12/2020']['Confirmed'].sum()        
other_country2=df[df['ObservationDate']=='02/13/2020']['Confirmed'].sum()
print(other_country2-other_country1)

新冠病毒数据分析报告

根据计算,国内12-13日感染人数为15133人,世界感染人数为15148人,可以证明图3世界感染人数突然小幅上升的主要原因是,在这一天国内感染人数增加幅度大,从侧面反映出至少在2.12-2.13之间病毒主要在国内传播。

3.2.确诊人数在三月初斜率基本水平,即感染新增人数逐渐的减少,在2月20日到23日之间,康复人数基本成阶梯式上升,随后
康复人数逐渐上升。死亡人数一直处于一个偏低的状态。

3.3如图(5)(6)(7)(8)可知,确诊/死亡/康复在湖北省的人数都远高于其他省,众所周知,此次病毒首次发现也是在湖北,在图(9)中可知,省份康复率都高达75%以上, 死亡率也在10%左右。
新冠病毒数据分析报告

                                                    图(10)

新冠病毒数据分析报告

                                                     图(11)

新冠病毒数据分析报告

                                                      图(12)

新冠病毒数据分析报告

			                              图(13)

4.国外:

4.1 如图(10) (11) (12) 分别取确诊/死亡/康复前20的国家,显然截止3/22日,意大利的确诊人数已经达到了69176人,死亡人数也是远高于其他国家,在康复人数的数量伊朗排名第一。

4.2
根据图(13)所示,虽然伊朗和韩国的康复率是远高于其他国家,但最多只有40%,而国内的康复率基本达到75%以上。在死亡率上国外最高为10%,与国内湖北省基本持平。

5.总结:

时间2020/1/22-2020/3/22。分别进行三方面描述;1是世界整体病毒传播情况,2是对于国内病毒的传播情况,3是对于一部分其他国家,都对其进行了展示与分析,根据目前情况来看,在病毒发展初期,中国传播较快,确诊人数也快速增加,从三月初开始,国内疫情得到控制,康复人数稳步上升,确诊人数几乎不再增加,相反国外传播势头迅猛,以意大利为首确诊人数反超国内,并且,观察数据可知,美国截止3/22日共有25681人,可康复率仅有2%左右,预测美国将在未来与意大利的确诊人数会大幅上涨。

相关标签: 奔奔的项目1