欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

R语言第二章作业

程序员文章站 2022-03-22 23:06:04
...

致读者: 博主是一名数据科学与大数据专业大二的学生,真正的一个互联网萌新,写博客一方面是为了记录自己的学习过程中遇到的问题和思考,一方面是希望能够帮助到很多和自己一样处于困惑的读者。
> 由于水平有限,博客中难免会有一些错误,有纰漏之处恳请各位大佬不吝赐教!之后会写大数据专业的文章哦。
GitHub链接https://github.com/wfy-belief
尽管现在我的水平可能还不太及格,但我会尽我自己所能,做到最好☺
。——天地有正气,杂然赋流形。下则为河岳,上则为日星。


码文不易,可以给我一个小心心吗?♥

导入第三方库

In [1]:

library(openxlsx)
d2.2=read.xlsx('mvexer5.xlsx',sheet='E2.2');

head显示前六行 tail显示后六行

In [2]:

head(`d2.2`)  #读取数据并显示前六行
X
1 1465
2 1760
3 1985
4 2270
5 2980
6 1375

In [3]:

tail(d2.2)  #读取数据并显示后六行
X
45 2290
46 1125
47 1575
48 1815
49 2030
50 2320

In [4]:

min(d2.2)

1000

In [5]:

max(d2.2)

2980

可以得到某月份最低工资为1000元,最高工资为2980元。   画出组距为300的直方图:

In [6]:

H1=hist(d2.2$X,breaks=seq(900,3000,300))     #以组距为300画直方图

R语言第二章作业

编制频数表,列出频数、频率和累计频率:

In [7]:

names(H1)
  1. ‘breaks’
  2. ‘counts’
  3. ‘density’
  4. ‘mids’
  5. ‘xname’
  6. ‘equidist’

In [8]:

data.frame('组中值'=H1$mids,'频数'=H1$counts,'频率'=H1$density*300,'累计频率'=cumsum(H1$density*300))
组中值 频数 频率 累计频率
1050 3 0.06 0.06
1350 7 0.14 0.20
1650 10 0.20 0.40
1950 15 0.30 0.70
2250 8 0.16 0.86
2550 5 0.10 0.96
2850 2 0.04 1.00

用R语言作正态概率图并分析之:

In [9]:

qqnorm(d2.2$X);qqline(d2.2$X)

R语言第二章作业

由正态概率图可以看出数据点基本是一条直线,因此数据可以近似看作正态分布。