R语言第二章作业
程序员文章站
2022-03-22 23:06:04
...
致读者: 博主是一名数据科学与大数据专业大二的学生,真正的一个互联网萌新,写博客一方面是为了记录自己的学习过程中遇到的问题和思考,一方面是希望能够帮助到很多和自己一样处于困惑的读者。
> 由于水平有限,博客中难免会有一些错误,有纰漏之处恳请各位大佬不吝赐教!之后会写大数据专业的文章哦。
GitHub链接https://github.com/wfy-belief
尽管现在我的水平可能还不太及格,但我会尽我自己所能,做到最好☺。——天地有正气,杂然赋流形。下则为河岳,上则为日星。
码文不易,可以给我一个小心心吗?♥
导入第三方库
In [1]:
library(openxlsx)
d2.2=read.xlsx('mvexer5.xlsx',sheet='E2.2');
head显示前六行 tail显示后六行
In [2]:
head(`d2.2`) #读取数据并显示前六行
X | |
---|---|
1 | 1465 |
2 | 1760 |
3 | 1985 |
4 | 2270 |
5 | 2980 |
6 | 1375 |
In [3]:
tail(d2.2) #读取数据并显示后六行
X | |
---|---|
45 | 2290 |
46 | 1125 |
47 | 1575 |
48 | 1815 |
49 | 2030 |
50 | 2320 |
In [4]:
min(d2.2)
1000
In [5]:
max(d2.2)
2980
可以得到某月份最低工资为1000元,最高工资为2980元。 画出组距为300的直方图:
In [6]:
H1=hist(d2.2$X,breaks=seq(900,3000,300)) #以组距为300画直方图
编制频数表,列出频数、频率和累计频率:
In [7]:
names(H1)
- ‘breaks’
- ‘counts’
- ‘density’
- ‘mids’
- ‘xname’
- ‘equidist’
In [8]:
data.frame('组中值'=H1$mids,'频数'=H1$counts,'频率'=H1$density*300,'累计频率'=cumsum(H1$density*300))
组中值 | 频数 | 频率 | 累计频率 |
---|---|---|---|
1050 | 3 | 0.06 | 0.06 |
1350 | 7 | 0.14 | 0.20 |
1650 | 10 | 0.20 | 0.40 |
1950 | 15 | 0.30 | 0.70 |
2250 | 8 | 0.16 | 0.86 |
2550 | 5 | 0.10 | 0.96 |
2850 | 2 | 0.04 | 1.00 |
用R语言作正态概率图并分析之:
In [9]:
qqnorm(d2.2$X);qqline(d2.2$X)
由正态概率图可以看出数据点基本是一条直线,因此数据可以近似看作正态分布。
上一篇: 基于FFmpeg接收RTSP的ts流
下一篇: php网站怎么写一个聊天