欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

R语言实战记录----图形记录

程序员文章站 2022-03-22 23:24:16
...

基本图形描述

包括直方图、箱线图、点图,本片文章主要是将所画出来的图形记录下来。
1:直方图
R语言实战记录----图形记录
对于连续型变量来说,直方图与核密度曲线是极好的表达方式,可以通过直方图看到变量的分布。

par(mfrow=c(2,2))
hist(mtcars$mpg)
 
hist(mtcars$mpg,breaks=12,col="red",xlab="Miles Per Gallon",
     main="Colored histogram with 12 bins")

hist(mtcars$mpg,freq=FALSE,breaks=12,col="green",xlab="Miles per Gallon",
     main="Hisogram,rug plot,density curve")
rug(jitter(mtcars$mpg))
lines(density(mtcars$mpg),col="blue",lwd=2)

x <- mtcars$mpg
h <- hist(x,breaks=12,col="purple",xlab="Miles",
          main="Histogram")
xfit <- seq(min(x),max(x),length=40)
yfit <- dnorm(xfit,mean=mean(x),sd=sd(x))
yfit <- yfit*diff(h$mids[1:2])*length(x)
lines(xfit,yfit,col="blue",lwd=2)
box()

在比较多个变量是,我们有时候可能会用大核密度图的比较,首先我们需要将变量转换为因子,其次利用sm包中的== sm.density.compare ==来绘制多个核密度图以便于比较。
R语言实战记录----图形记录

library(sm)
attach(mtcars)
cyl.f <- factor(cyl,levels=c(4,6,8),labels=c("4 cylinder",
                                             "6 cylinder",
                                             "8 cylinder"))
sm.density.compare(mpg,cyl,xlab="Miles per gallon")
title(main="MPG distribution by car cylinders")
colfill <- c(2:(1+length(levels(cyl.f))))
legend(locator(1),levels(cyl.f),fill=colfill)
detach(mtcars)

2:箱线图可以完美的显示变量的五数综合:最大值、最小值、中位数、下四分位数、上四分位数。
《R语言实战》中展示了并列箱线图、凹槽箱线图、交叉因子箱线图、小提琴图(此处并未展示)
R语言实战记录----图形记录
R语言实战记录----图形记录
第一个是我们的交叉因子箱线图,第二个是带凹槽的箱线图。
带凹槽的箱线图是通过在barplot()括号中添加==( notch=TRUE)==来展示凹槽。
交叉因子箱线图则是我们的自变量或者是横坐标是一个交叉性的变量,因此称为交叉因子箱线图。
3:点图则是将图形的基本特征展示了出来
R语言实战记录----图形记录

x <- mtcars[order(mtcars$mpg),]
x$cyl <- factor(x$cyl)
x$color[x$cyl == 4] <- "red"
x$color[x$cyl == 6] <- "green"
x$color[x$cyl == 8] <- "darkgreen"
dotchart(x$mpg,labels=row.names(x),cex=.7,groups=x$cly,gcolor="black",
         color=x$color,pch=19,
         main="Gas milleage for car models \n grouped by clinder",
         xlab="Miles per gallon")

如果要展示分组变量的特征,首先是要将变量转换为因此,其次是通过groups函数制定分组的变量,最后添加各种参数值。