R语言 函数因子列表
程序员文章站
2022-04-23 22:44:12
...
在开始之前,先来说说如何定义数据集的行和列,不同领域的大神往往叫法各异。
大神 | 行叫法 | 列叫法 |
统计学家 | 观测(observation) | 变量(variable) |
数据库分析师 | 记录(record) | 字段(field) |
数据挖掘(机器学习)师 | 示例(example) | 属性(attribute) |
1、帮助函数
函数 | 功能 |
help.start() | 打开帮助文档首页 |
help("foo")或?foo | 查看函数foo的帮助(引号可以省略) |
help.search("foo")或??foo | 以foo为关键词搜索本地帮助文档 |
example("foo") | 函数foo的使用示例(引号可以省略) |
RSiteSearch("foo") | 以foo为关键词搜索在线文档和邮件列表存档 |
apropos("foo", mode="function") | 列出名称中含有foo的所有可用函数 |
data() | 列出当前已加载包中所含的所有可用示例数据集 |
vignette() | 列出当前已安装包中所有可用的vignette文档 |
vignette("foo") | 为主题foo显示指定的vignette文档 |
2、简单函数集合
varname<-
c()——可将其参数组合成一个向量或列表
mean()、sd()、cov()、cor(a,b)、plot(a,b)——均值、标准差、方差、协方差、散点图
data.frame(var1,var2,var3,...)——数据框,其中varn<-c(),数值型不用引号,字符串要引号
attach()——可将数据框添加到R的搜索路径中,##这里要注意,attach函数只能用于串列、数据框等
detach()——将数据框从搜索路径中移除
3、因子的使用
变量可归结为名义型(类别)、有序型或连续型变量,名义型没有顺序之分,有序型表示一种顺序关系而非数量关系,连续型可以呈现为某个范围内的任意值并同时表示了顺序和数量。
类别(名义型)变量和有序类别变量在R中称为因子,因子在R中非常重要,因为它决定了数据的分析方式以及如何进行视觉呈现。
对于字符型向量,因子的水平默认依字母顺序创建。不过有时差强人意,这时可以自己定义顺序,通过指定levels选项来覆盖默认排序。例如:
status<-factor(status,order=TRUE,levels=c("Poor","Improve","Excellent")
各水平的赋值将为1=Poor、2=Improved、3=Excellent
4、列表list
列表(list)是R的数据类型中最为复杂的一种。一般来说,列表就是一些对象(或成分,component)的有序集合。列表允许你整合若干(可能无关的)对象到单个对象名下。