欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

R语言 如何获取指定位置的数据

程序员文章站 2022-03-17 14:34:45
r语言-获取指定位置的数据r中采用数据对象+[ , ]的方式获取对应位置的数据,根据填入索引参数的不同类型可具体分为:正整数、负整数、零、空格、逻辑值、名称> matrix [,1] [,2...

r语言-获取指定位置的数据

r中采用数据对象+[ , ]的方式获取对应位置的数据,根据填入索引参数的不同类型可具体分为:

正整数、负整数、零、空格、逻辑值、名称

> matrix
   [,1] [,2] [,3] [,4] [,5]
[1,]  1  5  9  13  17
[2,]  2  6  10  14  18
[3,]  3  7  11  15  19
[4,]  4  8  12  16  20

1.正整数索引

因为r中的起始位置为1,与一般的编程语言不同,所以这类索引最为常见。

需要注意的是,如果索引中存在重复值,r会继续执行进而重复提取部分值,如:

> matrix[c(1,1),1:5]
   [,1] [,2] [,3] [,4] [,5]
[1,]  1  5  9  13  17
[2,]  1  5  9  13  17

2.负整数索引

使用负整数索引与正整数正好相反,r会返回不包含在负整数对应位置的元素,当需要选取的行或列很多时,用这个索引会更快捷。

需要注意,正整数索引与负整数索引可以同时出现在不同索引位置,但不能同时出现在同一位置,否则将报错,具体如下:

> matrix[c(-1,-1),1]
[1] 2 3 4
> matrix[c(-1,1),1]
error in matrix[c(-1, 1), 1] : only 0's may be mixed with negative subscripts

3.零索引

零索引的存在说实话并没有什么意义,很有可能是设计师为了防止很多程序员无法避开从0开始计数而经常导致error的一种保护措施而已。使用情况如下:

> matrix[1,0]
integer(0)
> matrix[0,0]
<0 x 0 matrix>

4.空格索引

空格表示提取该索引位置所对应的所有维度,但不写空格效果也一样,具体如下:

> matrix[1,]
[1] 1 5 9 13 17
> matrix[1, ]
[1] 1 5 9 13 17

5.逻辑值索引

当提供的索引位置是一个包含true和false逻辑值的向量,那么r会匹配出索引值为true的列,并取出相应元素。

使用这种方法,需要向量长度与索引位置的维度相同,否则就达不到需要的效果,具体如下:

> matrix[c(t,f,f,f),]
[1] 1 5 9 13 17

这种方式看似笨重,但在特殊情况下作用十分明显

6.名称索引

当被索引的对象有名称属性,就可以采用名称作为索引提取相关元素,这是提取列的常用方法,因为列总会有名称,具体如下:

> colnames(matrix)<-c("a","b","c","d","e")
> matrix[,"b"]
[1] 5 6 7 8

补充:r语言获取特定时间段的数据

获取特定时间段的表格数据方法:

1. 方法一:正则表达式

data <- read.csv('f:/data.csv')
date <- as.date(data$date)
#获取2018-3-1到2018-3-10之间的第3-5列数据
subt <- date[(format(date,format = "%y")=="2018"&as.numeric(format(date,format =       
   "%m"))=="3" &as.numeric(format(date,format = "%d"))>=1&as.numeric(format(date,format 
   = "%d"))<=10),3:5]
#对2018-3-1到2018-3-10之间第3-5列的数据进行按列求平均值
mean <- apply(subt,2, mean)

2. 方法二:

date1 <- as.posixct(paste("2018-3-1","08:00:00"))
date2 <- as.posixct(paste("2018-3-1","17:00:00"))
int <- interval(date1, date2)
#获取2018-3-1 08:00:00到2018-3-1 17:00:00之间的第3-5列数据
subt <- data[ymd_hms(data$date) %within% int,3:5]

注意:

1. within判断数据是否在该时间段之内,其中包括起始时间,不包括末尾时间。

2.paste0(num_year[y],'_',m,'_1') 实现字符串的合并,其中m,num_year[y]为变量。

paste拼接时有空格,paste0无空格

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。