欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

巧用merge

程序员文章站 2022-07-12 16:48:59
...

问题:编号为1,2,3,4的试验中心,每个中心有编号为1,2,3,4,5,6的试验动物,想要记录对不同中心的不同编号的动物的试验次数进行统计总结如下表

中心编号 试验编号 计数
1 1  
1 2  
1 3  
1 4  
1 5  
1 6  

 

但你的原始数据为一条观测代表一次测试,数据记录如下:第一条代表对中心1试验编号为1的动物进行一次试验。

中心编号 试验编号
1 1
1 5
1 3

 

考虑到存在某些动物没进行试验,所以对原始数据集直接求计数得到上述总结表格的形式。

思路:可以根据中心编号以及动物编号的个数,先构造一个4*6行3列的表格,计数赋值为0.

然后对原始数据进行计数,根据中心编号以及试验编号进行排序,最后与构造出来的表格右merge在一起,就可以得到不同试验中心的不同动物的计数总结。

举个例子

*create the data set for count;
data a;
input x y @@;
cards;
1 2 2 3 3 4 4 2 1 4
1 5 1 5 1 2 1 4 2 4 
3 4 4 2 2 4 2 3 2 4
;
run;
*use proc freq get the count ;
proc freq data = a noprint;
table x*y / out = f;
run;
*create the dataset include all kinds groups;
data b;
do x = 1 to 4 by 1;
  do y = 1 to 6 by 1;
    count = 0;
	output;
	end;
	end;
run;

*proc sort by x y ;
proc sort data = f;
by x y ;
run;

proc sort data = b;
by x y ;
run;

*merge ;
data final;
merge b f(drop = percent);
by x y;
run;

*use transpose 使用装置过程 可以更直观计数结果;
proc transpose data = final out = t;
by x;
id y;
var count;
run;