欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

tableone比较两组数据时各个组的均值方差均相同

程序员文章站 2022-06-03 17:45:56
...

今天用table比较两个组的差异,数据是用两个dataframe竖向拼接起来的。

然后用table进行检验:

columns = ['diff', 'label']
categorical = []
nonnormal = []
groupby = 'label'
mytable = TableOne(val_stats, columns, categorical, groupby, nonnormal, pval=True)
print(mytable)

发现两个组里的均值和方差都完全相同:

               Grouped by label                                                   
                         isnull     ai_diff    doc_diff    pval              ptest
variable level                                                                    
n                                      2569        2569                           
diff                          0  -0.2 (1.5)  -0.2 (1.5)  <0.001  Two Sample T-test

原因是由于拼接起来后没有重新reset_index(),两个组都引用了同一个组的数据。

reset_index()后,问题解决。

相关标签: python 统计