欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

全基因组关联分析(GWAS)软件:Tassel5

程序员文章站 2024-03-02 19:48:40
...

Tassel 是比较经典的关联分析软件,但是因为运行速度没有优势,所以在重测序等数据量比较大的研究中不太常用。这是记录一下Tassel5 命令行进行关联分析的过程。
参考:
Tassel5:https://bitbucket.org/tasseladmin/tassel-5-source/wiki/Home
MLM:https://bitbucket.org/tasseladmin/tassel-5-source/wiki/UserManual/MLM/MLM

1. 计算kinship

run_pipeline.pl -plink -ped snp.ped -map snp.map -KinshipPlugin -method Centered_IBS -endPlugin -export kinship.txt -exportType SqrMatrix

2. MLM 模型关联分析

tassel.sh

# 表型文件
P=all_pheno.txt
# 群体结构矩阵
Q=Q3.txt
# kinship 矩阵
K=kinship.txt

run_pipeline.pl \
-Xms1g -Xmx10g\
-fork1 -plink -ped snp.ped -map snp.map -FilterSiteBuilderPlugin -siteMinAlleleFreq 0.05 -endPlugin \
-fork2 -importGuess $P \
-fork3 -importGuess $Q -excludeLastTrait \
-fork4 -importGuess $K \
-combine5 -input1 -input2 -input3 -intersect \
-combine6 -input5 -input4 -mlm -mlmVarCompEst P3D -mlmCompressionLevel Optimum \
-export result
  • 基因型文件格式:tassel可接受多种基因型文件格式,如plink,vcf,hapmap等
  • 表型文件和群体结构矩阵的格式可以参照示例文件;群体结构可用 Admixture、fastStructure等软件计算