WGS数据分析处理流程
程序员文章站
2024-02-13 20:46:28
...
1.拿到数据后先检查数据是否完整。用md5sum命令。
#生成md5文件
ls KPGP*| while read KPGP; do echo $KPGP;md5sum ${KPGP} >> ${KPGP}.md5; done
#检查完整性,全部显示OK即可
md5sum -c *.md5
2.对数据进行质检。
#质检
nohup fastqc -o /data/XXXX/WGS/01fastqc -t 10 *.fq.gz &
#multiqc合并质检报告查看
nohup multiqc * -o /data/XXXX/WGS/01fastqc/multiqc &
#若不合格还要进行用cutadaptor去接头等操作。此处合格,则不赘述。
3.与参考基因组进行比对。
#bwa建立索引
bwa index -a bwtsw chrom.37.fa
#bwa men
vi bwa.sh
for(( i=1 ; i<=6 ; i++ ))
do
bwa mem -t 4 /data/XXXX/WGS/02hg19/chrom.37.fa \
/data/XXXX/WGS/KPGP-00001_L${i}_R1.fq.gz \
/data/XXXX/WGS/KPGP-00001_L${i}_R2.fq.gz > /data/lanyunzhou/WGS/03BWA/L${i}.sam
done
nohup sh bwa.sh &
上一篇: Uri
下一篇: python入门之编码规范