spades基因组组装软件简介
程序员文章站
2024-03-02 08:32:04
...
欢迎关注"生信修炼手册"!
spades这款de novo基因组组装软件, 适用于细菌/真菌等小型基因组的组装,不推荐用于动植物基因组的组装。该软件主要用于illumina,IonTorrent reads的组装,也可以进行PacBio, Oxford nanopore, Sanger reads的组装。
官网如下
http://cab.spbu.ru/software/spades/
spades是一套软件,类似office办公软件系列,包含了以下5个可执行文件
metaSPAdes
plasmidSPAdes
rnaSPAdes
truSPAdes
disSPAdes
metaSPAdes用于宏基因组数据的组装,plasmidSPAdes用于组装叶绿体/线粒体基因组,rnaSPAdes用于RNA-seq数据的组装,truSPAdes用于treseq barcode序列的组装,disSPAdes用于组装高杂合度的二倍体基因组。
软件的安装过程如下
wget http://cab.spbu.ru/files/release3.12.0/SPAdes-3.12.0-Linux.tar.gz
tar xzvf SPAdes-3.12.0-Linux.tar.gz
cd SPAdes-3.12.0-Linux
直接从官网下载二进制包,解压缩就可以了。在bin目录下,有很多的可执行文件
./
├── dipspades.py
├── metaspades.py -> spades.py
├── plasmidspades.py -> spades.py
├── rnaspades.py -> spades.py
├── spades-bwa
├── spades-core
├── spades-corrector-core
├── spades-dipspades-core
├── spades-gbuilder
├── spades-gmapper
├── spades-hammer
├── spades_init.py
├── spades_init.pyc
├── spades-ionhammer
├── spades-kmercount
├── spades.py
├── spades-truseq-scfcorrection
└── truspades.py
其中spades.py 就是主要的提交脚本,该软件支持多种测序类型
单端数据
用--s1
参数指定单独测序的序列文件,如果有多个文库,用数字后缀加以区分,比如--s1
,--s2
双端数据
用--pe1-1
和--pe1-2
分别指定双端测序的R1端和R2端序列文件,多个文库用数字后缀区分,比如--pe2-1
,--pe2-2
基本用法如下:
spades.py -k 21,33,55,77,99,127 --careful --pe1-1 R1.fastq --pe-2 R2.fastq -o spades_output
输出结果目录会生成许多文件,其中scaffolds.fasta
对应scaffold的结果,contig.fasta
对应contig组装的结果。
扫描关注微信号,更多精彩内容等着你!