欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Assembly--软件PBcR和Canu

程序员文章站 2024-03-23 22:10:34
...

Assembly--软件PBcR和Canu

2019.06.10 08:23:20字数 205阅读 97

1.PBcR

下载说明页:
http://wgs-assembler.sourceforge.net/wiki/index.php?title=PBcR

安装:

 bzip2 -dc wgs-8.3rc2.tar.bz2 | tar -xf -
 cd wgs-8.3rc2
 cd kmer && make install && cd ..
 cd src && make && cd ..

1.PBcR是混合组装工作流。工作原理是首先提高单分子序列的准确性,然后组装改进的序列
2.组装PacBio或Oxford Nanopore数据
3.perl程序所写,需要的模块较多
4.Celera Assembler算法
5.不再被维护

 

Assembly--软件PBcR和Canu

 

Assembly--软件PBcR和Canu

测试数据: Lambda Phage(噬菌体)
命令行:
PBcR PBcR -length 500 -partitions 200 -l lambda -s pacbio.spec -fastq pacbio.filtered_subreads.fastq genomeSize=50000
fastqToCA -libraryname illumina -technology illumina -type sanger -innie -reads illumina.fastq > illumina.frg
PBcR -length 500 -partitions 200 -l lambdaIll -s pacbio.spec -fastq pacbio.filtered_subreads.fastq genomeSize=50000 illumina.frg

-s pacbio.spec

Assembly--软件PBcR和Canu

 

2.Canu

安装:
git clone https://github.com/marbl/canu.git
cd canu/src && make
Canu是一个分层组装管道,分四个步骤运行:

        1.使用MHAP检测高噪序列中的重叠
        2.生成校正的序列共识
        3.修剪校正序列
        4.组装修剪后的校正序列

组装PacBio或Oxford Nanopore序列

Assembly--软件PBcR和Canu


测试数据:大肠杆菌K12
下载:
curl -L -o pacbio.fastq http://gembox.cbcb.umd.edu/mhap/raw/ecoli_p6_25x.filtered.fastq
命令行:
canu -p ecoli -d ecoli-pacbio genomeSize=4.8m -pacbio-raw pacbio.fastq