欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

perl代码提取genebank文件中最后部分的fasta序列

程序员文章站 2022-04-24 09:48:59
...
#!/usr/bin/perl
use strict;
use warnings;

my $id;
my $seq;

open IN,$ARGV[0] or die "Can't open genebank file!";
while (<IN>) {
	chomp;
	if (/ACCESSION/) {
		my @infor = split (/\s+/,$_);
		$id = $infor[1];
		print ">$id\n";
	}
	if (/\s+\d+\s[ATGCatgc]{10}\s/) {
		$seq = $_;
		$seq =~ s/\s+//g;
		$seq =~ s/\d+//g;
		print "$seq\n";
	}
}
close IN;

附上genebank文件最后的fasta序列格式
perl代码提取genebank文件中最后部分的fasta序列

相关标签: Perl