欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

perl生成特定碱基比例的随机序列的代码

程序员文章站 2022-03-22 13:22:03
方法一(不使用模块,by agonyr) 复制代码 代码如下:#!/usr/bin/perl -wuse strict;my @seq = ( "a", "t", "c"...

方法一(不使用模块,by agonyr)

复制代码 代码如下:

#!/usr/bin/perl -w

use strict;

my @seq = ( "a", "t", "c", "g" );
my $length = 10000;

undef my %hash;
$hash{"a"} = int( $length * 0.3 );
$hash{"c"} = int( $length * 0.3 );
$hash{"g"} = int( $length * 0.2 );
$hash{"t"} = int( $length * 0.2 );

my $i = 0;
while ( $i 《 $length ) {
    my $word = $seq[ rand(@seq) ];
    if ( $hash{$word} ) {
        print "$word";
        $i++;
    }
    $hash{$word}--;
}
print "n";

方法二(使用模块,by yixf)

复制代码 代码如下:

#!/usr/bin/perl

use strict;
use warnings;

use biox::sequtils::randomsequence;

my $randomizer = biox::sequtils::randomsequence-》new(
    {
        l =》 10000,
        s =》 1,
        y =》 "dna",
        a =》 3,
        c =》 3,
        g =》 2,
        t =》 2
    }
);
print $randomizer-》rand_seq(), "n";

两种方法比较

设定长度为10000,acgt的比例为3:3:2:2。

复制代码 代码如下:

withoutmodule length=10000 gc=49.42% a=2558,c=2503,g=2439,t=2500,others=0
withmodule length=10000 gc=50.00% a=3000,c=3000,g=2000,t=2000,others=0