根据bed文件重fasta文件中获取基因序列

程序员文章站 2022-10-16 14:13:07

第一次写博客，分享一个做的提取基因序列的程序，根据bed文件里的位置信息从基因组里提取序列源码地址：https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py bed文件通常用来保存注释基因信息，BED文件必须的3列: c ......

第一次写博客，分享一个做的提取基因序列的程序，根据bed文件里的位置信息从基因组里提取序列

源码地址：https://github.com/liuyuan2018/fastatools/blob/master/pygetfasta.py

bed文件通常用来保存注释基因信息，bed文件必须的3列:

chrom - 染色体号
chromstart - feature在染色体上起始位置（其实编号为0）
chromend - feature在染色体上末尾位置（不包括此编号）

　　第四列是基因的名称

　　还有些列想了解参考:http://genome.ucsc.edu/faq/faqformat.html#format1

程序依赖 pyfasta模块（https://pypi.org/project/pyfasta/）

安装pyfasta的命令：pip install pyfasta

上一篇： java 取汉字首字母

下一篇：系统架构设计师-软件水平考试（高级）-理论-数据库