根据bed文件重fasta文件中获取基因序列

程序员文章站 2022-04-19 20:35:09

第一次写博客，分享一个做的提取基因序列的程序，根据bed文件里的位置信息从基因组里提取序列源码地址：https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py bed文件通常用来保存注释基因信息，BED文件必须的3列: c ......

第一次写博客，分享一个做的提取基因序列的程序，根据bed文件里的位置信息从基因组里提取序列

源码地址：https://github.com/liuyuan2018/fastatools/blob/master/pygetfasta.py

bed文件通常用来保存注释基因信息，bed文件必须的3列:

chrom - 染色体号
chromstart - feature在染色体上起始位置（其实编号为0）
chromend - feature在染色体上末尾位置（不包括此编号）

　　第四列是基因的名称

　　还有些列想了解参考:http://genome.ucsc.edu/faq/faqformat.html#format1

程序依赖 pyfasta模块（https://pypi.org/project/pyfasta/）

安装pyfasta的命令：pip install pyfasta

上一篇： win10游戏硬盘压缩功能怎么用？win10游戏硬盘压缩功能使用详解

下一篇：了解四川德阳旌阳特产小吃有哪些，感受四川的美食文化