根据bed文件重fasta文件中获取基因序列
程序员文章站
2022-04-19 20:35:09
第一次写博客,分享一个做的提取基因序列的程序,根据bed文件里的位置信息从基因组里提取序列 源码地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py bed文件通常用来保存注释基因信息,BED文件必须的3列: c ......
第一次写博客,分享一个做的提取基因序列的程序,根据bed文件里的位置信息从基因组里提取序列
源码地址:https://github.com/liuyuan2018/fastatools/blob/master/pygetfasta.py
bed文件通常用来保存注释基因信息,bed文件必须的3列:
- chrom - 染色体号
- chromstart - feature在染色体上起始位置(其实编号为0)
- chromend - feature在染色体上末尾位置(不包括此编号)
第四列是基因的名称
还有些列想了解参考:http://genome.ucsc.edu/faq/faqformat.html#format1
程序依赖 pyfasta模块(https://pypi.org/project/pyfasta/)
安装pyfasta的命令:pip install pyfasta