欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python生物信息学数据管理_02第一个python程序

程序员文章站 2024-03-04 18:42:12
...
#2.2计算胰岛素序列中的氨基酸频率

#2.2.2python会话示例
# insulin [Homo sapiensl GI:386828
# axtracted 51 amino acids of A+B chain
insulin = 'GlVEQCCTSICSLYQLENYCNFVNQHLCGSHLVEALYLVCGERGFFYTPKT'
for amino_acid in "ACDEFGHIKLMNPQRSTVWY":
    number = insulin.count(amino_acid)
    print (amino_acid, number)

#2.2.3程序如何工作
#长命令要跨几行需要在行尾加上\反斜杠或者收尾加三引号
insulin_complete1 = 'MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRREAEDLQVGQVELGG\
GPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN'
insulin_complete2 = '''MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRREAEDLQVGQVELGG
GPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN'''

#2.3.4字符串变量
#索引
#通过方括号内的数字索引,可以提取字符的某些位置。第一个字符被视为在位置O
print( 'Protein'[0])#' P'
print ('Protein'[1])#'r'
#负的索引表明从末尾开始字符寻址
print('Protein'[-1])#'n'
print('Protein'[-2])# i

#切片
#通过在方括号中引人一个冒号,可以提取部分字符串(切片)
print('Protein'[0:3])#pro;不包邮
print('Protein'[1:])# rotein;包左

#字符串算术
# 可以用加号(+)运算来给Python 字符串做加法,这将使两个字符串串联。
print('Protein' + ' '+ 'degradation') # Protein degradation
#字符串也可以乘以整数:
print( 'Protein'*2)#ProteinProtein

#确定字符串长度
#len()函数返回字符串中的字符数,即字符串长度:
print(len ('Protein'))#7

#字符计数
#s.count()函数计算字符或一个短序列出现在一个字符串中的次数:
print('Protein'.count('r'))#1

#2.3.5用for进行循环
#运行循环,遍历字符串
for i  in 'hemoglobin':
    print (i)
#运行循环遍历数字的列表
for i in [1 , 2 , 3 , 4 , 5]:
    print(i)

for i in range(10):#0-9
    print(i)

#2.4示例
#例2.1创建随机序列
import random
alphabet = "AGCT"#索引是0,1,2,3
sequence = ""
for i in range(10):#循环10次,0-9
    index = random.randint(0,3)
    sequence = sequence + alphabet[index]#每次循环都从AGCT中随机选一个字母
print(sequence)

#例2.2 如何在序列中运行滑动窗口
seq = "PRQTEINSEQWENCE"#序列长度为15
print(len(seq))
for i in range(len(seq)-4):#循环次数为11,产生0-10的所有数;这用来表示索引位置
    print(seq [i: i+5])#子序列的定长为5,第一个子序列从位置0-5,最后一个子序列从位置10-14
相关标签: python与生信