plink格式的hap文件和ped文件
程序员文章站
2024-03-04 16:50:05
...
.map文件
格式说明链接:link
map格式的文件, 主要是图谱文件信息, 主要包括染色体名称, 所在的染色体和所在染色体的坐标.
map文件包括:
- 染色体编号(1-22, X, Y or 0 if unplaced), 未知为0
- SNP名称(字符或数字), 如果不重要, 可以从1编号, 注意要和bed文件SNP列一一对应
- 染色体的摩尔位置(可选项, 可以用0)
- SNP物理坐标
Example
1 snp1 0 1
1 snp2 0 2
1 snp3 0 3
- 这里有3个SNP, 分别名为snp1, snp3, snp3 (第二列)
- 这三个SNP在第一个染色体上 (第一列)
- 第三列为0
- 第四列为SNP所在染色体的坐标
.ped文件
格式说明链接:link
bed格式的文件, 主要包括SNP的信息, 包括个体ID, 系谱信息, 表型和SNP的分型信息.
.ped 文件主要有 6 列,后面都是基因型:
- 第一列: Family ID # 如果没有, 可以用个体ID代替
- 第二列: Individual ID # 个体ID编号
- 第三列: Paternal ID # 父本编号
- 第四列: Maternal ID # 母本编号
- 第五列: Sex (1=male; 2=female; other=unknown) # 性别, 如果未知, 用0表示
- 第六列: Phenotype (0=unknown; 1=unaffected; 2=affected) # 表型数据, 如果未知, 用0表示
- 第七列以后: 为SNP分型数据, 可以是AT CG或11 12, 或者A T C G或1 1 2 2
Example
1 1 0 0 1 0 G G 2 2 C C
1 2 0 0 2 0 A A 0 0 A C
1 3 1 2 1 2 0 0 1 2 A C
2 1 0 0 1 0 A A 2 2 0 0
2 2 0 0 2 2 A A 2 2 0 0
2 3 1 2 1 2 A A 2 2 A A
- 数据包括两个家系 (第一列)
- 每个家系有三个个体 (第二列)
- 第三列父本编号
- 第四列母本编号
- 第五列性别
- 第六列表型值
- 第七列, 第八列为一个基因型
- 第九列, 第十列为第二个基因型
- 第十一列, 第十二列为第三个基因型
推荐阅读
-
plink格式的hap文件和ped文件
-
把相片的详情列表里显示的时间与文件名和标题里指示的时间统一 日期格式string转longandroidcamera
-
Java生成和解析XML格式文件和字符串的实例代码
-
Java生成和解析XML格式文件和字符串的实例代码
-
多个上传文件用js验证文件的格式和大小的方法(推荐)
-
java 实现文件复制和格式更改的实例
-
多个上传文件用js验证文件的格式和大小的方法(推荐)
-
ai文件怎么保存成jpg? AI保存jpg格式和PS的区别
-
java 实现文件复制和格式更改的实例
-
C# winfrom 写的一个搜索助手,可以按照标题和内容搜索,支持doc,xls,ppt,pdf,txt等格式的文件搜索