将人口信息放入VCF文件

问题描述 投票:0回答:1

我有一个没有人口信息的 VCF 文件。 我有三个包含样本名称的测试文件(pop1.txt、pop2.txt 和 pop3.txt)。如何使用 R 或其他方式将人口信息合并到该 VCF 文件中?

vcf-vcard auto-populate vcftools
1个回答
0
投票

有几种方法可以做到这一点。

  1. 在上游,您可以使用包含总体符号的方式命名样本。例如,我将实验中的 fastq/bam 文件命名为

    No_L_1
    No_R_1
    ,分别代表我拥有的挪威湖泊和溪流数据集中的样本号 1。

  2. 使用

    sed
    awk
    之类的内容循环遍历总体ID,并将VCF样本列名称更改为更直观的名称。

  3. R
    中,使用像
    vcfR
    这样的库读取数据,然后更改R对象上的样本。我倾向于读取数据并将
    vcfR.object
    转换为
    data.table
    。 (即
    vcf <- read.vcfR(vcf_path) %>% as.data.table)

无论如何,如果您在 R 中进行分析,那么将所有人口数据放在一个 csv 中可能是最简单的方法,其中第 1 列为

sample_id
,第 2 列为
population

© www.soinside.com 2019 - 2024. All rights reserved.