使用 R 修剪 DNA 序列

问题描述 投票:0回答:2

我有一个DNA序列文件,许多序列像“CCCATGCAGACATAGTG”或“CTCCATGCAGACATAGTG”一样开头,我有一个标签序列“ATGCA”。我想删除所有“ATGCA”以及“CC”和“CTC”。所以最终的产品将是“GACATAGTG”。

有谁知道 R 函数可以做到这一点吗?我在生物串中尝试了trimLRPatterns,但它不起作用,因为它只从末尾修剪,而不是在序列内修剪。如果您有任何解决方案,请告诉我。谢谢。

r bioinformatics bioconductor
2个回答
2
投票

试试这个:

# dummy DNA
myDNA <- c("CCCATGCAGACATAGTG", "CTCCATGCAGACATAGTG")
# define tag
tag <- "ATGCA"

# remove any character(s) before tag, including tag.
gsub(paste0("^.*", tag), "", myDNA)

# output
# [1] "GACATAGTG" "GACATAGTG"

0
投票

您可以使用gsub。例如

gsub(“ATGCA”,“”,“CCCATGCAGACATAGTG”)

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.