这是 .gff 文件的链接。 https://www.dropbox.com/scl/fi/3x463ykcfl87ncdi3onjn/TcDB-66.gff?rlkey=chym6az6u144n6r9ltstqx54f&dl=0
每当我在 rStudio 和 R.4.4.1 下运行下面的代码时,我都会遇到困难
# script used to get gene info
library(rtracklayer)
library(tidyverse)
Tc_genes<-import.gff3("~/Documents/congoScell/Annotation/TcDB-66.gff") %>%
as_tibble() %>%
#filter(type =="protein_coding_gene") %>%
select(ID, description) %>%
mutate(GeneSeurat = gsub("_", "-", ID)) %>%
mutate(GeneDescription = paste0(ID, "::", description))
Tc_genes$GeneDescription<-gsub('\\+', ' ', Tc_genes$GeneDescription)
Tc_genes<-Tc_genes[ends_with(".1",vars=Tc_genes$ID),]
Tc_genes[]<- lapply(Tc_genes, gsub, pattern = ".1", replacement = "", fixed = TRUE)
我附上了 .gff 文件的照片。
每当我将此脚本作为源引入时,我都会得到以下信息:
未提供编码:默认为 UTF-8。
我想知道如何解决这个问题。有谁可以帮帮我,请帮帮我。
我尝试检查是否有人遇到像我一样的问题,并发现了一些但不相关的问题。
正如我在 Staging Ground 中所写的,
rtracklayer
是废弃软件,自 2011 年以来就没有被触及过。如果你去 CRAN 并获得 Rgff
,你就会成功。 我用你的示例文件测试了它,一切正常。