BiocParallel 错误。未找到条形码文件

问题描述 投票:0回答:1

我目前正在尝试在 R 中使用 SingleCellExperiment 和 DropletUtils 实现管道。我已经收到错误有一段时间了,我已经厌倦了修复它,但没有任何效果。这是我当前正在运行的代码。

seq_data_martin <- "/home/.../GSE134809_RAW"

samples <- list.files(path = seq_data_martin, pattern = "*matrix.mtx.gz")
samples <- gsub("_matrix.mtx.gz$", "", samples)

sce <- DropletUtils::read10xCounts(
  samples = paste0("seq_data_martin/", samples, "_"),
  sample.names = samples,
  type = "prefix",
  BPPARAM = BiocParallel::MulticoreParam()
)

执行“sce”时遇到的错误是:

Error: BiocParallel errors
  31 remote errors, element index: 1, 2, 3, 4, 5, 6, ...
  0 unevaluated and other errors
  first remote error:
Error in .check_for_compressed(barcode.loc, compressed): cannot find 'seq_data_martin/GSM3972009_69_barcodes.tsv' or its gzip-compressed form

我尝试解压缩条形码,更改目录的权限,但错误仍然存在。条形码文件正确位于路径中:

/GSE134809_RAW$ ll | head
total 592568
drwxrwxr-x  2 localadmin localadmin     4096 May 23 14:19 ./
drwxr-xr-x 39 localadmin localadmin     4096 May 23 14:16 ../
-rw-rw-r--  1 localadmin localadmin  1155350 May 23 14:19 GSM3972009_69_barcodes.tsv.gz
-rw-rw-r--  1 localadmin localadmin   264786 Jul 24  2019 GSM3972009_69_genes.tsv.gz
-rw-rw-r--  1 localadmin localadmin 12020368 Jul 24  2019 GSM3972009_69_matrix.mtx.gz
-rw-rw-r--  1 localadmin localadmin  1920076 Jul 24  2019 GSM3972010_68_barcodes.tsv.gz
-rw-rw-r--  1 localadmin localadmin   264786 Jul 24  2019 GSM3972010_68_genes.tsv.gz
-rw-rw-r--  1 localadmin localadmin 21788688 Jul 24  2019 GSM3972010_68_matrix.mtx.gz
-rw-rw-r--  1 localadmin localadmin  2280347 Jul 24  2019 GSM3972011_122_barcodes.tsv.gz

有人可以帮我解决这个错误吗?

bioinformatics
1个回答
0
投票

该函数假设简单的barcodes.tsv(.gz)、genes.tsv(.gz)和matrix.mtx(.gz),默认情况下没有额外的前缀或后缀。您可以使用前缀参数让它知道后缀,例如GSM3972009_69_ 但是(没问题)您需要每个前缀运行一次,然后可能将 SingleCellExperiment 对象绑定在一起。或者你手动完成这一切。毕竟,它只不过是 tsv 文件的 read.delim(...),mtx 文件的 Matrix::readMM(),然后手动构建您的 SingleCellExperiment。

有关讨论,请参阅 Biostars 的交叉帖子内容:https://www.biostars.org/p/9595552/

© www.soinside.com 2019 - 2024. All rights reserved.