在 R 中使用 msa 包,它崩溃了

问题描述 投票:0回答:1

我正在运行 msa 包来为 phangorn 包创建 DNA 对齐,但它因此错误而崩溃

我正在 M1 Mac Book Pro 上运行带有 R v4.3.1 的 RStudio

mult <- msa(seqs, method="Muscle", type="dna", order="input")

结果是:

*** ERROR ***  MSA::SetIdCount: cannot increase count

Fatal error, exception caught.
Error in msaFun(inputSeqs = inputSeqs, cluster = cluster, gapOpening = gapOpening,  : 
  MUSCLE finished by an unknown reason

输入文件为 6440 个 DNA seq,平均长度为 1500 bp。

当我在 Linux 虚拟服务器上以独立模式运行 Muscle 时,我必须使用 super5 选项,因为它会发出此警告

WARNING: >1k sequences, may be slow or use excessive memory, consider using -super5

Floating point exception (core dumped)
(base) ubuntu@jrmicl-clovr:~/muscle$ muscle5 -super5 seqs.fas -output seqs_aln.fas

有什么想法 - 这是记忆的事情吗?

r dna-sequence
1个回答
1
投票

我目前在完全不同的数据集上遇到同样的问题 - 3 个基因和每个基因 34 个生物体。你能解决这个问题吗?我深入研究了 MSA 源代码,发现错误来自 msa.cpp 文件中的比较函数 - 第 651-665 行。 我解释代码的方式是 mUID(肌肉 UID?)与“常规”UID 不同,无论它来自何处。 ClustalOmega 没有给我这个问题,所以我可能会改用它。

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.