我正在运行 msa 包来为 phangorn 包创建 DNA 对齐,但它因此错误而崩溃
我正在 M1 Mac Book Pro 上运行带有 R v4.3.1 的 RStudio
mult <- msa(seqs, method="Muscle", type="dna", order="input")
结果是:
*** ERROR *** MSA::SetIdCount: cannot increase count
Fatal error, exception caught.
Error in msaFun(inputSeqs = inputSeqs, cluster = cluster, gapOpening = gapOpening, :
MUSCLE finished by an unknown reason
输入文件为 6440 个 DNA seq,平均长度为 1500 bp。
当我在 Linux 虚拟服务器上以独立模式运行 Muscle 时,我必须使用 super5 选项,因为它会发出此警告
WARNING: >1k sequences, may be slow or use excessive memory, consider using -super5
Floating point exception (core dumped)
(base) ubuntu@jrmicl-clovr:~/muscle$ muscle5 -super5 seqs.fas -output seqs_aln.fas
有什么想法 - 这是记忆的事情吗?
我目前在完全不同的数据集上遇到同样的问题 - 3 个基因和每个基因 34 个生物体。你能解决这个问题吗?我深入研究了 MSA 源代码,发现错误来自 msa.cpp 文件中的比较函数 - 第 651-665 行。 我解释代码的方式是 mUID(肌肉 UID?)与“常规”UID 不同,无论它来自何处。 ClustalOmega 没有给我这个问题,所以我可能会改用它。