FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。
用不同文件中的索引替换 FASTA 文件中的数值。 (首选 Bash)
我有一个充满以下格式(依此类推)的fasta文件的文件夹,其中以>开头的行是DNA序列的读取名称,下一行是序列本身。这个...
如何使用类似 Python 标头的 fasta 将字符串序列格式化为某个预定长度
我有一个名为 input.txt 的文本文件,如下所示。 A C H E C Q D S S C H C R Q K L E D T S C H L E D V G K M N T Y H C G E G I N N G P N A S C K F M L P C V V A E F E N H T E T D W R C K L ...
创建一个函数,将输入的 fasta 文件名(X7.fasta)和输出的 fasta 文件名(X7_genes.fasta)作为输入,并一次完成所有步骤
您好我整天都在尝试解决这个问题。尽管如此,我正在寻找如何创建一个函数,将一个 fasta 文件作为输入,另一个 fasta 文件作为输出,并且...
我有一个这样的fasta文件: solper_LA1333_DN23684_c0_g1_i1.p1>solper_LA1333_DN23684_c0_g1_i4.p1>solper_LA1333_DN23684_c0_g1_i6.p1>solper_LA1333_DN23684_c0_g1_i8.p1
(交叉发布到 Biostars:https://www.biostars.org/p/9562110/) 我有一个带注释的 fasta 文件,我想在 > 下一个单词“类似于”之后添加到第一个位置 >_Anouracaudifer_000...
有没有办法使用 Python 从 UniProt 中获取蛋白质序列?
我正在寻找一种通过在输入中指定蛋白质 UniProt ID 从 UniProt 检索 FASTA 文件的方法。我的目标是创建一个能够创建 FASTA 文件的 Google Colab,我可以在其中指定...
使用 PowerShell 为多个 .faa 文件将文件名添加到以“>”开头的字符行
我有 100 个包含蛋白质序列的 FASTA 存储在一个目录中。我需要将它们各自的文件名添加到每个 FASTA 标头中(字符串字符串以“...
在 UNIX 中重命名 fasta/fastq 文件中的条目
我有 x 个读段的 fasta 文件,我想重命名每个读段的 ID。 我的文件如下: >e855552f-9484-4674-8fc4-d9b1f1add023 runid=4140cbe7f7cd36a17a00b732f27dd37bd09e4380 sampleid=mari...
我正在尝试使用 for 循环将 fasta 文档转换为 python 中的字典,但只捕获了我的最后一次迭代
我正在尝试编写代码来创建一个字典,该字典读取 fasta 文档的 dna 序列,其中 dna 序列的名称在包含...的行的开头用“>”表示...
将数据框中的 fasta 文件拆分为第 4 列并重命名,在 R 中
//#我有一个 fASTA 文件,我想将其放入一个包含 4 列的表格中 #代码 安装.packages(“seqinr”) 图书馆(“seqinr”) DNASEQ<- read.fasta(file = "C:/Users/user/Download...
我想执行以下操作,但我遇到了困难。 我想将 multifasta 文件中的氨基酸序列转换为具有欧氏距离和皮尔逊相关性的矩阵(或向量)
Cannot import name 'TextFace' error while using ETE3 for Phylogeny Tree
我正在尝试安装 ETE3 进行系统发育分析,但在安装时显示错误:无法导入名称“TextFace” 我尝试了所有可用的选项,但未能成功。 任何帮助都是
我想将第 2-3 行合并在一起并保留第 1 行。这是我的文本示例 >chrX:147147161-147148161 ATGATGGTGATGTACAGATGGTTTTTGG TTATCTAATTCATGTGTTGGTCAGATCAA >chrY:16119725-
我正在尝试使用之前发布在该论坛上的 AWK 脚本。我正在尝试将包含多个 DNA 序列的大型 FASTA 文件拆分为单独的 FASTA 文件。我需要分开...
我有一个包含 2 行的 fasta 格式的文件: 第一行以符号 > 第二行字母。 我只想保留第一行的第二个字段(逗号分隔符...
在 C++ 中读取 fasta 文件的最有效方法是什么? [关闭]
我正在编写涉及对大型 fasta 文件进行迭代的性能关键代码,其中某些行可能多达数十万个字符。到目前为止我一直这样做的方式是: #在...
如何在R中使用for循环将fasta分成两列而不使用任何包?
我有一个fasta文件,它看起来像下面的,还有其他头和相应的序列。我如何写一个带有 "for循环 "的代码,将其转换为一个数据帧,其中ORF名称是......
我有一个包含DNA序列的fasta文件,我想对每个DNA序列进行配对比较。Fasta文件包含这样的形式:>dna1 TAGTACTGACCATGGCGTTTGTTG >dna2 ....
我有四个独立的FASTA文件,我想把它们合并成一个大的FASTA文件。到目前为止,我已经使用Biostrings软件包分别读取每个文件。
我试图从一个更快的文件中提取所有的序列,在位置10有一个A。这是我唯一的要求。我已经找到了相当多的答案,但不幸的是,人们一直在寻找...。