FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。
我有两个数据文件(FASTA),每个文件代表一个基因,序列由物种和本地识别。我想将这些文件连接成一个例子:psbki.fas:> ...
我有一个这样的固定文件:test_fasta.fasta> XXKHH_1 AAAAATTTCTGGGCCCC> YYYXXKHH_1 TTAAAAATTTCTGGGCCCCGGGAAAAAA> TTDTT_11 TTTGGGAATTAAACCCT> ID_2SS TTTGGGAATTAAACCCT ...
我试图用fasta文件的序列部分中的N替换所有不是C,T,A或G的字符 - 即每隔一行我认为awk和tr的某些组合是我需要的...... ...
我想提取来自人类分类法的fasta文件的所有条目,并将这些条目转换为新的较小的fasta文件。我正在尝试使用R,但我不知道该怎么做。两个......
来自R background,我想在python中尝试嵌套for循环。我在下面的代码中循环遍历每个类型的迭代时遇到问题。我的代码适用于类型[0],但不适用于连续...
我有一个这样的fasta文件:myfasta.fasta> 1_CDS AAAAATTTCTGGGCCCCGGGGG AAATTATTA> 2_CDS TTAAAAATTTCTGGGCCCCGGGAAAAAA> 3_CDS TTTGGGAATTAAACCCT> 4_CDS TTTGGGAATTAAACCCT> 5_rRNA ...
我有一个fasta文件(由>标题和序列行组成)如下:myfasta> S.sclerotiorum_Ch16_153_209 AACCCTAACCCTAACCCTTGATTGATTGATTGATTGATTGAT TGATTGATGAAATTATAGTCTCCGTAAAGCAAATAAAGCATT ...
有没有办法使用BioPython将FASTA文件转换为Genbank格式?关于如何从Genbank转换为FASTA的答案有很多,但不是相反。
我试图从fasta文件创建一个数据框,其中包含一个标题(重叠群的名称)和一个DNA序列。在我的数据框的第一列中,我想要文件的名称,...
我有一个格式如下的文件:TRINITY_DN119001_c0_g1_i1 4 * 0 0 * * 0 0 GAGCCTCCCTCATGAATGTACCAGCATTTACCTCATAAAGAGCT * XO:Z:NM TRINITY_DN119037_c0_g1_i1 4 * ...
我想用一个包含.tsv部分的列表来更改我的fasta标题的部分内容。我不是一名生物信息学家,只是一名具有bash和python初学技能的微生物学家。谢谢你的帮助。示例:...
如何使用python获取具有条件的序列计数(在fasta中)?
我有一个fasta文件(fasta是一个文件,其中标题行以>开头,后跟与该标题对应的序列行)。我想获得与TRINITY和总数相匹配的序列数...
首先,我绝不是一个编程专家,并且我不熟悉python,所以请原谅我,如果这是一个愚蠢的问题。我正在尝试运行下面的代码来将fasta文件过滤到仅...
我想删除标题中的“>”和“Un_”之间的所有内容,例如> NW_017859640.1 Esox lucius分离CL-BC-CA-002未放置的基因组支架,Eluc_V3 Un_scaffold1210我尝试了多个...
有没有办法使用Java 8中的数据流将特定字符描述的许多多行字符串收集到Arraylist中?
我有一个fasta文件,我想解析成一个ArrayList,每个位置都有一个完整的序列。序列是多行字符串,我不想在...中包含标识行
编写一个脚本,该脚本使用agrep逐个循环文档中的行与另一个文档中的行并获得结果
我正在尝试编写一个脚本,该脚本使用agrep循环遍历一个文档中的文件,并将它们与另一个文档进行匹配。我相信这可能会使用嵌套循环,但我并不完全确定。 ...
我正在尝试编写一个带有函数的文件来获取fasta文件,并且(i)给出文件的概述,(ii)绘制序列长度分布的直方图。我成功写了以下内容......
上周我决定尝试Perl6并开始重新实现我的一个程序。我不得不说,Perl6对于对象编程来说非常简单,这在Perl5中对我来说非常痛苦。我......
我有一个带有两个模式的标题的fasta文件,例如> 256_Org1 MAVVIIKDAADDSLARRD> Org2_10005 DSLARRDMAVVIIKDAA我想只保留单词并删除数字。我试着用......
如何从序列中删除'> gi | 2765658 | emb | Z78533.1 | CIZ78533 C.irapeanum 5.8S rRNA基因和ITS1和ITS2 DNA \ n'等ID?我有这个代码:open('sequence.fasta','r')为f:...