FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。
我有一个TXT文件:HISEQ1:105:C0A57ACXX:2:1101:10000:105587/1 HISEQ1:105:C0A57ACXX:2:1101:10000:105587/2 HISEQ1:105:C0A57ACXX:2:1101:10000: 121322/1 HISEQ1:105:C0A57ACXX:2:1101:10000:121322/2 ...
我的任务是使用base R(无软件包)计算FASTA文件的GC内容。我的问题是我不知道如何在存储...
我试图弄清楚如何在不破坏标头的情况下将混合的DNA / RNA multifasta变成仅DNA的格式。我的知识以sed's / u / t / g'结尾,但这显然会影响标头。...
我需要改进一种功能,可以解析多个fasta文件,并通过try execpt处理检查压缩情况
[伙计们,我正在使用巨大的gz压缩fasta文件,并且我有一个不错的fasta解析器,但我想使它更通用,以检查压缩的方式来解析gz或非gz ...
Perl搜索并替换,直到对多行进行正向查找-不能按预期工作?
这里的总体目标是删除以特定字符串开头并以正向超前结尾的文本块。根据我所做的测试,似乎换行符引起了问题,...
我正在使用此代码从pdb网站下载fasta序列文件。 pdb id是字符串protid。导入java.io. *;导入java.net.URL;导入java.util.Scanner;公共类...
我有一个fasta格式的文件,如下例所示。我要从以下序列中的文件中提取条目:“ CGTACG”出现多次。 > seq1 AAATTCCGTACGGGCCTCT> seq2 ...
我有一个multifasta文件,想通过保留序列将序列长度添加到标题中。 > Seq1 MADKLTRIAIVNHDKCKPKKCRQECKKSCPVVRMGKLCIEVTPQSKIAWISETLCIGCGI ...
我正在尝试从特定范围提取序列。我使用的命令只能在afast序列awk中提取前n行“ / ^> / {n ++} n> 2000 {exit} {print}” Name.faa> ...
如何使用fasta文件而不是biopython中的蛋白质序列字符串创建多个序列比对
我希望能够使用与脚本相同的目录中下载的文件编写多个序列比对。但是,在《 Biopython Cookbook》中,显示此内容的唯一方法是通过编写...
该函数接收包含数千行和K值的文件名。该函数必须将文件的每一行划分为K个序列,并创建一个字典,其中的序列为...
尝试读取FASTA格式的文件,然后再写入Genbank格式的另一个文件
[尝试使用BioPython中的Seq和SeqIO对象读取包含基因组序列的文件。无法使用open命令。程序应接受包含...
您好,我有一个巨大的Fasta文件,例如:> sequence1_CP [seq病毒] MQCKSGTNNVFTAIKYTTNNNIIYKSENNDNIIFTKNIFNVVTTKDAFIFSKNRGIMNL DITKKFDYHEHRPKLCVFKIINTQYVNSPEKMIDAWPTMDIVALITE> ...
使用python查找fasta文件中包含“ ELVIS”的基因数量;还输出所有具有ELVIS基序的基因的HSA ID号
我需要在一个包含100多个蛋白质序列的fasta文件中搜索主题“ ELVIS”。我需要计算多少蛋白质具有“ ELVIS”并输出特定的HSA ID号,......>
您好,我有一个Fasta文件,例如:> sequence1_CP [seq病毒] MQCKSGTNNVFTAIKYTTNNNIIYKSENNDNIIFTKNIFNVVTTKDAFIFSKNRGIMNL DITKKFDYHEHRPKLCVFKIINTQYVNSPEKMIDAWPTMDIVALITE> sequence2 [[病毒]
如何在特定行的末尾剪切20个字符,同时在bash中保持输出中的所有其他行不变[关闭]
所以我有一个看起来像这样的FASTA文件,我将其分成2行\> H.Sapiens.1M.Illumina.low.000000000 / 1 CTCCTTGCCTCATCCTCCCAAATAGCATGCACCACCACGCGCAGAGTATAT \> H.Sapiens.1M ....
读取用户输入的.fasta文件并使用Biopython进行解析?
我正在尝试创建一个python脚本,用户可以在其中键入自己的FASTA文件,然后将使用Biopython对该文件进行解析。我正在努力使它起作用。到目前为止,我的脚本是...
我在Bash脚本中还很陌生,我有一个要解决的问题。我有一个看起来像这样的文件:> atac ATTGGCAATTAAATTCTTTT> lipa ATTACCAAGTAAATTCTTTT。 。 。每个偶数行都有...