fasta 相关问题

FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。

编辑了Fasta-lines，保持第一（ENSP）和最后（基因 - 符号 - 相工）并添加UniprotID

i从这样的RNA-seq数据中收集了一个FastA文件： > ensp00000493376.2 | enst00000641515.2 | ensg00000186092.7 | otthumg0000000000101094.4 | otthumt00000000032233.4 | OR4F5-201 | OR4F5 | OR4F5 | 326

bioinformatics fasta

回答 1 投票 0

eRROR“ fasterator”对象在生物图1.85

Error 'FastaIterator' object has no attribute 'records'

python biopython fasta

回答 1 投票 0

eRROR“ fasterator'对象没有属性'记录' today，当我执行以下代码时，我突然遇到了一个错误，无法执行代码错误'fastairator'对象在Biopython中没有属性“记录”。我从来没有任何错误b ...

python biopython fasta

回答 1 投票 0

gzip.open 在 wt 模式下会导致无效的存档

我正在编写一个预测某些序列的程序。我希望它将结果保存为 gzipped fasta 格式。但是，当尝试写入这样的文件时，我得到一个无效文件（当尝试...

python gzip fasta

回答 1 投票 0

过滤 .fasta 文件

我有以下两个文件：包含 >700 个蛋白质序列的 .fasta 文件。每个序列占据几行，并且有一个标题，其中包含有关蛋白质的一些信息，包括登录号...

bash filter bioinformatics fasta

回答 1 投票 0

过滤 JSON 文件并使用输出来过滤 .fasta 文件

我有以下两个文件：包含 >700 个蛋白质序列的 .fasta 文件。每个序列占据几行，并且有一个标题，其中包含有关蛋白质的一些信息，包括登录号...

json bash filter bioinformatics fasta

回答 1 投票 0

BASH：过滤 .json 文件并使用输出来过滤 .fasta 文件

我有以下两个文件：包含 >700 个蛋白质序列的 .fasta 文件。每个序列占据几行，并且有一个标题，其中包含有关蛋白质的一些信息，包括登录号...

json bash filter bioinformatics fasta

回答 1 投票 0

使用Bio.SeqIO编写单行FASTA

QIIME 请求此（此处）有关其作为输入接收的 fasta 文件：该文件是 FASTA 文件，序列采用单行格式。也就是说，序列不会被分解成多个 li...

python python-2.7 bioinformatics biopython fasta

回答 4 投票 0

返回 fasta 文件中标头后面的前 n 个字符

我正在尝试提取 fasta 文件中标头后面的前 n 个序列。标头通常使用“>”字符定义，这样对应于 sp 的序列块...

linux text grep extract fasta

回答 1 投票 0

如何创建 BLAST 本地蛋白质数据库而不出现错误“BLAST 数据库错误：数据库内存映射文件错误”

我正在尝试在本地数据库上使用 psi-blast 并不断收到错误。我认为我收到的错误可能是由于未正确创建blast数据库的结果，因为当我...

database fasta blast

回答 1 投票 0

如何根据多个文件中的文件名重命名fasta标头？

我有一个目录，其中包含多个 fasta 文件，名称如下： BC-1_bin_1_genes.faa BC-1_bin_2_genes.faa BC-1_bin_3_genes.faa BC-1_bin_4_genes.faa 等（约200个单独文件）法斯塔头......

bash awk sed bioinformatics fasta

回答 3 投票 0

仅在 FASTA 标题中保留物种名称

我尝试使用 Awk 和 sed 命令在 Bash 中进行编码，但没有获得所需的输出。我有一个包含以下内容的文本文件： >AC201869.46386.47908 虫王

awk sed fasta

回答 1 投票 0

我有一个文本文件，我想删除其中的特定模式

我尝试使用 AWK 和 SED 命令在 BASH 中进行编码，但没有获得所需的输出，请帮助我使用简单的代码来解决我的问题。看我有一个包含这样内容的文本文件。 >AC201869.46386.47...

awk sed fasta

回答 1 投票 0

使用 FastAPI 的 Pytest 不会在文件测试之间重置数据库

我有多个 Pytest 文件。问题是每个文件运行完毕后数据库数据没有被清除。 DB_URL =“sqlite:///:内存：” 引擎 = create_engine(DB_URL,

sqlalchemy pytest fasta

回答 1 投票 0

使用awk通过文件中的ID从multifasta文件中提取序列

我想从 multifasta 文件中提取与单独的 ID 列表给出的 ID 相匹配的序列。 FASTA 文件 seq.fasta： >7P58X:01332:11636 TTCAGCAAGCCGAGTCCTGCGTCGTTACTTCGCTT

search awk bioinformatics multiline fasta

回答 4 投票 0

如何在 R 中匹配字符串模式

我正在寻找一个好的库来使用 R 提取 genbank (gbk) 文件的信息。这是gbk文件的常见结构基因补体(1..1002) /基因=“bla...

r bioinformatics fasta genbank

回答 1 投票 0

计算文件中由特定字符分隔的行数和字符数

我有一个fasta文件： >1 AGGGTCACGTAATGCTGATCCAGTCTTGTTTTTTTTTCATTCATGTTCCCGCTCTTGCT TTGATTCCGACTTCTAACGTTTAACCTGTGATCAGACGTTTCACTGCTCCATATTTTACG TGTGCCTGCCGGTCATCTTGGGTAGAGTTAGCATATCC >2

awk bioinformatics fasta

回答 6 投票 0

Perl：匹配数组元素，然后将上一个（后面 5 个索引）数组元素复制到新数组

本质上我想做的是搜索一个大文本文件来识别每个显示“未找到匹配项”的元素，并将匹配的标识符复制到新列表中。我对第一个很好...

regex perl bioinformatics fasta regular-language

回答 4 投票 0

如何使用 Bash 脚本查找 FASTA 文件的 GC 内容？

我想使用 Bash 脚本从 FASTA 格式文件中查找 GC 内容。 GC含量基本上是((G+C)的数量)/((A+T+G+C)的数量)。我正在尝试使用 wc 命令。 ...

linux bash bioinformatics fasta dna-sequence

回答 3 投票 0

将 FASTA 读入数据帧并提取 FASTA 文件的子序列

我有一个 DNA 序列的小 fasta 文件，如下所示： >NM_000016 700 200 234 ACATATTGGAGGCCGAAACAATGAGGCGTGATCAACTCAGTATATCAC >NM_000775 700 124 236