bioinformatics 相关问题

仅将此标记用于与生物信息学相关的编程相关问题。其他问题不属于此处,但可能是https://bioinformatics.stackexchange.com/上的主题。有关更多信息,请参阅标记维基。

如何从氨基酸序列获得UniProt登录号?

我想使用Python中的UniProt API来获取给定氨基酸序列的UniProt登录号,但我似乎找不到一种方法来做到这一点,而不是从序列中。有没有办法做到这一点,...

回答 1 投票 0

windows shell -- 运行 igblast:“BLAST 查询/选项错误:种系注释数据库...”

我正在尝试在 Windows powershell 中从 NCBI 运行 igblast。当遵循文档并尝试运行以下代码时: bin/igblastn -germline_db_V 数据库/mouse_gl_V -germline_db_J 数据...

回答 1 投票 0

在 Biopyton 中建立 Fastq 质量控制循环

我试图将其变成一个循环,因为我有很多文件,我正在使用Biopython,但我不确定是否可能。 好读数 = ( 记录 for rec in SeqIO.parse(rec1, "fastq") ...

回答 1 投票 0

在biopyton中建立质量控制循环

我试图将其变成一个循环,因为我有很多文件,我正在使用 Biopython,但我不确定是否可能。 好读数 = ( 记录 for rec in SeqIO.parse(rec1, "fastq") ...

回答 1 投票 0

STAR 映射正在创建空 BAM 文件

我正在尝试运行 STAR,但收到一个空的 BAM 文件。有谁知道为什么会发生这种情况以及如何解决它? iCount mapstar 解复用/demux_NNNGGCGNN.fastq.gz hs88 映射_NNNGGCGNN \ &...

回答 1 投票 0

这个函数中 numpy 随机种子的推理?

我正在学习有关 Python 在生物信息学中的使用的教程。 在本教程中,通过以下函数执行 Mann-Whitney U 测试。 numpy.random.seed 在 pa 之后的第一行中使用...

回答 1 投票 0

使用Bio.SeqIO编写单行FASTA

QIIME 请求此(此处)有关其作为输入接收的 fasta 文件: 该文件是 FASTA 文件,序列采用单行格式。也就是说,序列不会被分解成多个 li...

回答 4 投票 0

我应该如何格式化这个正则表达式来找到这个所需的氨基酸序列?

我正在寻找 fasta 文件中序列中的氨基酸。我正在检查序列中的第 564 个氨基酸是否是 V、I 或 E。正在访问的文件已被读入并进行处理...

回答 1 投票 0

减少Grange并保留元列

我正在尝试减少 Grange 对象 文库(基因组范围) #示例数据 <- GRanges(seqnames = c("chr1", "chr1", "chr1"), ranges = IRanges(c(11,...

回答 1 投票 0

写入 csv 时 Pandas 数据框被破坏

我已经编写了一个管道来向 uniprot 发送查询,但其中一个查询遇到了一个奇怪的问题。 我已将其放入下面的一个小测试用例中。 我得到了预期的数据帧 (df)

回答 1 投票 0

如何在 R 中将多个树状图与热图合并?

我试图用样本树状图制作热图和层次聚类。 我正在尝试遵循 StackOverflow 中的这个特定线程(合并多个 hclust 对象(或 dendrogra...

回答 1 投票 0

跨时间间隔窗口的平均分数的有效映射

我有一个包含数百万行的基因组间隔的 df 例如: 染色体起始端 1 300 500 1 400 600 ………… 找到每个间隔的中心...

回答 1 投票 0

将 np.asarray 与 Biopython get_residues 一起使用:KeyError

我有一个名为 targetChain 的 Bio.PDB 链。它是 1nwx 的链 E。 这就是我的代码的样子: >>> X = [r 代表 targetChain.get_residues() 中的 r] >>> >>> np.asarray(X)

回答 1 投票 0

查找 DNA 坐标重叠的区间

我想创建一个函数,输入 2 个包含基因组间隔的数据帧,它将输出 df2 中与 df1 重叠的行。请注意,染色体必须匹配...

回答 1 投票 0

Nextflow 错误:不是有效的 S3 文件系统提供程序文件属性视图:java.nio.file.attribute.BasicWithKeyFileAttributeView

我在运行 Nextflow 流程时遇到错误。具体错误信息与S3文件系统提供者和文件属性视图有关。我正在尝试使用...运行示例数据集

回答 1 投票 0

在 Python 中准确计算两个 DataFrame 之间的重叠和非重叠基因组区间

我想要 DF1 与 DF2 重叠的确切间隔。另外,我想要不与 DF2 重叠的间隔。这很棘手,因为您必须包括 A) 不重叠的 DF1 行...

回答 1 投票 0

将字符串列表的序列一致为多序列对齐?

我正在开发一个程序,其目标是制作一个“流畅”的播放列表。为此,我从 Spotify 获取每首歌曲所属流派的列表。我假设或...

回答 1 投票 0

查找 DNA 坐标内不重叠的区间

我正在尝试找到起始/结束DNA坐标(在同一染色体上)的非重叠间隔。我很难开发一个考虑到 s 上两行的函数......

回答 1 投票 0

从非结构化医疗笔记中提取复杂变量而不依赖预定义关键字的最佳 NLP 方法

我正在致力于从电子健康记录中的非结构化患者笔记中提取结构化数据。我一直在使用 SpaCy 的命名实体识别模型和实体标尺(来定义我的d...

回答 1 投票 0

如何比较两个制表符分隔的文件,如果 file1 的 col6 与 file2 的 col2 匹配,则标记“失败”,否则标记“通过”?

我想比较两个制表符分隔的文件(带标题),并检查第一个文件 (peptide.tsv) 的第 6 列是否与第二个文件 (proteome.tsv) 的第 2 列完全匹配。如果有电子...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.