仅将此标记用于与生物信息学相关的编程相关问题。其他问题不属于此处,但可能是https://bioinformatics.stackexchange.com/上的主题。有关更多信息,请参阅标记维基。
使用 pubchempy 将 CID 转换为 Chembl_id
我目前正在用Python开发一个项目,一个相当长的步骤是将CID(化合物识别号)列表转换为Chembl_id。为此,我使用 pubchempy lib 来自 pubchempy 我...
我有以下两个文件: 包含 >700 个蛋白质序列的 .fasta 文件。每个序列占据几行,并且有一个标题,其中包含有关蛋白质的一些信息,包括登录号...
我有以下两个文件: 包含 >700 个蛋白质序列的 .fasta 文件。每个序列占据几行,并且有一个标题,其中包含有关蛋白质的一些信息,包括登录号...
BASH:过滤 .json 文件并使用输出来过滤 .fasta 文件
我有以下两个文件: 包含 >700 个蛋白质序列的 .fasta 文件。每个序列占据几行,并且有一个标题,其中包含有关蛋白质的一些信息,包括登录号...
我有 5 个重复的 3 个时间点的蛋白质强度列表。 我想评估不同时间点的蛋白质强度变化在重复实验之间是否存在统计差异...
如何通过 for 循环在配对文件上使用 SLURM_ARRAY_TASK_ID?
我有一个包含 180 个文件的文件夹,这些文件的名称中配对为 *R1.fastq.gz 和 *R2.fastq.gz。所以它可能是“abc_R1.fastq.gz”和“abc_R2.fastq.gz”作为一对,并且有......
如何通过 for 循环在配对文件上使用 SLURM_TASK_ID?
我有一个包含 180 个文件的文件夹,这些文件的名称中配对为 *R1.fastq.gz 和 *R2.fastq.gz。所以它可能是“abc_R1.fastq.gz”和“abc_R2.fastq.gz”作为一对,并且有......
问题: 我正在设置一个 Nextflow 管道,它可以处理单个和多个输入文件集。处理一组文件时,我想使用命令行参数,例如: 下一个弗洛...
我想使用Python中的UniProt API来获取给定氨基酸序列的UniProt登录号,但我似乎找不到一种方法来做到这一点,而不是从序列中。有没有办法做到这一点,...
windows shell -- 运行 igblast:“BLAST 查询/选项错误:种系注释数据库...”
我正在尝试在 Windows powershell 中从 NCBI 运行 igblast。当遵循文档并尝试运行以下代码时: bin/igblastn -germline_db_V 数据库/mouse_gl_V -germline_db_J 数据...
我试图将其变成一个循环,因为我有很多文件,我正在使用Biopython,但我不确定是否可能。 好读数 = ( 记录 for rec in SeqIO.parse(rec1, "fastq") ...
我试图将其变成一个循环,因为我有很多文件,我正在使用 Biopython,但我不确定是否可能。 好读数 = ( 记录 for rec in SeqIO.parse(rec1, "fastq") ...
我正在尝试运行 STAR,但收到一个空的 BAM 文件。有谁知道为什么会发生这种情况以及如何解决它? iCount mapstar 解复用/demux_NNNGGCGNN.fastq.gz hs88 映射_NNNGGCGNN \ &...
我正在学习有关 Python 在生物信息学中的使用的教程。 在本教程中,通过以下函数执行 Mann-Whitney U 测试。 numpy.random.seed 在 pa 之后的第一行中使用...
QIIME 请求此(此处)有关其作为输入接收的 fasta 文件: 该文件是 FASTA 文件,序列采用单行格式。也就是说,序列不会被分解成多个 li...
我正在寻找 fasta 文件中序列中的氨基酸。我正在检查序列中的第 564 个氨基酸是否是 V、I 或 E。正在访问的文件已被读入并进行处理...
我正在尝试减少 Grange 对象 文库(基因组范围) #示例数据 <- GRanges(seqnames = c("chr1", "chr1", "chr1"), ranges = IRanges(c(11,...
我已经编写了一个管道来向 uniprot 发送查询,但其中一个查询遇到了一个奇怪的问题。 我已将其放入下面的一个小测试用例中。 我得到了预期的数据帧 (df)
我试图用样本树状图制作热图和层次聚类。 我正在尝试遵循 StackOverflow 中的这个特定线程(合并多个 hclust 对象(或 dendrogra...
我有一个包含数百万行的基因组间隔的 df 例如: 染色体起始端 1 300 500 1 400 600 ………… 找到每个间隔的中心...