bioinformatics 相关问题

仅将此标记用于与生物信息学相关的编程相关问题。其他问题不属于此处,但可能是https://bioinformatics.stackexchange.com/上的主题。有关更多信息,请参阅标记维基。

错误地删除了过度代表的序列。TypeError: coercing to Unicode: need string or buffer, NoneType found.

Hi I am running this python script to remove over-representative sequences from my fastq files, but I keep getting the error. 我是新来的bioinfomatics,一直按照一套固定的流水线......。

回答 1 投票 0

如何在R中根据另一个数据集的条件替换特定的行?

我有2个遗传数据集,看起来像: dataset1: ID Chr Ref Alt 1:10000476 NA NA 1:10081736 NA NA 1:100829685 NA NA 1:100829720 NA NA NA 10:1008338 NA NA NA ...。

回答 1 投票 0

如何在数据框架的单元格中使用R发现短语?

有一个像'df'这样的data.frame,我想在列'bio_process'的每个单元格中发现这个确切的短语 "角质化[GO:0031424]"。之后,我想用'ID'创建一个新的向量...。

回答 1 投票 0

在PHP中为外部URL添加变量

我想把我设置的变量添加到外部链接中。例如,我想把我设置的变量添加到外部链接中。这是外部链接 https:/genome.ucsc.educgi-binhgTracks?hgsid=836970973_rJGr4Hntud9tPwgMncRaiAnedvci&org=D.+... ...

回答 1 投票 0

如何解决Java Not-class-found Exception?

I'm new in bioinformatics and I'm trying to run a pipeline that uses the program FastQC v0.11.3. I downloaded the program locally on linux. 我把程序下载到本地的linux服务器上(没有sudo权限)。据我所知,FastQC是一个 ...

回答 1 投票 0

回答 2 投票 7

将hmmer --tblout输出转换为pandas数据框。

有没有办法把hmmer的输出转换成pandas的数据框?我也不知道如何通过Bio模块将hmmer tblout表加载到python中。我相信你可以用SeqIO调用hmmer格式......。

回答 1 投票 0

python脚本在1分钟后停止在终端上运行。

我的python脚本遇到了一个问题。我在我的机器上使用Ubuntu作为第二个操作系统,我已经写了一个python代码来输出关于一些蛋白质的不同信息。

回答 1 投票 0

使用beautifulsoup和Python3进行网络搜刮(蛋白质数据库)高度嵌套标签。

我想根据RSPB上的高级搜索查询,创建一个CSV文件,其中包括所有蛋白质的名称,它们的PDB(蛋白质数据库)Ids,以及实验方法。搜索URL的链接是这样的。URL ...

回答 1 投票 0

用python从字典中计算蛋白质组的起始和终止位置。

我正在使用python来分析和编辑我从一个蛋白质数据库中得到的一些信息,我的数据库里有这样的输出:NC_018142.1_1102_ID=1_1102 (**1277003**, 1279534, 4, 'CAS-II-C 0.64'. 有一个字典的输出:NC_018142.1_1102_ID=1_1102 (**1277003**, 1279534, 4, 'CAS-II-C 0.64'...

回答 1 投票 0

如何在R上重命名列内的项目?

如何将列L1中的项目即R上的1,2,3,4,5,6,7重命名为A,B,C,D,E,F,G,logFC变量值L1 17 0.6629950 geneID ftsE 1 39 1.1672554 geneID ftsE 2 61 -0.3932697 geneID ...

回答 1 投票 0

我如何使用自定义的度量(集合距离)来构建一个对偶距离矩阵?

我想创建一个程序,从我对集合的计算结果中计算出一个距离矩阵。这些集合的数据来自一个文件。这是Marczewski-Steinhaus记录。I ...

回答 1 投票 0

在Snakemake中,通配符中的通配符。

我最近开始使用Snakemake。我想实现的是这样的目标。我有一些需要独立修改的样本(规则index_vcf)。然后,样本组是输入 ...

回答 1 投票 0

如何解释mergejoin添加多余的行?

我有一个基因的数据集,我将其映射到蛋白质ID的类型。然后,我试图在另一个第2个数据集中找到这些蛋白质ID。第2个数据集相当大,有11759454行。我试图找到我的匹配...

回答 1 投票 0

如何使用Conda在Google Colab中为antiSMASH创建虚拟环境?

我想在Google Colab中使用antiSMASH(https://docs.antismash.secondarymetabolites.org/)。如何设置并运行示例?

回答 1 投票 0

如何使用Conda在Google Colab中为BiG-SCAPE创建虚拟环境?

我想在Google Colab中使用BiG-SCAPE(https://git.wageningenur.nl/medema-group/BiG-SCAPE/-/wikis/home)。如何设置并运行示例?

回答 1 投票 0

python和用户定义的函数

我正在学习python编码,并使用一个函数来计算具有不确定字符N或n的DNA序列中的gc百分比(NAAATTTGGGCCCN),这产生了以下问题。是...

回答 1 投票 0

从SNP rsid名称中删除不必要的信息

我有一个SNP数据集,没有按照我需要的方式进行编码。除了具有仅“ rsNUMBER”的编码,它们还具有芯片分析的信息。例如:GSA-rsNUMBER或psy-rsNUMBER ...

回答 1 投票 1

如何在气泡图中绘制静脉图元素?

我有一个实验的时间课程数据,我希望他们能绘制图表以可视化常见和独特的元素。我可以在维恩图中完成此操作,但是我想将细节散布到广阔的环境中。 ...

回答 1 投票 0

如何从hg19文件中区分内含子,外显子和UTR

我有一个FastQ格式的HG19文件,我想知道每个染色体上所有内含子,外显子和UTR的位置范围。

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.