仅将此标记用于与生物信息学相关的编程相关问题。其他问题不属于此处,但可能是https://bioinformatics.stackexchange.com/上的主题。有关更多信息,请参阅标记维基。
我正在展示不同类型数据集中每个位置的变体数量:实验数据、自然数据和菌落形态数据。我想让不一样的箱子半透明
为什么 Snakemake 更喜欢使用脚本指令调用脚本而不是从 shell 调用?
标准化工作流程中的 Snakemake 规则使用脚本指令运行 Python 脚本,例如这个模板规则: 规则 XXXXX: 输入: ..., 输出: ...., 参数: ...
我有几个SNV,例如: #CHROM POS ID REF ALT 字符 1 1000。交流电 字符 1 2000。 TA 我可以从几个新的 bam 文件中获取他们的基因型数据(REF 覆盖率、ALT 覆盖率)吗?对于前...
Snakemake 包装器在没有互联网的情况下无法在 SLURM 集群计算节点上工作
我正在尝试在 SLURM 集群上的管道中使用包装器,其中计算节点无法访问互联网。 我首先使用 --conda-create-envs-only 运行了管道,然后更改了
如何在没有互联网的情况下在 SLURM 集群计算节点上使用 Snakemake 包装器?
我正在尝试在 SLURM 集群上的管道中使用包装器,其中计算节点无法访问互联网。 我首先使用 --conda-create-envs-only 运行了管道,然后更改了
如何在没有互联网的情况下在 SLURM 集群计算节点上使用 Snakemake 包装器?
我正在尝试在 SLURM 集群上的管道中使用包装器,其中计算节点无法访问互联网。 我首先使用 --conda-create-envs-only 运行了管道,然后更改了
我正在尝试开发一种用于生物信息学的 K-Means 算法,到目前为止我设法开发了一个但它没有任何 k 参数,我将 k 值设置为 2。这段代码工作正常但现在我没...
如何使用 Python Pandas 读取大小 > 10 GB 的 tsv 文件?
我有一个超过两个人的带注释的 vcf 文件,大小为 17 GB,格式为 tsv。我想使用 pandas 对此文件进行一些处理。文件读入时间太长
我的数据包含在 mydata.csv 文件中。 样品代谢物 1 代谢物 2 代谢物 3 组 控制 1 1.2 0.8 1.5 A 控制 2 0.9 1.1 1.2 ...
我是 bash 的初学者,对文件夹中的所有文件应用命令时遇到问题。这是有问题的命令: 对于 ~/work/RADseq/Pool1_process_radtags/* 中的样本 做 ...
我目前正在开发一个小型 Nextflow (v.22.10.6.5843) 管道,用于在多个文件中运行 vcfancestralalleles.jar。为此,我决定使用元组。但是,当我运行该过程时,它是 ...
我有一个包含基因突变的 tsv 文件 基因 突变 A 错义 乙 错义 乙 删除 C 删除 丁 删除 乙 沉默的 乙 删除 我想要: 选择具有基因突变的行...
使用 bash 根据特定列选择行,然后计算唯一变体并根据另一列排序
我有一个包含基因突变的 tsv 文件 基因 突变 A 错义 乙 错义 乙 删除 C 删除 丁 删除 乙 沉默的 乙 删除 我想:(1)选择具有 G...
我正在处理一个包含基因名称和 TPM 等变量的数据集。 基因 TPM 基因A 0.2 基因B 0.4 基因A 2.1 我想将出现不止一次的任何基因减少到一行,然后...
希望有人能帮助我。我几乎是 R 的新手,现在我被困住了.. 我正在使用 NGS 测序,更具体地说,关于这个特定问题,试图准备一个
我需要从我的 vcf 文件中删除“chr”。这是 vcf 文件的方面: #CHROM POS chr1 10570 chr1 10574 chr1 10654 我想要以下一个 #CHROM POS 1 10570 1 ...
我从 GSE (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE92332) 下载了一个原始数据集,其中包含单细胞分析数据。共有三种不同的文件格式 matrix.mtx.gz, ba...
生物信息学和机器学习 我期待深度学习和生命科学方面的资源
(交叉发布到 Biostars:https://www.biostars.org/p/9562110/) 我有一个带注释的 fasta 文件,我想在 > 下一个单词“类似于”之后添加到第一个位置 >_Anouracaudifer_000...
我有一个从 stringtie 生成的计数矩阵(从 FPKM 到 readcount 使用 stringtie 的 prepDE.py3)。我想创建跨样本的目标基因热图。 我的问题是: 之前...