hpc 相关问题

高性能计算(HPC)是指使用超级计算机和计算机集群来解决各种计算密集型问题。

slurm 处理的 bash 脚本中的注释

我在集群上使用 slurm 来运行作业并使用 sbatch 提交如下所示的脚本: #!/usr/bin/env bash #SBATCH -o slurm.sh.out #SBATCH -p defq #SBATCH --邮件类型=全部 #SBATCH——邮件...

回答 2 投票 0

zgemv 与 dgemv/sgemv 的算术强度?

sgemv(或dgemv)的算术强度是在这组练习中推导出来的(https://florian.world/wp-content/uploads/FM-High-Performance-Computing-I-Assignment-1.pdf)成为: 0.5 / (1+c),其中...

回答 1 投票 0

Babel 可以与 Matlab 配合使用吗?我该如何操作?

我想知道是否有人设法使用 Babel 将 Matlab 与其他平台集成。 注意:我提出了三个与我关心的其他语言类似的不同问题。 不...

回答 1 投票 0

g++ 定时器与 DPC++ Intel 编译器不兼容

我有一个我一直在尝试编译的 HPCCG 文件。我想用 Intel oneAPI 编译器编译它,它成功了,但生成的结果表明计时器实现不......

回答 1 投票 0

如何在 .out 文件中输出 SBATCH 选项或如何在 bash 中回显注释行

我对使用 SLURM 工作负载管理器进行 HPC 计算相当陌生,因此尚未找到可靠的工作例程。截至目前,我有一个带有一堆 #SBATCH 标志的作业脚本,我修改了这些标志...

回答 1 投票 0

SLURM 脚本失败,尽管其中的命令有效

我目前正在尝试运行我的第一个 SLURM 脚本,但它在 sbatch 和 srun 中立即失败。 我一个接一个地测试了其中的 python 命令,它们都可以独立工作,le...

回答 2 投票 0

在 3D 模板中交换数组指针不起作用

我有一个在 32x32x32 float32 矩阵上运行的 7 点 3d 模板操作。该矩阵使用运行之间相同的一些值进行初始化,因此不存在随机分量。 原来的

回答 1 投票 0

mpirun 错误:无法访问 PMIx 服务器

当我使用 mpirun 运行 osu_bw 时,出现错误,这是我的日志: $ 哪个 mpirun /数据/软件/安装/oneapi/mpi/最新/bin/mpirun # 我正在使用英特尔 MPI $ mpirun -np 2 ./osu_bw 没有 PMIx 服务器

回答 1 投票 0

Slurm:重命名文件夹中的特定行

我正在尝试使用 for 循环来重复更改文件的行。这是我的代码。 #!/bin/bash # 用于运行多个任务的 SLURM 批处理脚本示例 # SLURM 配置 #SBATCH --节点=1 #SBAT...

回答 1 投票 0

如何在 HPC 中一起运行多个基于 python 的 slurm 作业

我需要提交 100 个 slurm 作业,它们都执行相同的计算,但略有变化(唯一的区别是年份;所有文件都有不同的年份)。有没有办法一起提交

回答 1 投票 0

用于跟踪 HPC 和本地分析文件的 Git 工作流程?

我是 Git 新手,需要有关管理 HPC 集群和本地计算机上文件版本控制的最佳工作流程的建议。 我的例程是在 HPC 上运行脚本 -> 将结果文件带到我的...

回答 1 投票 0

一个节点上运行多个单核

我有一个如下所示的 csh 脚本 foreach n(`seq 1 1000000`) ./myprog${n}.x 结尾 我想并行化它并在我的 slurm 集群上运行它,因为程序的每个实例都需要......

回答 1 投票 0

Slurm 配置问题:运行进程会阻塞整个节点的核心而不是分配的核心

我在分布式计算环境中配置 Slurm 时遇到问题。当我启动一个只应使用 4 个核心的进程时,它最终会阻塞 n 上的所有 128 个可用核心...

回答 1 投票 0

为什么 MPI_Bsend() 是一个阻塞函数?

如以下定义所示,MPI_Bsend() 是一个阻塞 MPI 函数。但这违背了我们对“封锁”一词的普遍理解。所以出现了这些问题:形容词是否“阻塞...

回答 1 投票 0

提交一个调用 srun 的 python 脚本来 slurm

我想用slurm提交一个python脚本,通过bash“sbatch myscript.sh”。在我的 script.sh 中,python 被称为“python running.py” 反过来将使用“check_cal...

回答 1 投票 0

如何控制使用 scikit-learn 的 joblib 启动的进程数量?

背景 当使用 scikit-learn 在大型数据集上执行极其并行的任务时,在高性能计算 (HPC) 环境中的集群上执行此操作会很方便。 Scikit-le...

回答 1 投票 0

对于SLURM集群,为什么我们需要为作业指定内存分配?

计算集群不是可以根据需要动态分配内存吗?

hpc
回答 1 投票 0

如何为这个函数编写cuda内核?

我有一个 C 内核,我想将其转换为 cuda 内核。然而,我在为这个函数编写内核时遇到了麻烦,因为它由多个嵌套循环组成。我的方法是

回答 1 投票 0

Slurm 错误“分配请求的核心/任务必须以季度增量”

嗨,我正在 PSC 中使用bridges2超级计算机来运行作业,当我尝试使用下面的脚本提交作业时,出现错误 sbatch:错误:分配请求的核心/任务...

回答 1 投票 0

使用slurm脚本运行其他snakemake slurm作业

我有一个功能性的snakemake配置文件,用于使用SLURM在HPC上运行作业。如果我在本地运行此脚本,作业将并行提交,并且一切都会按预期进行。 然而,这个管道...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.