高性能计算(HPC)是指使用超级计算机和计算机集群来解决各种计算密集型问题。
如何找到 hpcviewer 以便可视化 hpcrun 生成的跟踪数据?
我的问题是关于 hpcviewer,它是一个可视化生成的跟踪数据的工具 由 hpcrun 提供。 我成功安装了 hpctoolkit,但查找 hpcviewer 时遇到问题。 为了测试该工具包,我创建了一个
Seurat FindClusters() 似乎在一次迭代后冻结了
我尝试在 RedHat Linux HPC 上使用以下命令在大约 20G、300K 单元的数据集上运行 FindClusters(): df <- FindClusters(df, resolution=seq(0.01,1,by=0.1), verbose = TRUE,
在虚拟环境中通过 SSH HPC clutser 安装 pip 包时出现 TLS/SSL 认证错误
我正在尝试在 HPC 集群上的虚拟 venv 中安装 python 包。 (metaTS_venv) [xxxuser@hpc metaTS]$ pip3 安装 pandas 我收到下面的 TLS/SSL 错误。如果我安装在我的电脑上,它就可以正常工作...
我试图了解一个简单的作业消耗多少内存(基于这个python脚本)。我在分配了不同数量的核心的单个工作线程上运行相同的脚本。 结果
我正在寻找最通用/最简单的方法来运行具有变化的输入的令人尴尬的并行代码。 我希望最终的解决方案能够在工作站上运行(没有可用的 PBS),但是...
我正在尝试将特定的软件安装到我的大学 HPC3 服务器上。安装教程上说需要安装 conda 环境。然而我被拒绝了
我在高性能计算系统上运行批处理作业来对对齐的读取进行排序,并使用 GNU 并行来加速我的工作,但我的工作失败了,原因如下: 并行:错误:输出为
使用c++ 初始化Papi后,我想知道FLOPS,但我发现PAPI_SP_OPS剩余0 执行。时间(毫秒):53.282 PAPI_FP_OPS:0 PAPI_TOT_CYC:1587...
我希望能够将我的 slurm 批处理脚本附加到我的错误文件中。我使用 sbatch -J "my_run_name" runscript.slurm 在 HPC 上提交这些内容。 runscript.slurm 的内容总结...
我正在研究 HPC 应用程序和并行文件系统。我遇到了术语暂存空间和暂存文件系统。 我无法想象这个暂存空间存在于哪里。是在电脑上吗...
通过 OpenCL 加速 intel CORE i7 处理器
假设我有一台没有任何监视器的服务器计算机,并且有一个算法在其上运行(进程)。我可以通过使用 OpenCL 来提高算法的性能吗
我刚刚获得了 HPC 用户并想要创建我的环境。但是,当我尝试创建它们时,我收到以下消息: (base) [xxxxx@front ~]$ conda create -n rnaseq -c bioconda -f rnaseq ....
如何在openhpc xcat无盘集群的计算节点安装NRPE?
我有一个小型 xcat 无盘集群,我想在其中的计算节点上安装 NRPE。如何在计算节点所在的管理节点的操作系统映像或 chroot 路径上安装 NRPE
我有一个软件,需要发送任务的节点的纯文本列表(每个任务一次)。例如,如果我的作业是使用 -n 4 -c 1 启动的,我在 node1 中获得 3 个 CPU,在 nod 中获得 1 个 CPU...
为什么奇点容器在登录和 slurm HPC 上的计算节点上的行为不同
为什么我能够在奇点容器中手动运行 R 脚本而不会出现问题,但作为 slurm HPC 上的数组作业,它会在各个级别上失败。这与假设相矛盾......
我有一个 bash 脚本,它执行各种每周数据收集任务并生成报告,然后将其回显到要发送的电子邮件中。我已经在 Linux 终端中手动运行了脚本...
在运行 Red Hat Enterprise Linux Server 7 的高性能计算 (HPC) 集群上的 Python 虚拟环境中安装 numpy 时出错
说明: 我在尝试在运行 Red Hat Enterprise Linux S 的高性能计算 (HPC) 集群上的 Python 虚拟环境中安装 numpy 包时遇到问题...
无法使用 sbcast 将文件从 master 复制到计算节点
我有一个由 6 个计算节点和 1 个主节点组成的集群,用于学术研究目的。我正在尝试测试我的集群并确保它们可以完成提交的各种批处理作业。我...
我正在尝试将大型作业数组提交到集群。 qsub 请求失败,并出现错误作业数组请求错误。我想这是因为我的工作数组太大了。我怎样才能读取最大允许...
我有一个计算成本高昂的模拟函数,我希望将其分布到多节点集群上。代码看起来像这样: 输入任务 = [输入_0、输入_1、...、输入_n] 为...