cluster-computing 相关问题

计算机集群是一组协同工作的系统,因此在许多方面它们可以被视为单个系统。

如何使用snakemake --cluster-cancel?

我目前有一个snakemake管道,在集群上运行多个作业。我想提前取消我的工作,snakemake 文档说我可以使用 --cluster-cancel 选项。然而...

回答 3 投票 0

如何删除 PROXMOX 集群?

我已经在 Ubuntu proxmox 节点(“node01”)上创建了一个集群 pvecm创建cluster1 这是 pvecm status 的输出(出于安全目的,我将 IP 地址更改为 1.1.1.1) 根@node01:~#

回答 1 投票 0

SLURM:Sinfo GresUsed

运行“sinfo ... --Format=GresUsed”等命令时如何解释 GresUsed 的输出格式 我的节点的输出看起来像这样: GPU:h100:0(IDX:不适用) 做什么...

回答 1 投票 0

禁用 ECS 应用程序不从 aws sqs 读取消息

我们通过引入 aws sqs(简单队列服务)在应用程序中引入了异步处理。我们正在使用蓝/绿部署模型,当我们进行新部署时,我们会部署...

回答 1 投票 0

集群环境下的Quartz Job/Trigger监听器,如何监听每个节点?

我已经使用 Quartz 和集群环境构建了一个项目。 当一个未选举的节点到达CronTrigger时,我想让某个逻辑运行。 然而,Quartz 中的 JobListener/TriggerListener ...

回答 1 投票 0

Kubernetes 集群设置配置

我必须创建一个集群。 我在这里提出我的问题...... 1)。 t3.medium 主节点可以处理多少个工作节点? 2)。如何在 t3.small 工作节点内创建 pod? 3)。如果我创造...

回答 1 投票 0

从本地计算机访问远程 minikube

我正在尝试遵循本指南来设置一个可以从另一台本地计算机连接到的集群:https://faun.pub/accessing-a-remote-minikube-from-a-local-计算机-fd6180dd66dd#:~:tex...

回答 1 投票 0

sklearn 中不同多处理设置的 PCA 结果不一致

我在使用多处理时遇到 sklearn 中的 PCA 问题。具体来说,PCA 中的重构误差根据 Pool 中设置的进程数量而变化很大。对于insta...

回答 1 投票 0

如何让 VS Code Server 在 RHEL9 中工作?

我想在 LSF 计算集群的上下文中使用 VS Code 的远程开发功能(但我认为同样的问题与 Slurm 集群等相关)。特别是...

回答 1 投票 0

解析反馈时出错。 yaml:将 YAML 转换为 JSON 时出错:yaml:第 8 行:在此上下文中不允许映射值

当我尝试在 kubernetes 中创建 pod 时,遇到以下错误。 解析 Feedback.yaml 时出错:将 YAML 转换为 JSON 时出错:yaml:第 8 行:本续中不允许映射值...

回答 1 投票 0

为什么建议创建节点数为奇数的集群

有一些关于分布式系统的资源,例如 mongo db 文档,它建议集群中的节点数为奇数。 拥有奇数个节点有什么好处?

回答 3 投票 0

SLURM/NFS 集群共享文件系统锁定了某些用户的权限

背景 我使用 slurm 设置了一个 3 节点集群,一个控制节点和 3 个计算节点(控制节点兼作计算节点)。所有节点都在 linux mint 上,并且它们都通过...

回答 1 投票 0

AKS 集群中同一状态集中的 Pod 主机名不正确

我已经无计可施了。我一直在尝试解决这个问题,这个问题在我最近部署到 AKS 时突然开始发生,但没有解决。我经历了很多不同的尝试...

回答 1 投票 0

Nifi - 远程进程组 - PeerSelector

我已经构建了一个简单的流程组。它生成一个包含一些随机内容的 FlowFile 并将其发送到 Nifi 远程进程组。 该远程进程组配置为发送 FlowFile...

回答 1 投票 0

glassfish 4.1 和 JMS 集群

我已经创建了集群“mycluster”、两个本地实例以及资源 jms/Queue1、jms/Queue2 和 jms/Topic 以及目标服务器和集群。 所以我通过这种方式创建了集群: -c...

回答 2 投票 0

错误:检查 AWS STS 访问 – 无法获取当前会话的角色 ARN:MissingEndpoint:此服务需要“端点”配置

我创建了一个 cluster.yaml 文件,其中包含以下信息: --- api版本:eksctl.io/v1alpha5 种类:集群配置 元数据: 名称:eks-litmus-demo 区域:${AWS_REGION} 版本:“...

回答 6 投票 0

在 conda 环境中的计算集群上为 R 中的所有处理器运行单节点作业时出现问题

我正在尝试在 conda 环境“myenv”内通过 qsub 提交的大学计算集群上运行单节点作业。一旦我在 R 脚本中开始并行化,...

回答 1 投票 0

Percona XtraDB 集群:Java Spring Boot 应用程序中节点之间的自动故障转移

我已经设置了一个具有两个节点的 Percona XtraDB 集群,并且我的 Java Spring Boot 应用程序当前正在与节点 1 进行通信。挑战在于,当 Node1 宕机时,应用程序不会

回答 1 投票 0

在虚拟环境中通过 SSH HPC clutser 安装 pip 包时出现 TLS/SSL 认证错误

我正在尝试在 HPC 集群上的虚拟 venv 中安装 python 包。 (metaTS_venv) [xxxuser@hpc metaTS]$ pip3 安装 pandas 我收到下面的 TLS/SSL 错误。如果我安装在我的电脑上,它就可以正常工作...

回答 1 投票 0

如何为用户保留作业,以便在 slurm 中不达到总 CPU 数量?

我正在提交一堆数组作业,4组5组,每组8个cpu,所以总共4x5x8=160个cpu。我想将运行量保持在 100>2x5x8+1x2x8 cpu 总数以下,因为我需要让 ot...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.