distributed-computing 相关问题

利用多台计算机，通过通信链路相互连接，完成一项共同任务。

使用 PyTorch 的 DDP 通过 mp.spawn() 进行多 GPU 训练不起作用

我正在尝试使用PyTorch和DDP实现多GPU单机训练。我的数据集和数据加载器如下所示： # 使用 albumentations 定义转换- 变换训练 = A.Compose( ...

python pytorch distributed-computing torch

回答 1 投票 0

可串行化和可线性化有什么区别？

我对这两种一致性模型感到非常困惑。请给出一些时间线示例并进行解释。 http://en.wikipedia.org/wiki/Consistency_model

distributed-computing

回答 3 投票 0

使用 PyTorch Lightning 中的大型 Memmaped OpenWebText 数据集对多 GPU 训练进行故障排除以实现 nanoGPT

描述我目前正在致力于使用 PyTorch Lightning 实现 nanoGPT。我的目标是使用 PyTorch 数据集和 PyTorch Lightning 数据集加载大型内存映射 OpenWebText 数据集 (16GB)...

pytorch distributed-computing pytorch-lightning pytorch-dataloader multi-gpu

回答 1 投票 0

如何从 count-min-sketch 中获取前 K 个元素？

我正在阅读如何使用概率数据结构 count-min-sketch 来查找数据流中的前 k 个元素。但我似乎无法理解我们维护堆的步骤......

stream real-time distributed-computing frequency count-min-sketch

回答 3 投票 0

在 slurm 中跨节点分发 python 代码

我有一个计算成本高昂的模拟函数，我希望将其分布到多节点集群上。代码看起来像这样：输入任务 = [输入_0、输入_1、...、输入_n] 为...

python partitioning distributed-computing slurm hpc

回答 1 投票 0

C - MPI：如何转置已经分散在进程中的伪二维数组？

我在代码开发中遇到了这样一个问题：长度为 (N_r * N_theta * N_phi) 的名为 arr 的向量“表示”一个名为 10 个形状 (N_rs, N_thetas, N_phis) 的 3D 张量

arrays c parallel-processing mpi distributed-computing

回答 1 投票 0

分布式多播中“接收”和“传送”有什么区别？

在多播上下文中，接收消息的进程和传递消息的进程有什么区别？

distributed-computing multicast definition difference

回答 1 投票 0

BASE 风格数据库中的乐观锁

BASE 风格的数据库是软状态和最终一致的。我知道不同的数据库管理系统各不相同，它们的配置也有很大的差异。但让我们想象一下：让...

nosql couchbase distributed-computing eventual-consistency

回答 1 投票 0

PySpark monotonically_increasing_id 结果在本地和 AWS EMR 上不同

我创建了一个小函数，它将为每一行分配一个复合 id，以便在给定子集大小的情况下将行本质上分组为较小的子集。在我的本地计算机上，逻辑运行完美。有一次我

python apache-spark pyspark amazon-emr distributed-computing

回答 1 投票 0

在 AWS Batch 多节点之上运行 Ray？

我对在 AWS Batch 多节点上运行 Ray 感兴趣。这是 Ray 之前从未做过的模式，因此没有相关文档。但是，我真的很想尝试一下，因为雷可以......

python distributed-computing ray aws-batch ray-train

回答 1 投票 0

Celery 中工人之间的任务智能分配

经过一周的尝试和搜索，我没有得到任何结果，我将感谢您的帮助。概括：我有 10 个工人，每个工人里面都有一个 app.task 。每天，这10名工人...

python rabbitmq celery distributed-computing

回答 1 投票 0

分布式处理如何与 spark 和 S3 一起工作？

我已经详细研究了分布式处理如何与 spark 和 HDFS 一起工作。在这种对比中，我可以看到 spark 将分区读取为 HFile，并且 spark 将不同的 HFile 加载到不同的

apache-spark amazon-s3 distributed-computing

回答 0 投票 0

多核计算机中的线程

我们观察一台多核计算机。在给定的计算机中，一个内核上有一个正在运行的线程，而另一个内核上有另一个线程正在运行。有没有可能一个线程属于...

multithreading parallel-processing distributed-computing

回答 0 投票 0

多计算机计算通信系统架构[关闭]

我参与了某个项目，我需要建立一个折衷制度，可以做到以下几点：每台计算机都得到它的初始数据（最好发送它的形式...

linux architecture distributed-computing

回答 0 投票 0

使用 Dask 在一堆服务器上训练 pytroch-lightning 模型的最简单方法是什么？

我可以访问几十个没有 GPU 但可以完全控制软件的 Dask 服务器（可以擦除它们并安装不同的东西）并且想要加速 pytorch-lightning 模型 tr ...

machine-learning dask distributed-computing pytorch-lightning ddp

回答 1 投票 0

如何在多个 GPU 上扩展深度学习？

需要一些帮助来将训练过程扩展到多个 GPU “学习率”：1.0e-3， “规范化”：空， “验证”：0.20， “纪元”：64， “batch_siz...

python tensorflow deep-learning pytorch distributed-computing

回答 0 投票 0

如何将互斥量用于简单的分布式计数器/ id gen 且性能损失最小

我想使用不支持此功能的 nosql 数据库设置一个简单的自动递增 id，并且正在考虑使用互斥锁来保证排序。我很担心...

database nosql distributed-computing

回答 0 投票 0

在 2PC 中如果提交失败会怎样？

在 2PC 中，如果协调器要求 3 个参与者提交，而第二个参与者失败且没有对协调器做出响应，会发生什么情况。客户端到达向第二个节点询问值，第二个节点 ...

distributed-computing consensus

回答 3 投票 0

分布式系统初学者项目

我是一个全栈开发者。我想了解更多关于分布式计算和分布式系统的知识。我想知道互联网上一些最好的资源和一些初学者......

java c++11 distributed-computing distributed distributed-system

回答 0 投票 0

如何在 spark 中获取包含密集向量的 2 列的点积

我有一个包含密集向量的 spark 数据框，如 Col_W_DensV1 和 Col_w_DenseV2 列，现在我想计算它们之间的余弦相似度，因此需要点积。我现在...

apache-spark pyspark distributed-computing word2vec cosine-similarity

回答 1 投票 0

distributed-computing 相关问题

最新问题