dask 相关问题

Dask是一个灵活的并行计算库，用于分析计算。它支持针对计算和大数据集合优化的动态任务调度。

如何使用dask高效并行化时间序列预测？

我正在尝试使用 dask 在 python 中并行化时间序列预测。数据的格式是每个时间序列都是一列，并且它们具有共同的每月日期索引。我有一个习惯

python parallel-processing time-series forecasting dask

回答 2 投票 0

有没有一种有效的方法来更新/替换python中dask数组的特定值？

所以我有一个 dask 整数数组（1 x 8192），我想找到一种有效的方法来替换特定值。这是我当前使用的代码，速度非常慢，因为 dask 是不可变的，...

python numpy performance parallel-processing dask

回答 1 投票 0

xarray 和 dask：高效处理大型 netcdf 文件

我正在尝试对一个非常大的netcdf文件进行简单的计算，并且正在努力加快速度——可能是因为我主要用julia和R编程。我认为xarray/dask是最好的方法...

dask python-xarray netcdf

回答 1 投票 0

如何使用两个DataFrame加速获取距离内的点？

我有两个DataFrame（df和locations_df），并且都有经度和纬度值。我试图找到每行locations_df 2 公里范围内的df 点。我尝试对函数进行矢量化...

python pandas dataframe dask geopandas

回答 1 投票 0

dask map_partitions 奇怪的行为

当我从 pandas 创建一个具有 1 个分区的 dask 数据框，然后在其上调用 map_partitions() 时，它似乎被调用了两次。如果我有5个分区，则调用6次。一般来说，函数是

python dask

回答 1 投票 0

处理大型 CSV 文件时如何优化 Python 脚本的性能？

我正在开发一个处理非常大的 CSV 文件（大约 5GB）的 Python 脚本，但我注意到严重的性能问题。我想优化我的代码以获得更高的效率。这是一个

python pandas csv dask

回答 1 投票 0

如何让 Dask 工作人员在处理大型数据集时保持忙碌，以防止他们耗尽任务？

我正在尝试使用Python中的Dask分布式计算来处理大型数据集（大约100万个任务）。（我正在从数据库获取数据来处理它，并且正在检索大约 1M 行）。我在这里

python dask dask-distributed dask-delayed

回答 1 投票 0

Dask 数据帧并行运行并按列分区

我有一个包含多个公司和国家/地区数据的数据框，我正在尝试使用函数并行转换这些数据。数据采用这样的格式，但要大得多，并且有更多的信息...

python parallel-processing multiprocessing dask dask-dataframe

回答 1 投票 0

如何模块化与 dask 一起使用的函数？

我正在尝试模块化使用 Dask 的函数，但我不断遇到错误“没有名为“setup”的模块”。我无法导入任何与 Dask 相关的本地模块，目前，

python parallel-processing dask dask-distributed

回答 1 投票 0

无法在 Azure Databricks 中安装 Dask

我正在尝试在 Azure Databricks 中安装 Dask，为此，我遵循以下文档：https://github.com/dask-contrib/dask-databricks 首先，我创建了初始化脚本和...

azure databricks azure-databricks dask

回答 1 投票 0

在 K8s 上使用 helm3 的 dask-getway：错误：无法安装 CRD crds/daskclusters.yaml

我正在按照说明在 K8s 集群上设置 Dask。我使用的是 MacOS，K8s 在 Docker Desktop 上运行，kubectl 版本 1.22.5 和 helm 版本 3.8.0。添加存储库后，下载

kubernetes kubernetes-helm dask dask-kubernetes

回答 1 投票 0

有没有办法将xarray保存到zarr文件中，并且可以在多个维度上附加？

标题：在 Xarray 中收集过程中高效地将数据附加到 Zarr 文件我目前正在实习，需要创建大型数据集，通常大小为数百 GB。我正在收集

python dask python-xarray dask-distributed zarr

回答 1 投票 0

DaskLGBMClassifier.fit() 错误：“Future”对象没有属性“get_params”

我正在尝试 LGBM 的 Dask API，当我安装 DaskLGBMClassifier 时，出现以下错误： “Future”对象没有属性“get_params” 我尝试在原始代码上调试它。变量...

python machine-learning scikit-learn dask lightgbm

回答 1 投票 0

创建另一个与当前系列具有相同索引但具有不同值的系列

我有将 dask.dataframe 导入为 dd 将 pandas 导入为 pd s = dd.from_pandas(pd.Series([1,2,3])) 我正在尝试制作另一个系列 s_other ，它应该与 s 一样，但是：所有值都应为 999...

python dask

回答 1 投票 0

to_csv 函数中的服务器端加密

我在使用 to_csv("s3://mys3bucket/result.csv") 时收到此错误异常：[Errno 写入失败：mys3bucket/result.csv/2489.part] 调用 PutObject 时发生错误 (AccessDenied)

amazon-s3 dask

回答 1 投票 0

在 dask dataframe 中构建组合列进行排序

在 Dask 中排序基于这个答案我想动态构建组合列 df_post['sort_column'] = df_post.apply(lambda r:str([r[col1],r[col2],r[col3]]), axis=1) df_post = df_post.set_in...

python pandas sorting apply dask

回答 1 投票 0

为什么通过 ENTRYPOINT 和 tini 安装依赖项？

我有一个关于 dask-docker 上 Dockerfile 实现的问题。来自 Continumio/miniconda3:4.8.2 运行 conda install --yes \ -c conda-forge \ python==3.8 \ [...] &...

docker dask tini

回答 2 投票 0

Dask - 高 CPU 消耗卸载并行工作进程

我正在使用 dask 进行模拟的并行处理。它由一系列微分方程组成，这些微分方程使用使用 numba @jitdecor 编译的 numpy 数组进行数值求解...

python parallel-processing dask dask-distributed

回答 1 投票 0

使用顺序 dask.bag.map 操作时 dask bag 是否保留顺序

据说dask bag不保秩序。然而，dast.bag.map 给出的示例暗示了 https://docs.dask.org 中的顺序被保留，或者至少是可预测的......

python dask

回答 1 投票 0

如何将 dask HTML 高级图表导出到磁盘

有一种方法可以在 jupyter 笔记本中生成 HTML 高级图，如 dasks 的文档所示：https://docs.dask.org/en/stable/graphviz.html#high-level-graph-html -表示服用...

python jupyter dask

回答 1 投票 0

dask 相关问题

最新问题