pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

如何在Python中的余弦距离矩阵中找到距离给定诗歌最远的一首诗?

我有一个名为 dist 的余弦距离矩阵,它表示数据集中 1104 首诗之间的成对余弦距离。行和列的顺序与名为 all_meta0 的列表对齐,该列表

回答 1 投票 0

使用 Pandas 中的滚动窗口优化持久性分析,处理月份之间的重叠

我对 Python 和一般编码还比较陌生。我正在开发一个在大型数据集中执行持久性分析的项目,并试图避免使用 for 循环以提高效率。我将不胜感激...

回答 1 投票 0

在混乱的pandas数据框中转换dtypes?一些数字列有少量字符串值

我有一个大数据框。我想将它们转换为适当的数据类型。问题是在几个数字列中有字符串。我了解convert_dtypes 和to_numeric。 问题...

回答 1 投票 0

数据帧的数据帧:写入和读取

我有一组图像。在每个图像中,程序查找具有属性 X 和类型的对象。对象的数量因图像而异。因此,对于一张图像,我有一个 df_objects 和 N_objects 行...

回答 1 投票 0

获取 panda 列或其他默认值

在无法假设数据框的列存在的情况下,我经常发现自己正在实施一种“也许获取列,否则填充默认值”的方法。想知道是否还有更多Pa...

回答 1 投票 0

有没有更快的方法来解决pandas中的时间间隔比较?

我正在尝试实现一种解决方案,在给定的时间范围内找到警报的后续警报。我已经从数据帧创建了一个 IntervalIndex 并使用 np.vectorize 来比较时间...

回答 1 投票 0

添加之前的行以在 pandas 中生成另一行

我正在尝试解决我的数据框中的问题 df.head() 0 关键值 1 10 500 2 11 500 3 12 600 4 12 800 5 13 1000 6 13 1200 。 。 。 200++ 输出是放...

回答 1 投票 0

我的表格有一个日期列。我需要一个函数,如果 m 个月内总共有超过 n 行,则将同一组中的行标记为 True

我有一个输入表,我称之为claim_data。它看起来像这样: 记录_ID、事件_ID、保单编号、索赔名称、客户编号_PO、索赔编号、Life_Assured、客户编号_LA、收到日期、发生日期、

回答 1 投票 0

如何使用pyspark ETL配置输出文件大小?

我有一些 ETL 代码,我读取 csv 数据将它们转换为数据帧,在使用 pyspark RDD(弹性分布式数据集)通过地图对数据进行某些转换后组合/合并数据帧...

回答 1 投票 0

采用后续日期值检查条件后进行多个分组和聚合

我有一个数据框,我想返回跨部门诊断疾病后进行后续随访的患者数量(比例)。 例子;患者可以进行 diag_yn ...

回答 1 投票 0

尽管路径正确,DuckDB 仍不读取 Parquet 文件

我正在尝试在 VS Code 中运行的 Jupyter 笔记本中使用 DuckDB 读取大型 Parquet 文件。我的目标是直接从 Parquet 文件查询数据的子集,而不加载整个数据

回答 1 投票 0

如何根据不同列中上面单元格的条件删除行中的单元格值?

如果“时间”列等于上面的行,我正在使用的数据框有多行,“数据 1”、“数据 2”和“数据 3”列中包含重复信息。有独特的信息...

回答 1 投票 0

从 Pandas df 中提取某些单词,不区分大小写,后跟数字

您可以从数据框中的不良自由格式数据中提取一系列字母和数字吗? 我想在数据框中创建一个新列,其中的数据包含“NEX”及其后的一系列数字。

回答 1 投票 0

从 Pandas df 中提取某些单词后跟数字

您可以从数据框中的不良自由格式数据中提取一系列字母和数字吗? 我想在数据框中创建一个新列,其中的数据包含“NEX”及其后的一系列数字。

回答 1 投票 0

清理自由格式文本并从 Pandas df 中提取某些单词或字符

您可以从数据框中的不良自由格式数据中提取一系列字母和数字吗? 我想在数据框中创建一个新列,其中的数据包含“NEX”及其后的一系列数字。

回答 1 投票 0

如何删除 yfinance.download 返回的 Pandas DataFrame 中的 0 级列

我正在使用 yfinance.download 来获取一堆股票的数据,并且我可以使用返回的 pandas 数据框来处理这些股票。 我想从我的数据框中删除特定股票,但是......

回答 1 投票 0

如何在 Visual Studio Code 中突出显示或选择所有 Pandas 代码

我想在一个大型 Python 项目中从 Pandas 过渡到 Polars。有没有办法突出显示或查找我在 Visual Studio Code(或其他 IDE,如果需要)中编写的所有 Pandas 命令,以便我...

回答 1 投票 0

Panda df 清理自由格式文本并提取某些单词或字符

您可以从数据框中的不良自由格式数据中提取一系列字母和数字吗? 我想在数据框中创建一个新列,其中的数据包含“NEX”及其后的一系列数字。

回答 1 投票 0

将两个数据帧组合成每个数据帧中包含的值的单个表示

我有两个大型数据框,cl 和 cb,它们描述了一段时间内的交易限价订单簿。 cl 包含级别(认为价格),cb 包含大小(认为订单)。 我想将每个

回答 1 投票 0

当格式很奇怪时,如何让我的代码正确读取 csv 列?

在此输入图像描述 我正在使用一个旧软件,它的导出非常奇怪,因此我的标题为“专业化”的专栏没有被正确读取。我想让它理解价值观。巴斯...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.