dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

Polars 将相同的自定义函数应用于分组依据中的多个列

将自定义函数应用于 Polars 中的多列的最佳方法是什么?具体来说,我需要该函数来引用数据框中的另一列。假设我有以下内容: df = pl.DataFr...

回答 1 投票 0

在 PySpark 中按列删除重复项

我有一个像这样的 PySpark 数据框,但有更多数据: 用户身份 事件日期 123 '2024-01-01 14:45:12.00' 123 '2024-01-02 14:45:12.00' 第456章 '2024-01-01 14:45:12.00' 第456章 '2024-03-01 14:45:1...

回答 1 投票 0

如何计算 R 中变量的组合?

我正在尝试计算 R 数据框中三个变量的组合出现次数。 如果我有以下数据框: df <- data.frame(v1 = c("A", "A", &

回答 2 投票 0

如何更改 pandas 中的列数据类型而不在数据框中的整个列中创建空值

尝试将具有非数字类型值的列转换为具有数字类型值的列时,我一直得到空值 我一直在使用下面的代码行来更改我的列数据...

回答 1 投票 0

如何提高 Python DataFrame 中小数点的精度?

我正在用Python开发一个系统,它复制了用LabWindows编写的另一个系统。设计的一部分涉及计算周期图,它返回一个十进制数组。然后我将此数组添加到

回答 1 投票 0

FastAPI 返回大量 JSON 数据非常慢

我有一个 FastAPI GET 端点,它返回大量 JSON 数据(约 160,000 行和 45 列)。不出所料,使用 json.dumps() 返回数据非常慢。我是第一个...

回答 2 投票 0

将列从字典添加到数据框

这个问题有很多答案,但我找不到适合我的情况的答案。 我有一个包含 ID 的数据框: df = pd.DataFrame({"id": [0, 1, 2, 3, 4]}) 现在,我

回答 1 投票 0

使用 R 连接到共享点列表

有人能够将 R 中的 SharePoint 列表作为数据框导入吗? 我有两个独立的数据源,一个来自 SharePoint 列表,另一个来自我希望运行分析的数据库。我是一个...

回答 5 投票 0

如何使用 pytest 检查 pyspark 数据框列是否有错误的值类型?

我正在尝试编写一个测试来查看 Spark 数据帧是否包含值类型不正确的记录,但我被卡住了。 有数据框: schema1 = 结构类型( [ StructField("id_key&...

回答 1 投票 0

Pandas 一次更新多列

我正在尝试一次更新几个字段 - 我有两个数据源,我正在尝试协调它们。 我知道我可以做一些丑陋的合并,然后删除列,但希望这段代码是......

回答 3 投票 0

将 excel 文件读入 Python Pandas 时跳过最后 4 行和前 16 行

我知道如何在读入 Pandas 时跳过 Excel 文件的前 16 行 df = pd.read_excel(文件,engine='openpyxl',skiprows=16,usecols =“B:F”) 但是我怎么能跳过最后4个呢...

回答 1 投票 0

如何将字符串科学计数法转换为txt文件中的浮点数

我在 .txt 文件中有代码,其中科学记数法值存储为字符串,我试图将它们转换为浮点数,这样我就可以对它们执行计算。然而,当我尝试尝试...

回答 1 投票 0

如何按列值过滤 Pandas DataFrame 的行? [重复]

我有一个 Pandas DataFrame,想要根据其中一列的值过滤行。例如,我有这个数据框: 将 pandas 导入为 pd 数据 = {'姓名': ['爱丽丝', '鲍勃', '查理'],...

回答 2 投票 0

如何使用 ggplot2 使用这些数据创建堆积条形图?

这是我正在使用的数据: 车站 盐度 中心D 羽状D 恐龙旗 海军旗 纤毛虫 A3 18.3 181000 26500 1000 15500 2250 A6 27.4 584666.6667 4666.666667 11666.66667 0 61333.33333...

回答 1 投票 0

如何将复杂的 json 结构转换为数据框或 parquet 文件

我需要帮助。 我有下一个 json 示例 json_样本 我需要使用 pyspark 将 json 输入转换为数据帧,以便稍后保存到镶木地板文件中。 我尝试: json_path = 's3://df-julio-poc/

回答 1 投票 0

在 apache Spark 数据帧中读取 pdf 文件

我们可以使用下面的代码读取avro文件, val df = Spark.read.format("com.databricks.spark.avro").load(路径) 是否可以使用 Spark dataframes 读取 pdf 文件?

回答 2 投票 0

两两比较行并计算差异[重复]

我有这个数据框。我想比较日期然后计算该日期的时间差异。例如,date[0] == date[1] 为 True,则 time[0] - time[1]。如果有 4 个日期条目,例如 202...

回答 1 投票 0

Pandas 数据框 - 将单元格值组合为字符串

我有一个数据框: 电子邮件 |第 1 列 |第 2 栏 |第 3 栏 |姓名 -------------------------------------------------- ------------------ [email protected] |细胞Str11 | 1.4 | 1.4细胞Str...

回答 1 投票 0

Pandas 数据框 - 组合单元格值

我有一个数据框: 电子邮件 |第 1 列 |第 2 栏 |第 3 栏 |姓名 -------------------------------------------------- ------------------ [email protected] |细胞Str11 | 1.4 | 1.4细胞Str...

回答 1 投票 0

Pandas Dataframe:如何通过索引选择一行,然后获取接下来的几行

在pandas中,我有一个按时间戳索引的数据帧。如下表所示: ABCD 日期 2018-0...

回答 5 投票 0

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.