dataframe 相关问题

数据框是表格数据结构。通常，它包含数据，其中行是观察值，列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语（R，Apache Spark，deedle，Maple，Python中的pandas库和Julia中的DataFrames库），“table”是用于的术语MATLAB和SQL。

Polars 将相同的自定义函数应用于分组依据中的多个列

将自定义函数应用于 Polars 中的多列的最佳方法是什么？具体来说，我需要该函数来引用数据框中的另一列。假设我有以下内容： df = pl.DataFr...

python dataframe python-polars

回答 1 投票 0

在 PySpark 中按列删除重复项

我有一个像这样的 PySpark 数据框，但有更多数据：用户身份事件日期 123 '2024-01-01 14:45:12.00' 123 '2024-01-02 14:45:12.00' 第456章 '2024-01-01 14:45:12.00' 第456章 '2024-03-01 14:45:1...

python dataframe pyspark duplicates drop-duplicates

回答 1 投票 0

如何计算 R 中变量的组合？

我正在尝试计算 R 数据框中三个变量的组合出现次数。如果我有以下数据框： df <- data.frame(v1 = c("A", "A", &

r dataframe variables count combinations

回答 2 投票 0

如何更改 pandas 中的列数据类型而不在数据框中的整个列中创建空值

尝试将具有非数字类型值的列转换为具有数字类型值的列时，我一直得到空值我一直在使用下面的代码行来更改我的列数据...

python pandas dataframe data-analysis

回答 1 投票 0

如何提高 Python DataFrame 中小数点的精度？

我正在用Python开发一个系统，它复制了用LabWindows编写的另一个系统。设计的一部分涉及计算周期图，它返回一个十进制数组。然后我将此数组添加到

python dataframe decimal signal-processing precision

回答 1 投票 0

FastAPI 返回大量 JSON 数据非常慢

我有一个 FastAPI GET 端点，它返回大量 JSON 数据（约 160,000 行和 45 列）。不出所料，使用 json.dumps() 返回数据非常慢。我是第一个...

python json pandas dataframe fastapi

回答 2 投票 0

将列从字典添加到数据框

这个问题有很多答案，但我找不到适合我的情况的答案。我有一个包含 ID 的数据框： df = pd.DataFrame({"id": [0, 1, 2, 3, 4]}) 现在，我

python pandas dataframe

回答 1 投票 0

使用 R 连接到共享点列表

有人能够将 R 中的 SharePoint 列表作为数据框导入吗？我有两个独立的数据源，一个来自 SharePoint 列表，另一个来自我希望运行分析的数据库。我是一个...

r sharepoint dataframe sharepoint-list

回答 5 投票 0

如何使用 pytest 检查 pyspark 数据框列是否有错误的值类型？

我正在尝试编写一个测试来查看 Spark 数据帧是否包含值类型不正确的记录，但我被卡住了。有数据框： schema1 = 结构类型( [ StructField("id_key&...

python dataframe testing pyspark pytest

回答 1 投票 0

Pandas 一次更新多列

我正在尝试一次更新几个字段 - 我有两个数据源，我正在尝试协调它们。我知道我可以做一些丑陋的合并，然后删除列，但希望这段代码是......

python pandas dataframe

回答 3 投票 0

将 excel 文件读入 Python Pandas 时跳过最后 4 行和前 16 行

我知道如何在读入 Pandas 时跳过 Excel 文件的前 16 行 df = pd.read_excel（文件，engine='openpyxl'，skiprows=16，usecols =“B：F”）但是我怎么能跳过最后4个呢...

python excel pandas dataframe

回答 1 投票 0

如何将字符串科学计数法转换为txt文件中的浮点数

我在 .txt 文件中有代码，其中科学记数法值存储为字符串，我试图将它们转换为浮点数，这样我就可以对它们执行计算。然而，当我尝试尝试...

python arrays dataframe floating-point scientific-notation

回答 1 投票 0

如何按列值过滤 Pandas DataFrame 的行？ [重复]

我有一个 Pandas DataFrame，想要根据其中一列的值过滤行。例如，我有这个数据框：将 pandas 导入为 pd 数据 = {'姓名': ['爱丽丝', '鲍勃', '查理'],...

python pandas dataframe

回答 2 投票 0

如何使用 ggplot2 使用这些数据创建堆积条形图？

这是我正在使用的数据：车站盐度中心D 羽状D 恐龙旗海军旗纤毛虫 A3 18.3 181000 26500 1000 15500 2250 A6 27.4 584666.6667 4666.666667 11666.66667 0 61333.33333...

r dataframe ggplot2

回答 1 投票 0

如何将复杂的 json 结构转换为数据框或 parquet 文件

我需要帮助。我有下一个 json 示例 json_样本我需要使用 pyspark 将 json 输入转换为数据帧，以便稍后保存到镶木地板文件中。我尝试： json_path = 's3://df-julio-poc/

dataframe apache-spark pyspark aws-glue

回答 1 投票 0

在 apache Spark 数据帧中读取 pdf 文件

我们可以使用下面的代码读取avro文件， val df = Spark.read.format("com.databricks.spark.avro").load(路径) 是否可以使用 Spark dataframes 读取 pdf 文件？

scala apache-spark dataframe

回答 2 投票 0

两两比较行并计算差异[重复]

我有这个数据框。我想比较日期然后计算该日期的时间差异。例如，date[0] == date[1] 为 True，则 time[0] - time[1]。如果有 4 个日期条目，例如 202...

python pandas dataframe rowwise

回答 1 投票 0

Pandas 数据框 - 将单元格值组合为字符串

我有一个数据框：电子邮件 |第 1 列 |第 2 栏 |第 3 栏 |姓名 -------------------------------------------------- ------------------ [email protected] |细胞Str11 | 1.4 | 1.4细胞Str...

python pandas dataframe

回答 1 投票 0

Pandas 数据框 - 组合单元格值

python pandas dataframe

回答 1 投票 0

Pandas Dataframe：如何通过索引选择一行，然后获取接下来的几行

在pandas中，我有一个按时间戳索引的数据帧。如下表所示： ABCD 日期 2018-0...

python pandas dataframe

回答 5 投票 0

dataframe 相关问题

最新问题