数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。
当 DataFrame 是另一个结构体的组件时,如何将测试数据加载到 Julia DataFrame 中
我在 Julia 中创建了一个类型(结构)。 struct 示例结构 数据::数据框 结尾 它有一些相关的函数/方法,我想为其编写单元测试。 这是一个化妆的例子......
我是 R 新手,我想知道如何使用一种巧妙的方法首先在数据帧的两列上应用函数,然后根据某些条件进行过滤。 所以最初的列表如下所示: 样品1
Pandas/Python 根据旧列和前一行的条件创建新列和行
我正在尝试分析数据框中的一些数据,并确定数据中何时出现空闲时间(显示为平点)。 这些平点是当 disp 值从 > 520 到 ~ 225 时出现的。我...
我有一个数据框 df 如下:一列(Column_1)和相应的 5 条记录如下 第_1栏 0000099598|000000|-1|0.00|需要映射到EDW|需要映射到EDW|break|006||0000099598|000000|
我有一个带有字符串行的数据框。我想根据此列中的字符串对整个数据框进行排序。但是,有些行包含一个子字符串,该子字符串是另一行中的文本......
如何将 pandas 数据框的单列转换为字符串类型?在下面的住房数据 df 中,我需要将邮政编码转换为字符串,以便当我运行线性回归时,邮政编码被视为
Python 如何选择列出列具有 NaN 条目的所有 DataFrame 行
我有一个包含 2 列的 DataFrame(20k 行),如果第一列(纬度)行条目为 NaN,我想更新。我想使用下面的代码,因为它可能是一种快速的方法,但我不是......
我有这个假设的数据框 df<- data.frame(a_13=c(NA, 1, 2), a_12=c(NA, 4, 3), a_11=c(NA, 2,NA)) df a_13 a_12 a_11 1 NA NA NA 2 1 4 2 3...
我有这个假设的数据框 df<- data.frame(a_13=c(NA, 1, 2), a_12=c(NA, 4, 3), a_11=c(NA, 2,NA)) df a_13 a_12 a_11 1 NA NA NA 2 1 4 2 3...
如何防止 pandas read_csv 在 DataFrame 的一行中对相同的值进行编号?
我刚刚遇到了一些似乎在 python 论坛或任何教程中都没有讨论过的问题。至少,我找不到任何解释。 我想使用Python/pandas读取csv文件...
我有一些量化金融代码,可以对股票价格进行一些分析。 我需要计算的一件事是 EWMA。 在做研究时(即:历史“批量”世界),我有很长一段路...
使用参数将 scipy.minimize 应用于 Pandas 数据框
我有一个由 f(x_0, x_1) = a(x_1 - x_0^2)^2 + (b - x_0)^2 定义的函数,其中 a 和 b 是一些参数: 定义 f(x): 返回a*(x[1]-x[0]**2)**2+(b-x[0])**2 其中 x=np.array([x_0,x_1]) 是一个 nu...
我有一个数据框,我想找到同一 ID 的定期付款(仅当金额相同并且当月的日期相同且有误差范围(+-5 天)时。 我已经完成了以下...
为什么我在 pandas 中使用循环时会收到这些 KeyErrors?
当我创建 3 个 keras 模型(针对 3 种不同类型的数据)时,我尝试在我的大数据集中使用这些模型/我使用“Rock”列来选择模型,然后我使用来自另一个 df 的数据(带有一样的长度...
我有一个 pandas dataframe print 的问题,没有按照要求的精度打印最后一列。如何修复? 这是打印输出的简短代码片段: 打印(dfy) 打印(dfy.dtypes) 与PD。
如何将一个 csv 文件中的数据准确映射到另一个 csv 文件
有两个csv文件,其中包含两个相似的数据,我想以json格式映射和过滤数据 例子 样本数据1 sku_完整 力量 类型 盒 处方 作品 公司 尼扎...
我正在使用 Polars DataFrame,需要使用其他行的值对每一行执行计算。目前,我正在使用map_elements方法,但效率不高。 接下来...
为什么我在 pandas 中使用循环时会收到此 KeyErrores?
当我创建 3 个 keras 模型(针对 3 种不同类型的数据)时,我尝试在我的大数据集中使用这些模型/我使用“Rock”列来选择模型,然后我使用来自另一个 df 的数据(带有一样的长度...
我正在模拟论文的结果,需要在 pandas 数据框的箱线图上显示数据点。对应论文的图片是这样的: 我尝试使用 df.boxplo 绘制箱线图...
R 新手。我想创建一个名为“x”的对象/值,它是数据帧 df 中所有观察值的计数。 这是我的代码: x <- df %>% 计数() 然而,这会导致 'x' 成为