dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

如何显示样式化 DataFrame 中的随机样本?

我经常想查看 DataFrame 中 k 行的随机样本,而不仅仅是头/尾,为此我将使用 df.sample(frac=1.0).iloc[:k]。 当我将 .style 链接到此示例时,样式器...

回答 1 投票 0

在多进程/多处理中切片数据帧是否可以提高性能?

我需要对一些大数据帧的不同切片进行一些计算。 假设我有 3 个大数据框 df1、df2 和 df3。 每个都有一个“日期”列。 我需要对这些进行一些计算

回答 1 投票 0

当“within”时,R 数据帧上的列重复下标

R 版本 4.4.2 (2024-10-31) --“Pile of Leaves”,最新的 Macos $ R --香草 > 加载(文件=“tttdf”) > 字符串(ttt) “data.frame”:3 个 obs。共 17 个变量: $ .mn.r :...

回答 1 投票 0

令人困惑的 R 错误:当“在”内时,R 数据帧上的列出现重复下标

R 版本 4.4.2 (2024-10-31) --“Pile of Leaves”,最新的 Macos $ R --香草 > 加载(文件=“tttdf”) > 字符串(ttt) “data.frame”:3 个 obs。共 17 个变量: $ .mn.r :...

回答 1 投票 0

基于邮政编码的两个数据帧的模糊连接

我正在尝试模糊连接两个数据帧。两者都包含邮政编码列和其他一些列。然而,父数据框中的邮政编码比次要数据框中的邮政编码更多。我会...

回答 1 投票 0

当我尝试将数据帧保存到 csv 文件时,为什么会收到“raise source.error("multiple Repeat", re.error: multiple Repeat atposition 2"?

代码附在下面。它工作正常,直到到达数据库字典中的 ai: df_ai 。 数据 = pd.read_csv('survey_results_public.csv') df_demography = data[['ResponseId', 'MainBranch', '年龄', '

回答 1 投票 0

除 dtypes 之外的 pandas 数据框的相等性

我需要检查两个 DataFrame 是否有些“相等”,但比 pandas.DataFrame.equals 当前实现的更宽松。 我知道 pandas.testing.assert_frames_equal 我真的

回答 1 投票 0

Pandas 数据框通过另外两列条件添加标记列

有一个像这样的数据框: 将 numpy 导入为 np 将 pandas 导入为 pd df = pd.DataFrame({'x':np.arange(1,29),'y':[5.69, 6.03, 6.03, 6.03, 6.03, 6.03, 6.03, 5.38, 5.21, 5.4 , 5.24, 5.4、5....

回答 1 投票 0

将数据框中的每个单元格转换为新数据框中自己的行的最佳方法?

假设我有一个旧数据框,其中包含 A、B 和 C 列。我想要一个新数据框,其中有两列 D 和 E。对于旧数据框中的每个单元格,我想要新数据框中 D 列中的相应行,其中价值...

回答 1 投票 0

从熊猫柱到木瓦的最快方法

我需要尽可能最快的方法来从数据框中拼凑字符串,然后创建一个主列表。 给定以下数据框: 将 pandas 导入为 pd d=['你好','你好世界'] f=pd.DataFrame({'

回答 3 投票 0

无法在 pandas 中使用 dropna 删除 NAN

我将 pandas 导入为 pd 并运行下面的代码并得到以下结果 代码: traindataset = pd.read_csv('/Users/train.csv') 打印traindataset.dtypes 打印训练数据集.shape 打印训练数据...

回答 5 投票 0

如何使用 R DBI 传递 data.frame 进行更新

使用 RODBC,有像 sqlUpdate(channel, dat, ...) 这样的函数允许您传递 dat = data.frame(...) 而不必构造自己的 SQL 字符串。 然而,有了 R 的 DBI,我所看到的一切......

回答 4 投票 0

如何预测 py 数据框边界之外的列表元素?

我基于LSTM建立了一个模型,并训练它来预测一天中的股票价格变化,其中时间单位是一秒。测试数据给出的结果与真实结果相当,但我需要......

回答 1 投票 0

在 R 返回列表而不是数据帧中更广泛地旋转

我在 R 中有一个名为 df 的数据框架: df # 小标题:20 × 2 # 组:Professional_Assistance_Diet、How_successful_diet [9] 瓦尔瓦尔 ...

回答 1 投票 0

Polars Rust 相当于 pl.lit()(df 中的重复值)

在 python 中,我可以构造一个具有重复值的数据框,如下所示: 将极坐标导入为 pl df = pl.DataFrame({"foo": [1,2]}).with_columns(bar=pl.lit("baz")) 这可以在...完成吗

回答 1 投票 0

将数据框中的所有列重命名为小写

给定一个极坐标数据框,我想将所有列重命名为小写版本。根据 Polars.Expr.name.to_lowercase 我们可以做 将极坐标导入为 pl pl.DataFrame([{'CCY': '欧元', '数量': 123}, ...

回答 1 投票 0

使用本地 pyspark 安装读取 XML

当尝试使用 pyspark 读取 XML 时,它在 databricks 上运行良好 - 但在本地安装时失败: Spark.read.format("xml").option("rowTag","result").load("

回答 1 投票 0

从数据框中删除所有值为 NA 的列

我有一个数据框,其中一些列包含 NA 值。 如何删除所有行都包含 NA 值的列?

回答 15 投票 0

为列表中的每个数据创建行 - python

我正在尝试创建一个代码来向我显示一些股票统计数据。为此,我需要迭代 python 中的股票列表,并为每只股票显示一些详细信息。 到目前为止我有这个代码: 进口金融...

回答 1 投票 0

如何使 pandas 数据框列标题全部小写?

我想将 pandas 数据框中的所有列标题设为小写 例子 如果我有: 数据= 国家 国家 isocode 年份 XRAT tcgdp 0 加拿大 CAN 2001 1.54876

回答 7 投票 0

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.