dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

Pandas 在字段开头写入 Excel 转义“=”符号

使用Python Pandas,我想将一些内容写入Excel文件:=)一些文本 如何安全地执行此操作而不出现 Excel 错误?我使用以下代码: 将 pandas 导入为 pd df = pd.Dat...

回答 3 投票 0

如何使用不同的时间戳对 pandas 时间序列进行插值

我正在寻找一个功能 pandas_interpolate(df: pd.DataFrame, newTime: pd.DatetimeIndex, 方法: str = '线性') -> pd.DataFrame 这将需要一个带有 DatetimeIndex 的现有数据框...

回答 1 投票 0

Pandas/Python 如何根据与特定行的指定间隔最接近的值将数据插入到列行中

我有一个包含一列日期时间数据的数据框,其中我指定了与每个休息周期的开始和结束之间的中点相对应的行(在单独的状态列中)。 ...

回答 1 投票 0

扩展`polars`中的结构列列表

我有一个 pl.DataFrame,其中有一列是结构条目列表。列表的长度可能不同: pl.DataFrame( { “id”:[1,2,3], “s”:[ ...

回答 1 投票 0

如何在不丢失样式的情况下替换列值?

这是我的样式数据框: 我想要的是将 aEV 的值发送到 aEV_percentile ,但不会丢失样式,或者更具体地说,不会丢失

回答 1 投票 0

包含混合字母数字字符的数据的数据框排序

问题: 尝试对下面的 Excel 数据数据框进行排序(请注意,这是一个多行的小样本集,其信息范围可以从 A#-Z# 后跟 AA# 等,(就像 Excel 工作表如何...

回答 1 投票 0

在 Rust 中使用 Polars 按列值过滤 DataFrame 时出错:预期 &column,找到 &str

我正在使用 Polars 库在 Rust 中处理 CSV 文件,并成功将 CSV 读取到 DataFrame 中。现在,我需要根据“City”co 中的特定值过滤 DataFrame...

回答 1 投票 0

列表列的 Polars arg_unique

如何获取 Polars 数据框中类型列表的列的唯一元素的(第一次出现)索引?我正在寻找类似于 arg_unique 的东西,但这只存在于 pl.Series...

回答 1 投票 0

将数据框列扩展为多个列

具有单列值的数据框如下所示 ------------------------ |价值| |----------------------| |列 1,列 2,列 3,列 4 | | v1,v2,v3,v4 | | v1,...

回答 1 投票 0

查找每个类别组的所有“无”值的列

我有一个与这个虚构的数据集类似的数据集 data = {'category':['foo','foo','foo','foo','foo','bar','bar','bar','bar','bar'],'部分':['101','102','103','104','105','201','202','203','204','205'],'

回答 1 投票 0

如何根据Pandas中的部分列名选择列范围?

我有 pandas 数据框,我正在尝试选择多个列(列范围从 Test 到 Bio Ref)。选择必须从 Test 列开始到名称以 Bio 开头的任何列。是...

回答 2 投票 0

如何在 Pandas Python 中根据部分列名称选择列范围?

我有 pandas 数据框,我正在尝试选择多个列(列范围从 Test 到 Bio Ref)。选择必须从名称测试列开始,到任何名称以...开头的列名称

回答 1 投票 0

过滤至少有 N 行满足掩码条件的组的最佳方法是什么?

这是我的数据框: 将 pandas 导入为 pd df = pd.DataFrame({ 'a': [10, 20, 30, 50, 50, 50, 4, 100], 'b': [30, 3, 200, 25, 24, 31, 29, 2], 'd': 列表('aaabbbcc') }) 预期输出: ...

回答 1 投票 0

正确计算逗号分隔字符串中的元素,以及 R 中的“and”和“and/or”,排除某些情况

我有一个数据框,其中有一列包含多个西班牙语单词。我想要的是计算每行包含的元素总数。我有以下数据框作为示例:

回答 1 投票 0

为什么我的数据没有正确连接?

我在预处理后使用train_test_split分割数据: 从 sklearn.model_selection 导入 train_test_split X_train,X_test,y_train,y_test= train_test_split(X,y,test_size=0.2,random_state=42) ...

回答 1 投票 0

如何将特定列中的 NA 值替换为 0?

我正在处理一个大型数据集,其中有 3 列具有 NA 值,我需要将其中 2 列中的 NA 值替换为 0,但将第三列保留为 NA 以省略第三列中的那些行。 ..

回答 1 投票 0

用数据帧中的非重叠间隔替换重叠间隔

我需要通过消除任何重叠间隔来清理数据帧。数据框通常如下所示: 开始 结束 扬声器 0 0.03 0.33 扬声器_02 1 1.24 6.91 SPEAKER_02...

回答 1 投票 0

创建一个“营业时间”列来指示特定时间戳是否在 pandas 中的营业时间内

我正在尝试根据日期时间索引的值将“Buiness_hour”添加到数据帧中。假设如果某个条目介于 0800 到 1800 之间,则“Business_hour”下的条目将...

回答 1 投票 0

在匹配条件时合并期间如何更新 Python Panda 数据帧中多个指定列的语法

我正在 Snowflake 中构建 StreamLit 应用程序。我最初使用网格编辑器从表中加载数据。用户可以更改某些列中的数据。当用户点击提交按钮时,我...

回答 1 投票 0

将值附加到单个 df 列,而不连接行

我有一个 pandas df,其中每列都有一些数值,后面跟着一些 NaN。列之间的值和 NaN 数量不同。我想在“第一个非 NaN 位置附加一个值...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.