dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

如何读取多个 CSV 文件并将它们放入单独的 Pandas 数据框中?

我正在尝试循环遍历包含多个 CSV 文件的目录并将它们读入(单独的)pandas 数据帧。 我尝试了多种方法,但我无法做到这一点。不过我还是设法阅读了...

回答 4 投票 0

Python 数据框:动态数据框和列名称

我有以下源数据框: 数据 = { “类别”:[“A”,“A”,“B”,“C”,“C”], “值”:[16,10,8,8.3,17] } df = pd。

回答 1 投票 0

如何转储数据框中多列的标签编码器值

如你所见,我这里有一个预处理函数并做了一些转换操作。我有一些分类变量,我将它们定义为 categorical_cols,并为它们使用 LabelEncoder....

回答 1 投票 0

Pandas 问题:“DataFrame”对象没有属性“get_group”

我试图从 pandas 中的分组数据框中获取不同的组,但出现错误。 这是代码: 将 pandas 导入为 pd 表 = pd.read_csv("April24_HD_T2_MMStack_Default_edges...

回答 1 投票 0

我的 Pandas 错误地从 .xlsx 文件读取值

我正在尝试将 .xlsx 文件读入数据帧。 在 Excel 中打开的 .xlsx 如下所示: 标题 1 标题 2 标题 3 苏打 12 4 流行音乐 12 2 可乐 12 3 但是我使用的数据框: df = pd。

回答 2 投票 0

Pandas:将单个索引数据帧中的行转换为多级索引数据帧中的列

我有以下数据框: 月份名称 产品类别 公制 Flipkart Active 4 月 0 日 配件库存数量 NaN 1808.00 4 月 1 日

回答 1 投票 0

pandas 替换命令无法将分类数据更改为数值数据

我正在研究一个玩具数据集(3 列 x 9 行)。每列都有分类值;我想用数值替换它们。我正在使用熊猫。 代码: 实例数据 Q1 ...

回答 1 投票 0

在python中合并多个财务报表,仅通过定位

我在列表上的一个类别内有多个 df 形式的财务报表,我想合并每个类别的所有财务报表,同时保留信息,而不是重复相同的...

回答 1 投票 0

属性错误:“tuple”对象没有属性“to_csv”

我想将清理后的数据集导出到 CSV 中。我收到错误消息: AttributeError Traceback(最近一次调用最后一次) 单元格位于\[57\],第 20 行 18 # 保存干净并

回答 1 投票 0

Spark:未找到参数证据的隐含内容

我在 Scala 上有以下 Spark 代码: def main(args: Array[String]): 单位 = { val Spark = SparkSession.builder.master("local").getOrCreate() 导入spark.implicits._ ...

回答 1 投票 0

如何根据 pandas 中的日期创建新的数据框

我从 CSV 创建了一个数据框,其中的日期以 milis 为单位。我设法把它变成了一次约会,这正是我想要的。然而,当我尝试创建一个具有单独日期的新数据框时,这只母鹿......

回答 1 投票 0

将文本列拆分为具有来自另一个数据帧的特定列名称的不同列

我有两个数据框data1和data2。想要根据 data1 中的列拆分 data2[Text]。但我不明白如何开始解决这个问题;请建议用代码解决。 } 数据1 = {...

回答 1 投票 0

如何读取多个 csv 并将它们放入单独的 Pandas 数据框中?

我正在尝试循环遍历具有多个 CSV 的目录并将它们读入(单独的)pandas 数据帧。 我尝试了几种方法,但我无法做到这一点。不过我确实设法...

回答 2 投票 0

创建数据框行而不单独指定每个列值?

注意:我在这些论坛上找到的唯一关于此问题的帖子是关于 SQL INSERT 语句的,而不是关于 Python DataFrames 的。 背景: 我有一个包含很多列的数据框。到底是怎样的人...

回答 1 投票 0

根据列值的计数过滤 pandas 数据框

我有一个看起来像这样的数据框 - 将 pandas 导入为 pd Sample_df = pd.DataFrame(columns=["A", "B"], data=[[1, "红色"], [2, "蓝色"], [3, "绿色"...

回答 1 投票 0

根据 pandas 数据框中另一列的不同值将列转换为计数

我有一个来自wiki的panads数据框 展望 温度 湿度 风力 播放 晴天热高假无 阳光明媚热高真无 阴热...

回答 1 投票 0

在 R 中组合不同长度的数据帧列

我尝试了cbind和合并,但到目前为止两者都对我不起作用,合并不起作用,因为“realtime_period”列具有不同的日期,并且它合并了我不想要的日期。 我是...

回答 1 投票 0

无法将tapply返回的列表转换为data.frame

我正在使用tapply()进行一些数据操作,它返回一个类似列表的对象。例如: x <- 1:10 y <- rep(c('A', 'B'), each = 5) lst.1 <- tapply(x, y, function(vec) return(vec), simp...

回答 1 投票 0

将函数应用于数据框中的列时出错

我有一个来自 pandas 数据帧的标签列,它有很多差异。我想通过将一些标签放入我选择的另一个标签来缩小范围。 数据应该是这样的(两者都...

回答 1 投票 0

从 pd.dataframe 创建多个饼图/条形图,查找具有最大值和最小值的列

我的数据框看起来像这样,我现在正在寻找适当的分析技术,我希望这里的一些人可以给我一些关于从这个数据框创建图形的建议,或者...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.