dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

Pandas Series 减去 Pandas Dataframe 奇怪的结果

我想知道为什么 pandas Series 减去 pandas dataframe 会产生如此奇怪的结果。 df = pd.DataFrame(np.arange(10).reshape(2, 5), columns='a-b-c-d-e'.split('-')) df.max(轴=1) - df[['b']] ...

回答 2 投票 0

Pandas DataFrame 中“axis”参数的含义是什么?

以下面的例子为例: >>> df1 = pd.DataFrame({"x":[1, 2, 3, 4, 5], "y":[3,4,5,6,7]}, 索引=['a', 'b', 'c', 'd', 'e']) >>...

回答 5 投票 0

如何优化 Python 代码来分析大型销售数据集?

我正在解决一个问题,我必须处理存储在 CSV 文件中的大量销售交易并总结结果。代码运行速度比预期慢并且花费了太多时间...

回答 1 投票 0

如何使用 tabulate python 包在终端中显示漂亮的表格?

我有一个用 python 编写的简单 CLI 应用程序,带有 argparse 模块。基本上,我使用外部 api 获取一些加密货币数据,将其转换为 pandas 数据框并使用 tabulate 打印...

回答 2 投票 0

从 CSV 文件正确创建带有 pandas 的数据框

我正在使用jupyter笔记本来练习Python技能。我在使用一些 Kaggle 数据集正确创建数据框时遇到一些问题。我无法确切知道该怎么做。 ...

回答 1 投票 0

如何有条件地应用大写?

我想知道当另一列具有特定值时如何使用大写函数。 比如我想更改Master of Degree学生的第一个字母。 # 将 pandas 导入为 pd

回答 1 投票 0

使用python删除Excel电子表格中列名开始之前的空行

电子表格上的列名称从第 2 行开始,第 1 行完全空白。 当我尝试删除它时,它还会删除第 2 行上的列名称,并且只保留第一个列名称。 知道我是什么吗...

回答 1 投票 0

将字典转换为 Spark Dataframe 的 PySpark 代码

我正在尝试将字典转换为 SPARK 数据框。但它将我的所有值附加到一行中。对于我的最终结果,我想要一个 SPARK 数据框,其中包含 3 行对应的 t...

回答 1 投票 0

修改 pandas 数据框的子集也会修改原始数据框

我有 pandas DataFrame,我对其进行迭代以从两列(col_1 和 col_2)获取值。第二列包含列表。我需要做的是,对于 col_1 中的每个值,获取 col 中的值列表...

回答 1 投票 0

如何在 Python 中重塑此 DataFrame?

我有一个Python中的DataFrame df_sale,我想重塑它,计算价格列的总和并添加一个新的列总计。 这是 df_sale 数据框: b_no a_id 价格 c_id 120 24 50...

回答 2 投票 0

长度参数无效

我想将数据帧的所有列转换为数字格式。 我使用 lapply - 像这样: data.frame(lapply(dat, 数字)) 但我从这段代码中得到一个错误: 长度参数无效 然而...

回答 2 投票 0

在 Pandas 中转置多个值列

我有以下 pandas 数据框,我想转置它。 年 CD_PRD VL_JAN VL_FEB VL_MAR VL_APR 2022年 CD76 10000 8000 170000 58000 2022年 CD92 15000 7500 86000 1200 2023年 CD76 8000 ...

回答 1 投票 0

Pandas 系列减去 Pandas Dataframe

我想知道为什么 pandas Series 减去 pandas dataframe 会产生如此奇怪的结果。 df = pd.DataFrame(np.arange(10).reshape(2, 5), columns='a-b-c-d-e'.split('-')) df.max(轴=1) - df[['b']] ...

回答 1 投票 0

使用Python pandas包中的groupby函数时输出结果存在差异的原因是什么?

嗨,我最近在练习使用Python pandas进行数据处理,遇到了与groupby函数相关的问题,这是我的文件和代码: #我的文件 数据 = { '物种': ['...

回答 2 投票 0

KeyError:在 Pandas 中使用 bt 库时出现“Adj Close”

我在使用 bt 库获取股票数据时遇到问题。具体来说,代码失败并出现 KeyError:“Adj Close”。 错误信息 [************************100%************************] .. .

回答 1 投票 0

使用 R 中的 ggplot2 水平匹配两个图的水平

我在 R 中有一个名为 df 的数据框,其中包含 3 个问题的 Likert 数据和一个名为 var 的分组变量: var_levels <- c(LETTERS[1:5]) n = 500 likert_levels = c( "Very \n

回答 1 投票 0

确定圆周长上的哪些点落在其半径上的其他两个点之间

我有一个以原点为中心、半径已知的圆。 半径 <- 1 Horizontal_Coordinates <- seq(-Radius, Radius, 0.01) Positive_Vertical_Coordinates <- sqrt((Radius ^ 2) - (

回答 1 投票 0

我可以应用哪个 dplyr 的 *_join 函数来不返回 NA?

我正在尝试将两个不同的数据帧合并在一起,以便第二个数据帧中的预测变量的值现在附加到第一个数据中的平均变量的值...

回答 1 投票 0

如果列没有标题,如何引用 R 数据框中的变量名称?

我正在使用 R 中的 closeZeroVar 函数来识别分析数据集中的零方差变量。 我的代码示例: 火车1_nzv_y0 <- nearZeroVar(train1[train1$y=="no",], saveMet...

回答 1 投票 0

ggplot2 `geom_label()`中的警告消息

我在 R 中有一个数据框,经过一些数据转换、计算和绘图后: 图书馆(tidyverse) 库(ggstats) 图书馆(拼凑而成) 图书馆(小标题) 图书馆(tidyverse) 库(ggplot2)

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.