dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

无法在 Polars rust 中使用 .col() 方法

我正在尝试在我的 Rust 程序中执行这一行: 让filtered_df = df.filter(col("时间").eq(cursor_date_str)).head(Some(1)); 编译器返回 错误[E0425]:找不到

回答 1 投票 0

循环日期范围并将新值附加到新数据框

我希望在下面的每个日期范围内循环下面日期框架的每一行,检查以下条件并在新数据框架中返回日期范围的当前日期,其中包含我们拥有的所有列...

回答 1 投票 0

python 数据帧按行号切片

所有Python专家, 我是一个 Python 新手,遇到了一个对你来说可能看起来很简单的问题。 假设我有一个 100 行的数据框,如何将其拆分为 5 个子框,每个子框包含

回答 1 投票 0

比较空数据帧

我有一个函数 extract_redundant_values,用于从 pandas 数据框中提取冗余行。 我正在通过在 in_df 上运行来生成 out_df 来测试它。 然后我将其与我的预期进行比较

回答 1 投票 0

有什么方法可以在 Julia DataFrames 中快速收集分类特征吗?

我正在使用 Julia 0.6.3 和 Dataframes.jl 我想知道是否有什么方法可以在 Julia 中轻松获得分类特征? 对于大型数据集,不可能手动输入所有内容。 我的

回答 1 投票 0

将列表转换为一行data.frame

我有一个这样的列表: arg0 <- list(code = "a", n = rep(10, 3)) The number of objects in a list is variable. The objects of the list are vectors -- only one dimensional objects. I want to m...

回答 4 投票 0

R 中一列中的奇怪多列(fromJSON)

库(jsonlite) 测试<-as.dataframe(fromJSON('http://api.worldbank.org/v2/countries/all/indicators/SH.STA.ACSN?format=json')[2]) names(test) However, it looks like there are more columns, su...

回答 1 投票 0

根据另一个数据框将行填充到数据框

我有 2 个数据框,如下所示: 将 pandas 导入为 pd data = {'QuarterYear': ["2023 年第三季度", "2023 年第四季度", "2024 年第一季度", "2024 年第二季度", "2024 年第三季度", "2024 年第四季度&qu...

回答 1 投票 0

样式化 pandas df 中的替代背景颜色也适用于 python pandas 中的 MultiIndex

设置 我有以下 df: 将 pandas 导入为 pd 将 numpy 导入为 np 数组 = [ np.array(["水果", "水果", "水果","蔬菜", "蔬菜",...

回答 1 投票 0

使用 ggplot2 将 R 中附加数据帧的李克特图和纯数据帧的条形图结合起来

我在 R 中有一个名为 df 的数据框: 图书馆(小标题) 图书馆(tidyverse) 库(ggplot2) 库(ggstats) var_levels <- c(LETTERS[1:20]) n = 500 likert_levels = c( "Very \n Dissatisfied&...

回答 1 投票 0

Pyspark 计算时间随着数据的减少而增加

我遇到了一个问题,我必须对每一行数据迭代相同的计算,直到它们收敛。我的思路是在每次迭代后删除收敛的行,这样

回答 1 投票 0

如何设置 pandas 中特定 MultiIndex 值的行中的所有单元格的样式

设置 我有以下 df: 将 pandas 导入为 pd 将 numpy 导入为 np 数组 = [ np.array(["水果", "水果", "水果","蔬菜", "蔬菜",...

回答 1 投票 0

创建一个空模式,其中包含结构体

大家好,我今天有一个小问题,我想在创建空数据框时设置一些内容 如果我收到的 json 字段“数据”为空,我想设置一个空模式 ...

回答 1 投票 0

根据最新日期值选择行来读取 pyspark 数据帧

我有一张如下所示的表格,因为订单号是根据日期重复出现的,我只想读取其中一个最新日期。例如,在 pyspark 上获取 24/03/2022 的 A1 谢谢

回答 1 投票 0

如何从 .csv 文件中提取特定值并将它们自动添加到 R 中预先存在的数据框/tibble 中的特定单元格中?

我想自动从我们的测量设备生成的 .csv 文件中提取特定值到 R 中具有预定义布局的数据框/标题中。测量的名称

回答 1 投票 0

在 Python 上的 R 中执行分类,其中每个数据帧都有标签

我的问题是,我没有让数据框中的每一行对应于一个标签,而是有多个数据框,每个数据框具有相同的列和行数,但每个数据框都标记为 l1,...

回答 2 投票 0

如何清理包含混乱值的年份列?

我正在做一个数据分析课程的项目,我们选择一个数据集,并通过清理和探索数据的步骤,并牢记要回答的问题。 我希望能够...

回答 1 投票 0

Pandas 数据框使用列名称重塑[重复]

我有一个像这样的数据框: >>> DF 类型 A B C D 0 输入 550 350 600 360 1 输出 340 270 420 190 我想把它重塑成这样的形状: AIN AOUT BIN BOUT CIN COUT ...

回答 1 投票 0

Polars 将相同的自定义函数应用于分组依据中的多个列

将自定义函数应用于 Polars 中的多列的最佳方法是什么?具体来说,我需要该函数来引用数据框中的另一列。假设我有以下内容: df = pl.DataFr...

回答 1 投票 0

在 PySpark 中按列删除重复项

我有一个像这样的 PySpark 数据框,但有更多数据: 用户身份 事件日期 123 '2024-01-01 14:45:12.00' 123 '2024-01-02 14:45:12.00' 第456章 '2024-01-01 14:45:12.00' 第456章 '2024-03-01 14:45:1...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.