dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

从每对行的索引数据帧创建二进制矩阵

我有以下索引数据框: 将 pandas 导入为 pd df2 = pd.DataFrame({ 1: [(), (1, 2), (1, 2, 5, 7), (1, 2), (1, 2, 5), (1, 2)], 2: [(), (1, 2), (1, 2, 5, 7), (1, 2), (1, 2, 5), (1, 2...

回答 1 投票 0

pandas to_excel 导出数字不正确

我有一个 Pandas DataFrame,我想将其导出到 Excel。 当使用 pd.to_excel(...) 这样做时,我的浮标出现了轻微的错误。 就像是: df = [0.019,2.117,9.999] excel = [0.0189999011...

回答 1 投票 0

如何使用该行最后一个非空单元格中的值填充数据帧每行中的空单元格?

我有一个包含不完整行的数据框(或数据表,如果更容易的话): ID Var1 Var2 Var3 1 2 5 1 2 12 3 3 8 4 4 空单元格始终位于行的末尾。 我会...

回答 2 投票 0

在 pandas 数据框中保留包含“FAIL”的列和行

我想保留包含单词“FAIL”的列。 输入数据: 价值观1 价值观2 价值观3 状态1 状态2 状态3 1 1 1 经过 经过 失败 2 2 2 经过 经过 经过 3 3 3 经过 经过 经过 4 4 4

回答 2 投票 0

groupby.apply 的弃用警告 - 使用 lambda 和 group 时出现问题

我有一个 python 函数,用于检查“DecId”的每个唯一值的“Name”的唯一值的数量。如果“DecId”有多个“名称”,则“名称”将附加到“DecId”,因此...

回答 2 投票 0

Pandas数据框read_CSV:为什么自动将第一列数据作为索引

我正在使用 pandas 数据框查看传感器数据。我的文本文件没有索引字段。 在此输入图像描述 它以时间数据开始,但是当我使用此代码加载数据时...

回答 1 投票 0

为什么相似的数据框显示两种不同的索引类型?

更新: 1.我已经开始工作了。我为两个数据帧创建了另一个独特的计数器列,然后使用合并而不是连接 terminal_price['counter'] = np.arange(terminal_price.shape[0]) 终点站...

回答 1 投票 0

文本分割后添加 2 个新列

df<-c("Abc1038") df<-strsplit(df, "(?=[A-Za-z])(?<=[0-9])|(?=[0-9])(?<=[A-Za-z])", perl=TRUE) [[1]] [1] "Abc" "1038" From here, I would like to

回答 2 投票 0

将两个不同的数据框相乘 - Python

我有两张桌子: 表1:(销售额) 代码 2025年 2026年 2027年 123 20000 21000 22000 第456章 10000 12000 14000 表 2:(通货膨胀) 代码 2020年 2021年 2022年 2023年 2024年 2025年 2026年 2027年 2028年 123 0.6 0.7 0.8 0.9 ...

回答 1 投票 0

如何计算同一列两行之间的天数?

我有这个数据: 我需要在 python 中创建一个新列,返回任务技术分析的结束日期和不同任务批准的结束日期之间的天数

回答 1 投票 0

如何检查一个数据框中每一列中的字符值是否是另一个数据框中某一列中的子字符串并按列求和?

我有两个具有相同行长度的数据帧(df1 和 df2)。 我想检查 df2 中每一列中的值是否作为子字符串包含在 df1 中每一行的 S 列中,th...

回答 2 投票 0

索引差异在 Pandas 中不起作用

我正在尝试用中位数替换丢失的时间戳数据。 首先,我获取原始数据的索引,然后每小时对数据重新采样以获得所有小时,这将...

回答 1 投票 0

在左侧边距写入txt数据框

我想创建一个像这样的数据框: df_finale = pd.DataFrame({'col0': '#define', 'col1': var, 'col2': ' ', 'col3': var1}) 其中 var 是字符串数据框,var1 是用

回答 1 投票 0

将Dafaframe中的元组分成多行

我有一个数据框,其中有两列(客户、交易)。 Transactions 列是该客户的所有交易 ID 的元组。 客户交易 1(甲、乙、丙) 2 ...

回答 3 投票 0

pandas:从一个 csv 读取多个数据帧

我有一个 csv 文件,如下所示: A 栏、B 栏 1, 5 2,7 78,65 ########### 5,8 15,23 ########### 17, 15 25,62 12,15 95,56 如何将其转换为一组数据帧,一个数据帧对应于...之间的每个区域

回答 1 投票 0

pandas.read_csv 忽略字符串的引用

我在将 csv 文件读取/导入到 pandas 数据框中时遇到一些问题。导入不会跳过引号中的逗号。 我尝试过不同的 quotechar 选项,但没有......

回答 1 投票 0

需要在 PySpark 或数据场上运行递归 SQL 查询以实现以下场景

这是开发中的一个例子: 设备 1 将设备 3 作为父设备。 设备 3 将设备 53 作为父设备。 设备 53 没有父设备。 在黄金资产表中,您将看到以下 3 条记录...

回答 1 投票 0

使用参数化名称创建数据框

我有一个像这样的数据框: df 名称值 0 至 10 1个5 2b 4 3b 8 我想使用“名称”功能创建过滤数据集。就像是: 对于 ['a', 'b'] 中的 i: df_{i}...

回答 1 投票 0

如何读取多个 CSV 文件并将它们放入单独的 Pandas 数据框中?

我正在尝试循环遍历包含多个 CSV 文件的目录并将它们读入(单独的)pandas 数据帧。 我尝试了多种方法,但我无法做到这一点。不过我还是设法阅读了...

回答 4 投票 0

Python 数据框:动态数据框和列名称

我有以下源数据框: 数据 = { “类别”:[“A”,“A”,“B”,“C”,“C”], “值”:[16,10,8,8.3,17] } df = pd。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.