dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

为包含'。'的行切片数据帧用熊猫

这可能是一个愚蠢的问题,但它现在让我疯狂了一段时间。我试图将我的数据帧切片为包含'。'的行。在一个特定的专栏中。它适用于其他条件,但......

回答 1 投票 2

如何使用regex_replace替换pyspark数据帧中列的特殊字符

数据框中有一个列批处理。它有'9%','$ 5'等值。我需要使用regex_replace,它会从上面的例子中删除特殊字符,只保留数字......

回答 3 投票 0

将Pyspark Dataframe列从数组转换为新列

我有一个具有这种结构的Pyspark Dataframe:root | - Id:string(nullable = true)| - Q:array(nullable = true)| | - element:struct(containsNull = true)| | | - pr:string(...

回答 2 投票 3

R:制作分组变量和频率的数据矩阵[重复]

我有一个数据框,有三个类别,学生成绩(成绩),学生报告的1-5值,任务是多么容易(水平),报告每个1-5值的学生百分比(...

回答 2 投票 0

Python Pandas DataFrame read_csv UnicodeDecodeError

我有一个129 MB的CSV文件,包含849,275行和18列。我正在尝试使用read_csv将CSV文件读入pandas DataFrame。当我使用encoding ='cp1252'时:read_file = pd.read_csv('myfile.csv',...

回答 1 投票 4

根据条件将数据帧中的值替换为0和1

我想过滤和替换。对于低于或高于零但不是NaN的列,我想设置为一个,其他设置为零。 mask =((ts [x]> 0)|(ts [x] ...

回答 2 投票 1

基于另一个数据框在Pandas中创建新列

我需要根据第二个数据帧的属性向现有的pandas数据帧添加一列。我做了一个最小的例子来说明我的确切要求。我有两个数据帧,一个......

回答 2 投票 2

如何在pandas中将多个相同类别的行组合成一个?

我试图从图1到表2从图像中获取,但我似乎无法做到正确。我尝试使用数据透视表将col A - D从行更改为cols。然后我尝试groupby,但它没有给我一行......

回答 2 投票 2

自定义函数 - > dataframe - > reactive - > plot - > ERROR(零长度输入不能与非零长度的输入混合)

我在R编码一个闪亮的应用程序时遇到问题。当我在不使用闪亮的单独脚本中运行该函数时,如果单独添加绘图和数据框输出,则获取绘图。对不起,首字母缩略词和......

回答 1 投票 0

PySpark DataFrame的逐行聚合

我有一个Pyspark DataFrame,我想使用一个逐行操作的函数进行聚合。我有4列,对于A列中的每个唯一值,我必须进行逐行聚合...

回答 1 投票 0

添加额外操作时,'str'和'float'实例之间不支持TypeError:'>'

我是Python for Machine Learning中的数据预处理新手。我正在尝试预处理一些数据。数据由许多分类变量组成,其中包含一些空和NaN条目。我正在填...

回答 1 投票 0

Python DataFrame:将所选值替换或组合到主DataFrame中

我有两个pandas DataFrame,如下所示。它包含字符串和np.nan值。 df = A B C D E F 0 aaa abx fwe dcs NaN gsx 1 bbb daf dxs fsx NaN ewe 2 ccc NaN NaN NaN ...

回答 2 投票 1

如何使用我自己的方法和函数扩展pandas的Dataframe类

第一个问题:我正在使用pandas的DataFrames,我经常运行相同的例程作为数据预处理和其他事情的一部分。我想写一些这些例程作为方法......

回答 2 投票 1

python pandas:通过滚动另一个Dataframe的索引来获取一个Dataframe的滚动值

我有两个数据帧:一个具有多级列,另一个只有单级列(这是第一个数据帧的第一级,或者说第二个数据帧是通过分组计算的...

回答 1 投票 2

在数据框中添加缺失的索引

嗨我有一个凌乱的数据框如下:df

回答 2 投票 1

保持当前值,直到出现非空值[重复]

嗨,我来自SAS的背景,我对R相对较新。我试图将现有的SAS程序转换为等效的R代码我不确定如何实现相当于SAS的“保留”......

回答 1 投票 0

R - 删除数据框列中第二个空格后的所有内容

我在数据框中有一列,其中每个记录都是一个名称列表。例如约翰史密斯,简史密斯,乔史密斯,朱迪史密斯等...我想删除除了整个名字之外的所有内容......

回答 2 投票 0

R dataframe选择每组不同的值列表

我有一个由2列组成的数据框:> head(session_item_pairs)session_id item_id 53 811 111502665618 78 841 111502665618 127 901 111502665618 151 ...

回答 2 投票 -3

Pandas设置依赖于另一个数据帧的元素样式

当我写这个问题时,我想出了一个实现。我已经决定发布它,因为造型相对较新而且还没有那么多问题所以我希望它可以证明......

回答 1 投票 1

如果任何列包含所述行中的某个值,则在Pandas Dataframe中删除一行

如果我们想要删除任何列缺少值的行,我们可以这样做:df.dropna(axis = 0,how ='any',inplace = True)如果我们想删除一个,我们如何做同样的事情任何列的行...

回答 2 投票 4

© www.soinside.com 2019 - 2024. All rights reserved.