dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

使用单热编码处理sklearn中的分类变量

有人可以帮助任何现有的Python类用于sklearn的分类编码器,勾选以下复选框吗? pandas friendly - 返回数据帧的选项应该能够删除1列...

回答 1 投票 0

如何获得与R一样的Pandas数据帧的类似摘要?

不同的尺度允许不同类型的操作。我想指定数据帧df中列的比例。然后,df.describe()应该考虑到这一点。示例名义规模:A ......

回答 2 投票 5

python pandas:不区分大小写的drop column

我有一个df,我想按标签删除一列,但不区分大小写。注意:我不想改变我的df中的任何内容,所以我想避免'str.lower'。继承人我的df:打印df姓名......

回答 1 投票 2

从不在任何其他数字之前或之后的pandas字符串列中提取最多N位数

python python-3.x pandas我对这个混合的String数据感到头疼。我在数据中有一个带有混合字母数字,文本,数字字符和长整数的数据。你能指导我...

回答 1 投票 0

需要聪明的循环 - 对DateTime列进行排序并测量拥挤度

我想评估每小时的ER人口。定义如下:人群(小时= x)=未出院的人(小时= x-1)+加入的人(小时= x) - 出院的人(小时= x)......

回答 1 投票 0

如何用我的.apply()函数中的新列解决一个讨厌的语法错误

我正在尝试重新分类一系列字符串,这些字符串代表应用程序下载的次数,因为它没有显示下载的原始数量。我必须将20个字符串组成7个...

回答 2 投票 0

绘制具有已知值和有限值的数组特征的直方图

我的数据框中一个名为“宠物”的列基本上是宠物列表的一个特征:[“dog”] [“dog”,“cat”] [“cat”,“parrot”] [“dog”,“cat”,“鱼“]可能的宠物:[”狗“,”猫“,”鹦鹉“,”鱼“] ......

回答 1 投票 2

在数据框中添加两个元素(基于索引)

我有一个数据帧,其中一些行除了一个变量外没用。我想将那些行中的变量添加到上一行,然后删除无用的行。在那里的数据框架......

回答 1 投票 1

在Pandas DataFrame中返回包含字符串的第一个单元格 - 最有效的方法?

寻找一种有效的方法来搜索大型DataFrame并返回包含字符串的单元格的行号。我有下面的代码,但只是想知道这是否是最有效的...

回答 2 投票 0

如何同时按名称或标准偏差选择列?

解决方案我选择了@thelatemail提供的解决方案,因为我试图坚持使用tidyverse,因此dplyr - 我还是R的新手,所以我采取了小步骤并利用帮助...

回答 2 投票 3

在dataframe列值/字符串中搜索和计算单词出现次数

我正在使用我的Spark / Scala数据应用程序中的数据框,其中数据框中的一列具有巨大的字符串值,有或没有空格(两种情况都是可能的),以及......

回答 1 投票 0

数据框值获取整数值而不是文本

这是我的数据:require(HH)数据(ProfChal)rowsCount = length(ProfChal $ Question)ProfChal $ NEW = character(rowsCount)它看起来像这样:当我运行这个循环时:for(r in 1:rowsCount){ProfChal [R,...

回答 1 投票 0

如何在R中创建列表的复杂层次结构

我已收到有关如何在列表中创建一组列表的帮助,但是我无法添加另一层/扩展列表的深度。我想要的只是在每个列表中添加一个最终的“图层”,...

回答 1 投票 1

比较字典与不可用或不可比的值? (例如列表或数据帧)

TL; DR:你如何比较两个python词典,如果它们中的一些具有不可变/可变的值(例如列表或pandas Dataframes)?我必须比较字典对的相等性。在那里面 ...

回答 2 投票 0

如何让df.loc只返回数据帧的特定单元格中的值(数字)?

我正在研究大学篮球队拿2和3的频率数据。我计划将他们取3的频率乘以3,并将其加到他们采取的频率上......

回答 1 投票 1

获取具有特定数量的重复值的行

在R中,我有一个大型数据框,其中前两列是主ID(对象)和辅助ID(对象的元素)。我想创建这个数据帧的子集,条件是......

回答 1 投票 0

删除pandas dataframe index中的字符范围

我有一个数据框列中的文本项列表,其中一些在结尾包含整数,一些包含括号“(额外信息)”之间的信息。其余项目只是平面文字。一世 ...

回答 1 投票 0

如何根据多列的值拆分数据框

我正在使用Python。我想根据两列的值拆分我的数据帧。每次值对更改时,我都希望将数据帧拆分到此位置。示例:df = pd.DataFrame({'...

回答 1 投票 1

如何在同一行名称中逐列插入空行的值,然后将插值数据复制到原始DataFrame?

我有一个电子表格,提供2019年世界幸福报告的统计数据,后来将用于可视化和线性回归问题(这是一个小组项目,我的部分是...

回答 1 投票 1

将json格式数据转换为dataframe

我有这个数据字典:data = {'timestamp':1555063200000,'exchange':'NSE_FO','symbol':'NIFTY19APR11600CE','ltp':152.75,'close':151.4}可以请指导我转换词典 ...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.