dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

使用str.contains选择包含搜索项列表中所有字符串的数据行的行

我有一个Pandads Dataframe,其中一列('processed')是一个包含一些不同长度的预处理文本的字符串。我想使用任意长度的关键字列表来搜索...

回答 1 投票 1

pandas连接不同列python的数据帧列表

data = pd.concat(a,ignore_index = True,axis = 0)a是具有不同形状和列的数据帧列表,但大多数都是相同的,我想将它连接成一个数据帧但收到错误。 ...

回答 1 投票 0

这是计算移动平均线的有效方法吗?

我有一些{open | high | low | close}市场数据。我想从每行的近似值计算一个简单移动平均线。我已经环顾四周,找不到一个简单的方法来做到这一点。我有 ...

回答 3 投票 1

如何将Array [String]转换为spark Dataframe以保存CSV文件格式? [重复]

我用来解析CSV val的代码ListOfNames = List(“Ramesh”,“Suresh”,“Ganesh”)//动态将添加名称列表val Seperator = ListOfNames.map(x => x.split(“ ,“)// mkString(”,“)......

回答 1 投票 0

而在Python中循环替代

我正在研究一个庞大的数据框,并尝试根据另一列中的条件创建一个新列。现在,我有一个很大的while循环,这个计算需要花费太多时间,是否...

回答 1 投票 2

在数据框中查找重复项,其中一列可以在一个范围内

就找到重复内容而言,我已经弄明白了。我有一个标记为True或False的列,然后我删除一个具有特定值的列。在这一点上,我只需要包括任何东西......

回答 2 投票 0

与桌子断裂的美丽的汤刮表

我正试图将表格刮成数据帧。我的尝试只返回表名,而不是每个区域的行内数据。这就是我到目前为止:从bs4导入BeautifulSoup作为bs4 ......

回答 1 投票 1

在R中循环以查找上一个匹配项

我需要一些帮助来在R中编写一个循环函数。当出现相同的id然后写入OLD_RANK列和NEW_RANK列时,我有一些问题需要选择先前的匹配。 OLD_RANK必须是...的NEW_RANK

回答 1 投票 1

如何将网页刮成与Pandas Dataframe兼容的字典?

来自集合导入来自bs4的defaultdict导入请求导入BeautifulSoup导入csv导入pandas为pd r = requests.get(“http://www.walmart.com/search/?query=marvel&cat_id=4096_530598”)...

回答 2 投票 1

使用mutate_each将R中的一组行除以2

我有一个这样的数据框信件编号1编号2编号3类型A 4 5 3 10 B 10 22 24 20 C 50 24 100 30 D 60 ...

回答 3 投票 1

合并2个变量时,concat不会按照我想要的方式打印它们

目前该计划如下:a1薪资年度2007 2750 2008 2850 2009 2700 2010 2900 2011 3000 2012 3050 2013 3050 2014 3200 2015 3300 2016 3300 ...

回答 2 投票 1

在新值上排序CSV并打印前10行

我试图通过划分两个预先存在的列来创建一个新列,对新列上的csv进行排序,然后打印出新的前10行。这是我到目前为止所拥有的。进口......

回答 2 投票 0

使用R在数据框中对行进行子集和重复

假设我们有以下数据,列名为“id”,“time”和“x”:df

回答 4 投票 4

回答 5 投票 2

在pandas中,我可以同时映射列并将列插入特定索引吗?

在pandas中,是否可以同时映射并将新列插入数据框中的特定索引/位置?我可以使映射工作(从多键字典),成功创建一个...

回答 1 投票 2

更正pandas索引的排序顺序

我有一个如下所示的数据框。我的日期字段是dtype datetime64 [ns]:符号高低日期2018-08-16间谍......

回答 2 投票 1

熊猫:打印'匹配'而不是仅打印布尔结果

我有一个包含文本和子字符串的列。目标是迭代文本,如果有匹配,我想在新列中打印匹配,而不是单独找到真/假......

回答 1 投票 0

将复杂的str更改为在pandas Dataframe中浮动

我有一个数据集,其中包含有关公司资历的数据栏格式:'9年9个月14天',格式为str。我通过正则表达式将它们转换为浮动:...

回答 1 投票 1

如果值是字符串,Pandas DataFrame会执行某些操作

我有一个名为'Amount'列的表。单元格值是诸如1,100和1000的数字的混合,以及诸如'(1000)'和'(999)'的字符串,其表示负值。我怎么样......

回答 1 投票 1

过滤pandas数据帧,其中包含单元格中的数组

我有一个带有'htgt'列的Pandas数据帧,该列由包含数字的数组组成。数组的大小不是恒定的。数据的一个例子:11 [16,69] 12 ...

回答 3 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.