dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

创建具有特定长度的数据帧

如何使用1000长度的pandas创建新数据框并使用for循环分配值。我试过这种方式。但它不起作用。 f = {'ID':[],'CSE':[],'课程名称':[]} ff = pd.DataFrame(...

回答 1 投票 2

如何在pandas中的数据框中存储数据

我有一个时间序列数据,比如机器读数如下(Say)df ['machine_r'] = [1,2,1,5,3,4,5,1,2,3,4,5,7,8 ,1,2 .....如何更改数据框如下如果数据框中的数据<= 25 ...

回答 1 投票 1

结合两列pandas数据帧

我有15个csv文件,其中一列代表年份。问题是year列在某些文件中被命名为'year'而在另一个文件中被命名为'year_'。所以我有两个相同的列......

回答 3 投票 2

在Python中填充部分数据的过去和未来数据

我已经从198x到2016年的数据累积总和,现在形式为:州年月值TN 1987 1 24410.0 TN 1987 2 24410.0 TN 1987 ...

回答 2 投票 0

如果匹配,如何合并两个数据帧并从新列中的另一列返回数据?

我有两个看起来像这样的df:df1:id 1 2 df2:id值2 a 3 b如果有一个......我如何合并这两个数据帧并仅返回新列中值列的数据...

回答 5 投票 0

在DataFrame中嵌套groupby并聚合多个列

我试图按如下方式进行嵌套groupby:>>> df1 = pd.DataFrame({'Date':{0:'2016-10-11',1:'2016-10-11',2:'2016- 10-11',3:'2016-10-11',4:'2016-10-11',5:'2016-10-12'},'股票':{...

回答 2 投票 -1

R - 文档术语矩阵,以逗号分隔的文本列条目

我有一个数据框,其中包含一个由字符串(project_skills)组成的列,表示某个作业(job_id)提供的技能。我想为每个作业拆分这个字符串,以获得...的向量

回答 2 投票 0

将多个列添加到数据框并跳过空值

我有一个这样的数据帧:s = {'B1':['1C','3A','41A'],'B2':['','1A','28A'],'B3':[ '','','3A'],'B1_m':['2','2','2'],'B2_m':['2','4','2'],'B3_m' :['2','2','4'],'E':['0','0','0']} s ...

回答 2 投票 0

如何使用日期作为过滤器

我对R和脚本编程的了解几乎不存在。所以我希望你能对这个基本问题保持耐心。 library(lubridate)date.depature

回答 3 投票 1

使用带有块的pandas读取大json数据集

我想读一个6gb大小的json(我还有1.5gb的另一个),我试着用pandas正常阅读(只用pd.read_json),显然内存已经死了。然后,我尝试使用chunksize param,如:...

回答 1 投票 0

在R中为一个工作表制作多个类别的单独直方图

我有一个数据集,其中包含多种类型的池塘数据研究类型。整个类别的列按每种类型组织,其中包含以下各个值。我可以为...做直方图

回答 1 投票 0

什么是更快,更Pythonic的方式来读取CSV并从中创建数据框?

输入:包含50,000行的CSV;每行包含910列值0/1。输出:运行CNN的数据帧。我写了一行代码逐行读取CSV。对于每一行,我分割数据......

回答 2 投票 1

识别电话号码,然后匹配国家/地区代码,然后在列中指定正确的名称

我有一个数据框“CDR”(呼叫详细记录),电话号码的前5位数字和另一个名为“CC”的数据框,包含国家代码和国家/地区名称。电话号码

回答 1 投票 -2

对几个文本文件进行计算并从中创建数据帧R

我正在尝试从我正在进行的计算中创建一个表到几个文本文件。我认为这可能需要某种循环,但我仍然坚持如何继续。我试过不同的循环,但......

回答 2 投票 0

如果另一个Dataframe值小于0,则替换R数据框中的值

我在r中有两个具有相同大小的数据帧。我想要做的是删除第一个数据帧的值,如果第二个数据帧的值小于零,例如,如果killer_stock数据帧...

回答 1 投票 2

Python:平衡数据集以进行回归分析(重新排列数据集并填充空白类别)

我有一个数据集(df2),如下所示:total_n ind_n4 year city_code 9 2003 a 236 2004 a 520 54 2002 ...

回答 1 投票 1

如何有选择地删除重复? [关闭]

我在这里有这个datafame图像并执行此代码:unique_records_for_cols = terceros_prepared3_df.drop_duplicates(subset = ['id'])这里删除了重复项图像但是......

回答 1 投票 -1

检查pandas [duplicate]中的dataframe列中是否包含某个值

我试图检查python列中是否包含某个值。我正在使用df.date.isin(['07311954']),我不怀疑它是一个很好的工具。问题是我有超过350K的行和......

回答 3 投票 15

数据框字符串拆分为列而不是行[重复]

我有这种格式的数据框:df

回答 1 投票 0

如何在pandas数据框中移动列

我想把一个索引为'length'的列,并将其作为我的第二列。它目前作为第5列存在。我试过了:colnames = big_df.columns.tolist()#make index“length”第二列......

回答 1 投票 3

© www.soinside.com 2019 - 2024. All rights reserved.