dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

熊猫数字格式,带括号的负数

我想采取以下数据帧(df):Team Group1 Group2 Group3 green 1 5 -6 blue -3 10 5 red -7 9 -8并应用此格式...

回答 1 投票 3

如何将数据帧转换为一个热编码

我有一个数据框,其中id可以有多个事件类型> head(eventtype,10)id event_type 1 6597 event_type 11 2 8011 event_type 15 3 2597 event_type 15 4 5022 event_type 15 ...

回答 1 投票 2

比较所有行的多个特定列

我想比较所有行的特定列,如果它们是唯一的,则将值提取到新列,否则为0.如果示例日期帧如下:A B C D E F 13348 ...

回答 2 投票 0

将逗号分隔文件加载到数据框中

我从Scopus得到了一个逗号分隔的csv文件。文件的每一行都有这样的结构:“A,B,C,D”,“1111; 2222; 3333; 4444;”,“A,B,C”,1111,“ABCDE”,“XYZ”,, , “338”, “347” ,,, “11.10000 / 111-2-642-35236-2_34”,...

回答 1 投票 0

使用python将日期时间保持在与数据相关的范围内

我有一个数据集BDate,Snum,ArrTime,OID,TDate,TTime,VID 1/1 / 2018,72,05:59:01,7214,1 / 1/2018,12:06:20 AM,7206 1 / 1 / 2018,72,06:04:33,7208,1 / 1 / 2018,12:36:31 AM,7205 1/1 / 2018,72,06:21:07,7216,1 / 1/2018, 5:...

回答 1 投票 0

Pandas timeseries带有多个标头的数据帧

我正在尝试使用具有多个列标题的时间序列数据创建数据帧,但我是python和pandas的新手。数据框是一小时数据下降和100万服务点....

回答 1 投票 3

回答 2 投票 2

创建具有特定长度的数据帧

如何使用1000长度的pandas创建新数据框并使用for循环分配值。我试过这种方式。但它不起作用。 f = {'ID':[],'CSE':[],'课程名称':[]} ff = pd.DataFrame(...

回答 1 投票 2

如何在pandas中的数据框中存储数据

我有一个时间序列数据,比如机器读数如下(Say)df ['machine_r'] = [1,2,1,5,3,4,5,1,2,3,4,5,7,8 ,1,2 .....如何更改数据框如下如果数据框中的数据<= 25 ...

回答 1 投票 1

结合两列pandas数据帧

我有15个csv文件,其中一列代表年份。问题是year列在某些文件中被命名为'year'而在另一个文件中被命名为'year_'。所以我有两个相同的列......

回答 3 投票 2

在Python中填充部分数据的过去和未来数据

我已经从198x到2016年的数据累积总和,现在形式为:州年月值TN 1987 1 24410.0 TN 1987 2 24410.0 TN 1987 ...

回答 2 投票 0

如果匹配,如何合并两个数据帧并从新列中的另一列返回数据?

我有两个看起来像这样的df:df1:id 1 2 df2:id值2 a 3 b如果有一个......我如何合并这两个数据帧并仅返回新列中值列的数据...

回答 5 投票 0

在DataFrame中嵌套groupby并聚合多个列

我试图按如下方式进行嵌套groupby:>>> df1 = pd.DataFrame({'Date':{0:'2016-10-11',1:'2016-10-11',2:'2016- 10-11',3:'2016-10-11',4:'2016-10-11',5:'2016-10-12'},'股票':{...

回答 2 投票 -1

R - 文档术语矩阵,以逗号分隔的文本列条目

我有一个数据框,其中包含一个由字符串(project_skills)组成的列,表示某个作业(job_id)提供的技能。我想为每个作业拆分这个字符串,以获得...的向量

回答 2 投票 0

将多个列添加到数据框并跳过空值

我有一个这样的数据帧:s = {'B1':['1C','3A','41A'],'B2':['','1A','28A'],'B3':[ '','','3A'],'B1_m':['2','2','2'],'B2_m':['2','4','2'],'B3_m' :['2','2','4'],'E':['0','0','0']} s ...

回答 2 投票 0

如何使用日期作为过滤器

我对R和脚本编程的了解几乎不存在。所以我希望你能对这个基本问题保持耐心。 library(lubridate)date.depature

回答 3 投票 1

使用带有块的pandas读取大json数据集

我想读一个6gb大小的json(我还有1.5gb的另一个),我试着用pandas正常阅读(只用pd.read_json),显然内存已经死了。然后,我尝试使用chunksize param,如:...

回答 1 投票 0

在R中为一个工作表制作多个类别的单独直方图

我有一个数据集,其中包含多种类型的池塘数据研究类型。整个类别的列按每种类型组织,其中包含以下各个值。我可以为...做直方图

回答 1 投票 0

什么是更快,更Pythonic的方式来读取CSV并从中创建数据框?

输入:包含50,000行的CSV;每行包含910列值0/1。输出:运行CNN的数据帧。我写了一行代码逐行读取CSV。对于每一行,我分割数据......

回答 2 投票 1

识别电话号码,然后匹配国家/地区代码,然后在列中指定正确的名称

我有一个数据框“CDR”(呼叫详细记录),电话号码的前5位数字和另一个名为“CC”的数据框,包含国家代码和国家/地区名称。电话号码

回答 1 投票 -2

© www.soinside.com 2019 - 2024. All rights reserved.