pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

熊猫数字格式,带括号的负数

我想采取以下数据帧(df):Team Group1 Group2 Group3 green 1 5 -6 blue -3 10 5 red -7 9 -8并应用此格式...

回答 1 投票 3

无法在Flask应用中编写CSV文件

我在flask上创建了这个简单的应用程序,用户可以上传包含名称的csv文件,它将返回一个新的csv文件,该文件只有那些以S或M开头的名字......

回答 1 投票 1

TypeError尝试标记编码用户输入数据时

我已经使用此代码在python 3中使用此代码编码我的标签来自sklearn.preprocessing import LabelEncoder le = preprocessing.LabelEncoder()dframe [“hair”] = le ....

回答 1 投票 0

如何从字符串中删除十进制后的零删除点后的所有零

我有一个带有对象列的数据框让我们说col1,其值如:1.00,1,0.50,1.54我想要输出如下所示:1,1,5,1.54基本上,小数后删除零...

回答 5 投票 1

pandas使用参数应用函数

我有一个函数需要三个参数。这是标题。 def count_ones(num,total_bits,group_size):我正在尝试将此函数应用于数据列。但它没有回归......

回答 2 投票 1

如何为'where'子句中的项目返回一些默认值,这些项目在数据库表列中不匹配(不存在)

我有一个数据库表航班pkid from_city to_city 1 Melbourne BuenosAires 2 Budapest Tokyo 3 Praslin Anchorage然后我......

回答 2 投票 0

比较所有行的多个特定列

我想比较所有行的特定列,如果它们是唯一的,则将值提取到新列,否则为0.如果示例日期帧如下:A B C D E F 13348 ...

回答 2 投票 0

Python中每个用户的排名

我有一大堆来自移动用户的博客,我需要创建一个名为'hop'的新列。因此,在下面,用户47294872934从印度(0小时)到英国(15小时)。因此,他们的第一个......

回答 1 投票 1

将逗号分隔文件加载到数据框中

我从Scopus得到了一个逗号分隔的csv文件。文件的每一行都有这样的结构:“A,B,C,D”,“1111; 2222; 3333; 4444;”,“A,B,C”,1111,“ABCDE”,“XYZ”,, , “338”, “347” ,,, “11.10000 / 111-2-642-35236-2_34”,...

回答 1 投票 0

从列中获得低,高和平均值

我试图从列中获得低,高和平均值。但是,我只想按列值进行汇总。例如,如果我们有2行具有相同的列值,那么我们聚合这两个...

回答 1 投票 3

使用python将日期时间保持在与数据相关的范围内

我有一个数据集BDate,Snum,ArrTime,OID,TDate,TTime,VID 1/1 / 2018,72,05:59:01,7214,1 / 1/2018,12:06:20 AM,7206 1 / 1 / 2018,72,06:04:33,7208,1 / 1 / 2018,12:36:31 AM,7205 1/1 / 2018,72,06:21:07,7216,1 / 1/2018, 5:...

回答 1 投票 0

将日期列和时间列合并到日期时间

我有两列(两个文本对象),一个日期,另一个小时结束。 df = pd.DataFrame({'Date':['2018-10-01','2018-10-01','2018-10-01'],'Hour_Ending':['1.0','2.0', '3.0']})...

回答 1 投票 0

使用python将带有键和数据帧的dict写入excel表

我有下面的字典,其中包含键作为月份和数据帧。数据和密钥:数据时段Jan'18数据时间Jan'18数据时间Jan'18 ...

回答 1 投票 0

如何在使用“融化”分组的seaborn计数图上获得高于柱的值

我有一个seaborn计数图,但我需要每个条上方的值而不是颜色条。我的输入是pandas数据帧。 ax = sns.countplot(x =“variable”,hue =“value”,data = pd.melt(dfs))这里dfs有......

回答 1 投票 0

Pandas timeseries带有多个标头的数据帧

我正在尝试使用具有多个列标题的时间序列数据创建数据帧,但我是python和pandas的新手。数据框是一小时数据下降和100万服务点....

回答 1 投票 3

Python:合并文件并删除重复项

我有3个excel文件,每个文件有4000行和5列。我希望在数据框中组合excel文件并删除重复的行。随后,我希望将结果发布为excel文件:...

回答 2 投票 0

pandas:如果在循环中遇到条件,则更新值

如果满足条件,我必须更新数据框列。但是有多个条件和多个值要更新。因此我想循环进行。数据框如:mode ...

回答 2 投票 0

创建具有特定长度的数据帧

如何使用1000长度的pandas创建新数据框并使用for循环分配值。我试过这种方式。但它不起作用。 f = {'ID':[],'CSE':[],'课程名称':[]} ff = pd.DataFrame(...

回答 1 投票 2

删除重复的列

如果我使用下面的代码,它将保留具有NaN的列(请参见附图)。我有其他类似的列。是否可以保留第二个而不是第一个? ...

回答 2 投票 0

多列上的交叉表

我有一个名称,日期和位置的数据框。对于每个名称 - 日 - 位置三元组,我想知道具有该名称日的行的比例是多少。在代码中,我开始使用df ...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.