pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

Python - 将列值分组到类中

我有一个包含以下数据的CSV:客户年龄A 10 B 53 C 20 D 2 E 55 F 12为此,我使用Pandas库来读取csv。我......

回答 2 投票 2

从其他数据框的查找替换数据框中的列

嗨,我有两个数据框,一个包含: - 国家代码|人口 and another containing:- 国家代码|国家的名字。 I want to do a replace in the ...

回答 2 投票 1

Pandas read_sql_query使用多个AND语句

我想在python pandas中组装一个SQL查询。我尝试了不同的方法,但总是收到以下错误:提供的绑定数量不正确。目前的声明使用......

回答 2 投票 1

设置seaborn lmplot列的个别ylim

我使用以下命令制作了一个lmplot列图(subplot):g = sns.lmplot(x = COX,y ='dX',data = tidy_data,hue ='hue',col ='comp',col_wrap = 8,fit_reg = True,scatter = True,aspect = 1.5,...

回答 1 投票 0

Pandas DataFrame.Apply输出格式

有关python pandas.DataFrame中的apply()方法输出的问题Q1 - 为什么这个函数返回一个pandas.DataFrame,其格式与输入(pandas.DataFrame)相同...

回答 2 投票 2

python pandas从订阅开始日期和持续时间获取活动订阅者数

我有一个pandas数据帧df,每行包含一个start_date(也是索引)和一个持续时间(以天为单位)的订阅。导入pandas为pd df = pd.DataFrame({'start_date':['...

回答 1 投票 1

Pandas groupby两列,包括每组第2列的所有可能值

我确定这是重复但我无法找到它。我有这个数据框:导入pandas为pd df = pd.DataFrame(data = [['Sweden','A',5],['Sweden','A',10],...

回答 1 投票 1

python statsmodels.tsa.seasonal中的值错误

我有这个带有日期时间索引的数据框:ts_log:date price_per_unit 2013-04-04 12.762369 2013-04-05 12.777120 2013-04-06 12.773146 2013-04-07 12.780774 2013-04-08 12.786835我有这个......

回答 1 投票 8

拆分并转换pandas中的字符串列

我正在处理一个软件的输出,该软件在一列中提供坐标作为x,y,z三元组。有没有办法将字符串分成三个独立的部分并转换...

回答 2 投票 3

按条件过滤大熊猫

我有一个数据框示例如下所示。第一行是标题。 a b c d e x 1 10 4 asd y 3 12 5 aqe z 4 14 6 rty t 6 12 4 abd v 7 4 8 yul我想找到......

回答 1 投票 1

在包含列表的Pandas DataFrame列上映射

我正在做一些Textmining,因此我需要在标记化之后将我的文档变形。所以我编写了一个函数,它使用python nlp libary spacy将我的标记化文本列转换为...

回答 1 投票 1

Pandas使用列标题作为值将多个列转换/合并为单个列

我希望将三列组合成一个数据框中的单个列,使用列标题作为新列的值。所有三列的唯一值都为'1',其他两列...

回答 1 投票 1

设置直方图pandas的轴标签

我对此很新,所以可能会有一个非常明显的答案。我很抱歉!我正在通过一个集合绘制两个直方图。我希望我的每个子图都有相同的x和y标签,并且......

回答 1 投票 5

使用df.at时覆盖列值

我写了一个函数,它读入一个csv文件,执行一些计算并将输出写入同一个文件。要将计算值附加到新列,我使用df.at [index,column_name] = value ....

回答 2 投票 1

Python Pandas - 迭代唯一的列

我试图迭代一个独特的列值列表,以创建三个不同的键与字典中的字典。这是我现在的代码:将pandas导入为pd dataDict = {} ...

回答 1 投票 0

如何实现任意数量的分类变量的分层K折叠分裂?

我有一个表格的数据框,df:cat_var_1 cat_var_2 num_var_1 0橙猴34 1香蕉猫56 2橙狗22 3香蕉......

回答 1 投票 9

如何将日期时间序列转换为实际持续时间(小时)?

我有这样的数据框:index = ['2018-02-17 00:30:00','2018-02-17 07:00:00','2018-02-17 13:00:00',' 2018-02-17 19:00:00','2018-02-18 00:00:00','2018-02-18 07:00:00','2018-02-18 10:30:00' ,...

回答 1 投票 1

情节朋友图与熊猫和matplotlib_venn

我想根据我的熊猫数据框绘制维恩图。我知道matplotlib_venn接受集合作为输入。我的数据集包含客户端ID和两个其他列,如果客户端...

回答 2 投票 2

分组数据帧然后在pandas中过滤的最有效方法

下午全部,我有一个非常大的数据集,我已经分组。下面是一个示例:df_ccy = df.groupby(['currency_str','state'['state']。count()。reset_index(name ='count')。sort_values(['count'],...

回答 1 投票 1

如何切割和重塑/融化表格或CSV文件

我有一个CSV文件,其中包含每个变量的最小值和最大值,如下所示:original =“”“min_a max_a min_b max_b 3 5 1 9”“”第一行按变量名称排序,因此保证...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.