pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

参考字典值[重复]

我有一个数据框,df带有列标题A,B,C,D我可以从这个字典中引用这些标题吗? dic = {'key1':['A','B'],key2:[C,D]} df [key1 [0]]给出A列的输出? ...

回答 1 投票 1

如何将randomforest分类器应用于所有数据集,一次在python中使用一小部分

所以我正在进行一场Kaggle比赛,测试数据集的大小为880,000行。我想在其10,000行部分应用随机森林分类器。但仍然适用于所有......

回答 3 投票 3

如何使用pandas按顺序标记多个类别(多行)?

我有一个pandas数据帧(在python中),我想标记编码两列准备好训练机器学习模型。将其从分类数据转换为数字。 (我不是想......

回答 1 投票 1

在Python中转置和乘以列表

我有2维列表/矩阵,它是动态的N行和M列。特定列中的数据类型是统一的,例如:col1是文本,col2是整数,column3是float等。...

回答 1 投票 3

Pandas:按行数将数据帧拆分为多个数据帧

对熊猫来说还是新手所以请耐心等待...我有一个巨大的csv,有很多行的表。我想简单地将每个数据帧拆分为2,如果它包含超过10行。如果是真的,我想......

回答 8 投票 24

GroupBy在多列上并根据日期列应用移动功能

让我们假设我有这个数据集:Store_id Order_id Date Order_value 1 1 01/01/2018 1 1 4 02/01/2018 0 1 5 02/01/2018 2 1 6 02/01/2018 1 1 8 03/01 / 01 / 2018 2 1 9 ...

回答 2 投票 1

如何在pandas中找到groupby中的总百分比

我在熊猫中有以下数据框日期罐软管数量计数设置流程01-01-2018 1 1 20 100 211 12.32 01-01-2018 1 ...

回答 1 投票 1

在某些条件下计算日期

我正在寻找帮助计算两个或更多相同的代号细胞之间的天数。我需要的是在下面的daysBetween列中显示的内容:代号为dateBetween AAA 20 -...

回答 1 投票 1

pivot_table()到df没有要聚合的数字类型

我有一个df,我试图去反规范化。基本上我想将参数值,例如'inst-cap-c','cap-lo-c'等更改为列。为了做到这一点,迄今为止有两种方法......

回答 1 投票 1

pandas:如何在行匹配查询后获取每n行的组?

假设我有这个pandas数据帧:导入pandas为pd import numpy as np df = pd.DataFrame({'x':np.random.randint(-10,10,size = 100),'y':np.random .randint(-10,10,size = ...

回答 1 投票 1

如何为Keras计算Pandas DataFrame的类权重?

我正在尝试打印(Y)打印(Y.shape)class_weights = compute_class_weight('balanced',np.unique(Y),Y)print(class_weights)...

回答 2 投票 3

将特定信息添加到pandas变形的特定列中

我有两个pandas变量:df1:空DataFrame列:[time_tweet,time_stock,sentiment,trend]索引:[] df2:index like ... user_screen_name情绪...

回答 1 投票 -1

使用colspan = 2的pandas read_html函数

我正在使用pandas read_html函数将html表加载到数据帧中,但它失败了,因为源数据有一个colspan = 2合并的头,导致这个AssertionError:6列......

回答 2 投票 2

从熊猫到xlwings的优秀 - 不要存入指数

范围(“A1”)。value = p.df_sector [[“A”,“B”,“C”]]。排序(列= [“C”],升序=假)。头(4)工作得非常好!但是 - 我不希望/需要查看索引列p.df_sector [[“A”,“B”,“C”]]。sort(columns = ...

回答 2 投票 2

从表中随机选择行 - Python Pandas Read SQL

我必须在给定的日期时间范围内从Post GRE Table中随机选择行。我现在这样做是在日期时间范围内查询表格然后随机选择行。(请参阅......

回答 1 投票 1

在写入Excel时,“解析”一个pandas多索引

我有一个带有多索引的pandas数据帧,默认情况下,当打印到屏幕时,它会“稀疏”输出,以便不重复更高级别的索引。例如:稀疏:我可以改变这个......

回答 2 投票 3

从pandas dataframe列中筛选数值

我有一个如下所示的数据框。我试图从列表中的所有列中仅提取数值,无论它是在任何字符的右侧,左侧还是中间。如果列...

回答 1 投票 2

蟒蛇。在Pandas数据帧中使用Lambda函数的IF条件

df = pd.read_csv('data / eurusd_dukascopy.csv')df.columns = ['timestamp','open','high','low','close','volume'] df ['oc'] = df.close - df.open df ['uptail'] = df ['oc']。apply(lambda x:(df.high - df ....

回答 2 投票 0

如何根据行索引和列名称在两个数据帧之间复用多个值?

我讨厌tapabramase:tb1 1 Google apple soma ibin kaus date 2009-01-14 your last nan 01-01 2009-01-21 nan-150 nan tb2i 2 iGoogle apple ...

回答 2 投票 1

熊猫重命名索引

我有以下数据框,我想将索引从summary重命名为id:summary student count 0 error 6 1是1 2 no 1 3其他9我有......

回答 3 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.