pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

dataframe我可以正确提取列表中的纯值吗?

我目前是一名Python自学成才的初学者。对于索引,行在df_price.iterrows()中:prod_weight = prod_weight = prod_data.loc [prod_data ['sku'] == row ['sku']] ['weight'] ....

回答 1 投票 -1

从MultiIndex Pandas数据帧中删除列

我一直在努力理解Pandas的多指标方法。我试图删除“标准”子列,但是徒劳无功。如何才能做到这一点?属性......

回答 2 投票 3

使用Pandas在Python中读取和写入列数据

这项努力是美妙的Mac模型架的变化。到目前为止,我已经管理了自己编写的代码,可以在命令行中读取单个Mac序列号并返回...

回答 2 投票 0

如何在Pandas中处理2列并使用新列名创建新数据框

我想在my_list中计算每个列的共同方差。公式在函数def covariance_formula(...)中:我的代码如下:#!/ usr / bin / python3 import ...

回答 1 投票 1

复杂散景图中CheckboxButtonGroup与Legend之间的交互

我有一个复杂的多变量数据集,其结构与此类似:将pandas导入为pd import numpy as np import datetime as dt from itertools import cycle,islice N = 24 start_date = dt ....

回答 1 投票 1

在Python“html5lib not found”中将html读取到数据框时出错

在尝试读取html数据框时,我遇到了关于html5lib的以下错误。这是代码:!pip install html5lib!pip install lxml!pip install beautifulSoup4 import html5lib ...

回答 1 投票 1

使用seaborn对数据进行分组后的Barplot

我试图使用seaborn.barplot在分组后绘制数据。我的第一种方法是使用以下方法生成新的数据框:g_data = g_frame.groupby([“STG”,“GRP”])[“HRE”]。mean()...

回答 1 投票 0

Pandas:value_counts并使用groupby multiindex进行剪切

使用这样的DataFrame:时间位置1 A 1 A 2 B 4 A 9 A 12 B 12 B 12 B 18 A我可以计算出一段时间内发生的次数......

回答 1 投票 0

pandas:按'日期'删除组中的重复项

我有以下数据框:url ='https://raw.githubusercontent.com/108michael/ms_thesis/master/crsp.dime.mpl.df'df = pd.read_csv(url)df.groupby('date')。 cid.size()日期2005 7 2006 ...

回答 1 投票 6

查找数据框中满足的条件顺序

假设我在pandas.DataFrame中有一组这样的数据:A B C 1 0.96 1.2 0.75 2 0.94 1.3 0.72 3 0.92 1.15 0.68 4 0.90 1.0 0.73 ......我想弄明白......

回答 1 投票 -1

大熊猫在找到平均值时没有按预期工作

当我运行下面的代码时,我得到错误:TypeError:'NoneType'对象没有属性'getitem'import pyarrow import pandas import pyarrow.parquet as pq df = pq.read_table(“...

回答 2 投票 0

XGBoost:功能名称不匹配

我正在努力让我的XGBoost模型从文本中预测文章的参与时间。首先,我得到一个数据帧,表示我从文章中提取的功能,如下所示:...

回答 2 投票 1

Pandas:使用多行格式将包含字符串的数据帧写入xlsx

df = pd.DataFrame(['abc \ n123 \ n232','1 \ n2 \ n3 \ n4 \ n4 \ n5 \ n6'])df.to_csv('text.csv')我想在一个单元格中xlsx(已编辑:非csv):abc 123 232所需的输出是A1单元格仅...

回答 1 投票 3

PySpark数据框显示错误的值

我刚刚从Pandas切换到PySpark数据框,发现在PySpark数据框中打印出相同的列会产生错误的值。这是一个例子:使用熊猫:df_pandas = pd.read_csv(“犯罪......

回答 1 投票 0

Python 3.4 - Pandas - 帮助正确排列数据帧列和删除无效列

这个问题基于Python - Pandas - 根据我之前提到过的分类值,将多列的行组合成数据帧中的单行。我在下面有一张桌子......

回答 1 投票 2

关键字数据帧的Python列解析器

以下链接是我正在尝试解析的数据源示例。 http://www.mediafire.com/file/wfri4idoxszqixs/sampleWordData.xlsx我有一个包含有价值词的列。我想要 ...

回答 1 投票 0

由于unicode解码错误,无法在pandas中打开csv文件

我使用df_to_save.to_csv(save_file_path)将pandas数据帧保存为csv但是当我使用df_temp = pd.read_csv(file_path)读回来时,我收到一条错误消息,说明UnicodeDecodeError:'...

回答 3 投票 2

pandas使用nan值更新特定行

我一直在浏览,但我找不到我的特定问题的答案。我有一个包含数百列和数百行的Dataframe。我想仅为...更改出现的NaN值

回答 1 投票 1

使用Group By子集创建多线图[重复]

我正在使用Pandas和Matplotlib进行可视化。我在创建图表时遇到了麻烦,即使我觉得我拥有了所有需要的信息。来自matplotlib导入...

回答 1 投票 1

Pandas DataFrame.add() - 忽略缺少的列

我有以下两个DataFrames:>>>上面的历史asn国家12345 US 5 4 MX 6 3 54321 MX 4 5 >>>当前......

回答 3 投票 6

© www.soinside.com 2019 - 2024. All rights reserved.