pandas 相关问题

Pandas是一个用于数据处理和分析的Python库，例如统计数据，实验科学结果，计量经济学或金融学中常见的数据框架，多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

我有以下df，inv_date inv_id 2017-10-01 100117 2018-04-02 040218 2018-05-06 060518其中inv_date是datetime dtype，而inv_id是str;我想转换inv_id ...

python python-3.x pandas dataframe

回答 1 投票 1

从提取正则表达式追加包含重复列的数据帧行

我有一个数据帧如下：我想合并dd2和dd1列，mm1和mm2列yyyy1和yyyy2列等等。如果dd1中有值，则dd2中没有值。有人可以......

python pandas

回答 1 投票 0

python - 在列中读取多种语言的.csv

我正在尝试探索最近发布的Russion调查推文数据库。这里有9个csv文件中的第一个：https：//raw.githubusercontent.com/fivethirtyeight/russian-troll-tweets/master / ...

python pandas csv encoding mojibake

回答 1 投票 0

如何使用python基于Substring将数据从一个工作表导入另一个工作表

我的目标是根据子字符串导入在sheet1中存储为DataFrame df1的数据。我的DataFrame如下所示：df：[2 x 8]订购代码数量PMC11-AA1L1FAVWJA 20 ...

python excel pandas

回答 1 投票 2

Python：如何将ggplot与简单的2列数组一起使用？

我尝试使用ggplot for python我有以下数据：power_data = [[4.13877565e + 04,2.34652000e-01]，[4.13877565e + 04,2.36125000e-01]，[4.13877565e + 04,2.334772000e-01] ]，... [4 ....

python python-2.7 pandas python-ggplot

回答 2 投票 6

python pandas - 按日期和计数分组

我有以下数据框。日期DD / MM / YY日期id 1/5/2017 2:00 PM 100 1/5/2017 3:00 PM 101 2/5/2017 10:00 AM 102 3/5/2017 09:00 AM .. 。

python pandas

回答 1 投票 -3

rbindlist等效R在python中的功能

首先，我根据num_vars的长度创建空列表，并将每个循环的输出存储在一个列表中。之后我想组合所有输出并将其转换为pandas数据帧。 ...

python pandas list concat

回答 1 投票 1

仅当任何字符串的请求在某些值的数据集中出现不止一次时，才保留字符串行

这里有我在熊猫身上的一个例子：名字ID国家无限战争（临时演员）null ES无限战争18236 ES无限战争（临时演员）......

python string pandas

回答 2 投票 2

如何在Python中填充数据透视表中缺少的多个列和行？

是否有任何方法或函数来填充python中的数据透视表缺少多个列和行？从po导入pandas as pd import numpy as np import StringIO csvfile = StringIO（“”“Date; Cat; ...

python pandas dataframe pivot-table

回答 2 投票 2

大熊猫认识到的所有dtypes是什么？

对于熊猫，有人会知道，除了（i）float64，int64（以及像float32，int8等np.number的其他变体）之外的任何数据类型（ii）bool（iii）datetime64，timedelta64如string ...

python python-3.x pandas

回答 2 投票 36

熊猫：了解操作何时影响原始数据帧

我喜欢熊猫并且已经使用它多年并且非常自信我能够很好地处理如何对数据帧进行子集并适当地处理视图与副本（尽管我使用了很多断言......

python pandas views chained-assignment

回答 3 投票 32

获取每行三个最小值并返回相应的列名称

我有两个数据帧，df和df2，它们是通讯员。现在基于第一个数据帧df，我希望在一行中获得3个最小值并返回对应列的名称（在这种情况下像...

python pandas dataframe indexing

回答 3 投票 4

AttributeError：'float'对象在创建生成器对象时没有属性'split'

print（[x [“keywords”]。split（“，”）for i，x in df.iterrows（）if if not isinstance（x [“keywords”]，（int，float））]）print（[x [如果不是isinstance（x [“tags”]，（int，...），则为（i，x）df.iterrows（）中的“标记”。分割（“，”）

python pandas debugging dataframe

回答 1 投票 0

如何只保留列数据框中也包含字符串的数字？

我的数据框中有以下列：Column1 Column2 Column3 Column4 a 1 2 a 1 2 a c b 3 c ...

python string pandas dataframe

回答 1 投票 1

Pybaseball：使用pandas提取排名数据并保存到磁盘

我想要做的是从pybaseball获取此输出，该输出以列表形式设置。 [Tm W L W-L％GB 1 Boston Red Sox 94 44 .681 - 2 New York Yankees 86 51 .628]并将其放入csv文件......

python pandas

回答 1 投票 -2

如何在pandas.read_csv（）之前预处理数据

我有一个稍微损坏的CSV文件，我想在使用pandas.read_csv（）读取之前进行预处理，即对其进行一些搜索/替换。我试图打开文件并在...中进行预处理