pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

将一个pandas数据帧列表连接在一起

我有一个Pandas数据帧列表,我想将它们组合成一个Pandas数据帧。我正在使用Python 2.7.10和Pandas 0.16.2我创建了数据框列表:import pandas as pd dfs = ...

回答 3 投票 78

预期字符串或字节类似对象错误

从nltk import word_tokenize,sent_tokenize text = data.loc [:,“text”] tokenizer = word_tokenize((text))print(tokenizer)我试图在...上的特定列上执行word tokenizer

回答 1 投票 0

大熊猫分类变量的百分比计数

我有一个像df_test = pd.DataFrame({'A':'aaab b'.split(),'B'的pandas df:['Y','N','Y','Y','N' ]})和我想要的输出是df_test2 = pd.DataFrame({'A':'a b'.split(),'B':[2 / 3,1 / 2]})如何......

回答 2 投票 0

Python - 在不同的行中按ID显示日期范围

我有一些员工数据,显示他们请求的日期列表,离开emp_id,emp_name,from_date,to_date 101,kevin,2018-12-01,2018-12-05 104,scott,2018-12-02,2018 -12-02我是......

回答 2 投票 1

如何在python中为非数字变量制作直方图

示例数据导入pandas为pd import matplotlib.pyplot为plt dummy = {'id':[1,2,3,4,5],'brand':['MS','Apple','MS','Google ','Apple'],'quarter':['2017Q2','2017Q2','...

回答 3 投票 3

生成此错误:TypeError:'NoneType'对象不可订阅

当我尝试读取文件时,我不断收到此错误。我该如何解决?导入pandas为pd import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import axes3d from ...

回答 1 投票 0

python中的循环列表

我是Python的新手,但试图调用Google Distance Matrix API这就是我的数据框看起来如何将数据加载到数据框数据= pd.read_csv(input_filename,encoding ='utf8')我......

回答 2 投票 0

根据列枚举数据框

我正在处理一个看起来像这样的时间序列数据帧,除了有超过几千行。我想创建一个新列,列出具有相同值'sign'的行块。一世....

回答 2 投票 3

如何使用pandas将csv列作为dtype列表读取?

我有一个包含3列的csv文件,其中第3列的每一行都包含值列表。从下表结构可以看出Col1,Col2,Col3 1,a1,“['Proj1','Proj2']”2,a2,“['Proj3','...

回答 2 投票 18

如何从pandas Series类继承以简化Series类型的子集?

我想创建一个新类,允许我创建受限制的pandas Series对象,这样用户只需要输入开始日期和初始化系列的周期数。我也想要 ...

回答 1 投票 0

Pandas:在多索引数据帧中重新索引和插值

我无法理解pandas reindex。我进行了一系列测量,进入多指数df,我想重新索引和插值这些测量值以使它们与其他测量值对齐...

回答 1 投票 0

使用regex获取DataFrame列中子字符串的位置

我想使用正则表达式将字符串分解为Pandas DataFrame列。样本csv数据[更新]:数据;代码;温度; ...... 12 364 OPR 4 67474 ;; 33; ... 893 73 GDP hdj 747 ;; 34; ...... hr 777 hr9 GDP ;; 30;。 ..

回答 3 投票 0

Pandas数据框图条下降值

在进行数据分析时,我使用pandas Dataframe的df.plot.bar方法来绘制我的结果:df.plot.bar(figsize =(15,5),legend = None)在进行更多研究时我注意到,这些情节...

回答 1 投票 2

使用两个数据框绘制并排条形图

我有2个数据框,其中包含品牌和数量。示例:品牌|伯爵------ + -------古奇| 1234香奈儿| 234444 DF1的品牌多于DF2。我想创建一个条形图,其中x轴...

回答 1 投票 0

Matplotlib小时分钟直方图

jupyter notebook 5.2.2 Python 3.6.4 pandas 0.22.0 matplotlib 2.2.2嗨我正在尝试根据从hadoop检索的小时和分钟日志数据在jupyter笔记本中呈现和格式化直方图...

回答 1 投票 0

ipython笔记本垂直查看宽熊猫数据帧

在Pandas 0.18.1中,假设我有一个类似的数据帧:df = pd.DataFrame(np.random.randn(100,200))df.head()0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 ......

回答 2 投票 1

如何通过用df.mean pandas链接将指数值转换为数字? [重复]

我有一个带有数值的数据框(float64),我已经使用了pandas和链式圆函数的内置(均值,中位数,模式)函数到4位小数,现在结果导致...

回答 1 投票 2

使用seaborn,pandas和datetime错误的每月线图

我正在尝试创建下面的图表,但是将写入的月份作为xticks而不是整数:我的代码目前看起来像这样:plt.figure(figsize =(10,5))sns.lineplot(x =“Month”, Y =” ...

回答 1 投票 0

没有Spark的Kafka到Pandas数据帧

我正在读取kafka主题的流数据,我想将它的一些部分存储在pandas数据帧中。来自confluent_kafka import Consumer,KafkaError c = Consumer({'bootstrap.servers':“## ...

回答 1 投票 0

通过直接索引数据框来选择特定的行和列

d = {'col1':[33,34,35],'col2':[5,6,8],'col3':[7,8,9]} df = pd.DataFrame(data = d)df [['col1','col3']]。head()使用上面的代码,我可以选择col1和col3,但是如果我只想选择第1行和...

回答 4 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.