pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

如何在python 3中删除此警告

尝试使用panda降低和删除python 3中的列,但是得到警告 - 这是什么正确的方法,因此这个警告不会出现df [“col1”] = df [[“col1”]]。apply(lambda x:x.str.strip())...

回答 1 投票 0

如何获得日期时间序列的随机数的平均值和总和?

我为2016年的所有工作日创建了一个系列,然后为每个日期分配了随机数:创建了2016年的日期时间指数:df = pd.bdate_range('2016-01-01','2016-12 -...

回答 1 投票 1

如何在TfidfVectorizer.fit_transform()中传递用户定义的函数

我有文本预处理功能,只需删除停用词:def text_preprocessing():df ['text'] = df ['text']。apply(word_tokenize)df ['text'] = df ['text']。申请(lambda x:[...

回答 1 投票 3

如何使用python pandas获得年份之间的差距

我有一个像这样的数据框Series_id F start end data 3 A 2012 2018 [[2012,0],[2014,0],[2015,1],[2017,3],[2019,0],[2020.1 ]]我需要这样的输出{series_id:3,开始:...

回答 1 投票 0

用python中的嵌套结构构建一个带有pandas的数据框

我想用数据集实现机器学习有点过于复杂。我想和大熊猫一起工作,然后在skit-learn中使用一些内置模型。数据外观在JSON文件中给出,...

回答 2 投票 1

Python - 用sudo日期替换缺少的日期

我有一个缺少日期值的数据框,我该如何用9999-01-01 00:00:00替换它们?导入pandas为pd df = pd.read_excel('sample-data.xlsx',converters = {'sample_date':str})d f ['...

回答 2 投票 0

如何存储通过pd.dropna删除的行的行号(df.dropna(axis = 0))

样本数据框如下c1 c2 0 1 2 1 2 4 1 1 3 4 1 4南楠使用df.dropna(axis = 0)函数下降后我希望列出...

回答 3 投票 0

Dask groupby日期表现

给定以下dask数据帧:将numpy作为np导入pandas导入为pd导入dask.dataframe为dd N = int(1e4)df = pd.DataFrame(np.random.randn(N,3),columns = list('abc') ),...

回答 1 投票 1

熊猫:循环列表并从列中的列表中查找单词...使用列表中的找到的单词创建新列

我有一个如下所示的列表:list = ['dog','cat',horse','bird']我有一个下面的示例数据框。我希望我的代码说:如果TEXT在列表中包含一个单词,那么创建一个名为...的新列。

回答 1 投票 0

Python匹配多个条件

我需要匹配两个数据帧之间的多个条件,然后分配一个ID。由于一个标准需要“相似或类似”并且不精确,因为它涉及一个时间,因此这很复杂。

回答 1 投票 0

删除重复的pandas数据帧

我使用drop_duplicates从我的数据帧中删除重复列时收到错误消息。 ValueError:缓冲区的维数错误(预期为1,得到2)下面是最小例子(...

回答 1 投票 2

大熊猫合并两列被视为“集合”

我试图在pandas中找到一种简单的方法来合并行,我们将一组列视为set。例如,A,B是一组。 A B C 0 a b 1 1 b a 3 2 c c 1 3 d a 5所以我想合并= [A,B] ......

回答 1 投票 0

通过在一列中添加不同的数据从一个创建两个数据帧

我是python的新手,并且正在努力解决一个非常基本的概念,所以请耐心等待。请接受我的道歉。 Objetive:我有一个现有的数据帧,我想采用现有的数据帧并创建两个......

回答 2 投票 1

如何使用pandas将hhmmss.ff格式转换为datetime

如何将以下时间格式:hhmmss.ff(如110241.22是11:02:41.22)转换为带有pandas的日期/时间格式?我尝试使用pandas.to_datetime()但它无法进行转换。 ...

回答 1 投票 0

Pandas,Pivot表来自2列,其值为其中一列的计数

我有一个pandas数据帧:+ --------------- + ------------- + | Test_Category | Test_Result | + --------------- + ------------- + | Cat_1 |通过| | Cat_1 | N / A | | Cat_2 ......

回答 2 投票 1

我想解析一个只有我想要的信息的json

是否有任何工具可用于解析.json文件格式

回答 2 投票 -3

加速Pandas DataFrame中的curve_fit

我在列标题中有一个带有独立变量的数据帧,每行都是一组独立的因变量:5.032530 6.972868 8.888268 10.732009 12.879130 16.877655 0 2 ....

回答 2 投票 1

数据框存在/不存在的字典

从2D字典,如何将其转换为数据帧或存在/不存在的矩阵,其中列表中的值是列,键是行名称?累积列表中的值,我......

回答 3 投票 0

Scikit-learn cross val得分:数组的索引太多了

我有来自sklearn.ensemble的以下代码从sklearn.cross_validation导入ExtraTreesClassifier导入cross_val_score #split用于训练和测试的数据集combnum ['is_train'] = np ....

回答 5 投票 23

按列连接两个数据帧

我有2个数据帧。第一个数据帧包含年份数和计数0:年份数0 1890 0 1 1891 0 2 1892 0 3 1893 0 4 1894 0 5 1895 0 6 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.