pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

pandas 中的 groupby 会创建数据的副本还是只是一个视图?

pandas.DataFrame.groupby 是否创建数据的副本或仅创建视图?在(更可能的)不创建副本的情况下,额外的内存开销是多少以及它如何随着ori...

回答 4 投票 0

如何将 dask_cudf 应用函数的输出附加到原始 dask_cudf?

我正在将一个函数(例如字母频率)应用于由一列固定长度的单词组成的 dask_cudf 数据帧。 我正在尝试合并输出或将输出附加到或...

回答 1 投票 0

在 Python 中解析多管道分隔表

我想创建一个函数,使用这个字符串来创建一个表格,即使有中断,它也能正常工作,如下例所示 当一段数据被成对的管道包围时,它......

回答 1 投票 0

将 pandas 系列中具有相同元素但顺序不同的列表合并为一个唯一列表

考虑这个简单的数据框: df = pd.DataFrame({'类别' :[['餐厅', '披萨'], ['披萨', '餐厅'], ['餐厅', '墨西哥']]}) df: 问题是第一个类别...

回答 1 投票 0

从单元格中提取列表并将新行添加到 df

请在下面找到我一直在研究的一个小而简单的 df 示例。 我一直在努力从单元格中删除列表并相应地替换它们。 第 1 列 列2 第 3 列 [一,二] 不是列表...

回答 1 投票 0

如何拆分/切片数据帧列中的值并将它们添加到新列中,后跟字符串?

我有一个数据框,其中包含“年份”列。我正在尝试使用该列的值来创建标题为“Decade”的新列的值,输出为 st...

回答 1 投票 0

使用 np.where 创建元素数量相同但内容不同的列表

我有一个 pandas 数据框,其中的值有时会变为 NA。我想用与另一列长度相同的字符串列表填充此列: 将 pandas 导入为 pd 将 numpy 导入为 np df = pd。

回答 1 投票 0

如何将pyspark daframe保存为jsonl/json文件?

为此问题设计的示例。我有一个 pyspark 数据框,为了方便起见,我对数据进行了硬编码,但我有一堆 csv 文件读入数据框。我可以将数据帧保存为 json ...

回答 1 投票 0

使用“str.contains”方法过滤 pandas 数据框字符串列

我的数据框看起来像这样,其中 long_category 反映了行中的企业类别: df = pd.DataFrame({ 'long_category': {0: '医生、中医、自然疗法/

回答 2 投票 0

Pandas:从多级列索引中删除一个级别?

如果我有一个多级列索引: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) 一个 ---+-- 乙| c -...

回答 8 投票 0

将两个数据帧按元素组合为长格式

我有两个dfs, df1 ARHGEF10L HIF3A RNF17 RNF10 RNF11 NCBP1 南 -0.432931 南 -0.233554 0.165081 NCBP2 0.184332 -0.077655 0.331873 -0.449421 0.153836 RPL37 ...

回答 2 投票 0

熊猫情节线具有不同的线条样式?

我正在使用 ggplot 样式在同一个图上绘制多条线。采用这种风格,线条就变成了全实线。所以能见度不好。我怎样才能改变每一行有不同的...

回答 2 投票 0

为什么 Pandas itertuples 在具有许多(> 100)列的数据帧上比 iterrow 慢?

在不幸的情况下,循环 Pandas 数据帧的行是唯一的方法,通常会提到 itertuples() 优于 iterrows()

回答 1 投票 0

高效读取pandas数据框中的数据并获取一定范围内的平均值

我正在从一些文本文件中读取大量数据并将其保存到数据帧中,以便在稍后处理数据时能够轻松访问列。我感觉我现在的样子

回答 1 投票 0

列出pandas.read_sql中的sql表

我想打开一个SQL 2005数据库(文件扩展名为.mdf),我一直在尝试这样做: 将 pandas 导入为 pd 导入pyodbc 服务器 = '服务器名称' db = '数据库名称' 康恩 =

回答 5 投票 0

Pandas(Excel):如何读取开头为零的完整值?

美好的一天。 我有一个包含两列的 Excel 文件。第一列包含 12 个数字。其中一些有前导零。 我尝试在打开文件时指定“dtype=str”,但是 Pandas ...

回答 3 投票 0

将包含计数数据的 DataFrame 分解/反转为每项一行

上下文:逻辑回归问题的数据转换。我有以下数据结构: df = pd.DataFrame({"group": ["A", "B"], "total": [3, 5],...

回答 1 投票 0

按具有特定名称的列的条件过滤行

我有一个数据框: df = pd.DataFrame({"ID": ["ID1", "ID2", "ID3", “ID4”,“ID5”], &quo...

回答 1 投票 0

用于读取文件的机器学习Python代码

我正在尝试使用机器学习随机森林来解决回归问题。我使用的是 python 3.x,并且我的计算机上已经安装了 numpy、matplotlib 和 pandas 包。 我正在使用电子...

回答 3 投票 0

Pandas/Python 根据旧列和前一行的条件创建新列和行

我正在尝试分析数据框中的一些数据,并确定数据中何时出现空闲时间(显示为平点)。 这些平点是当 disp 值从 > 520 到 ~ 225 时出现的。我...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.