pandas-profiling 相关问题

由于错误“无法从‘pandas.core.base’导入名称“DataError””，Pandas 分析无法导入

我今天刚刚将Python升级到3.11。 Pandas-profiling 以前工作正常，但现在由于以下错误，我似乎无法导入它：无法从“pandas.core.base”导入名称“DataError”...

Pandas 中 bool 和 boolean Dtype 之间的基本原理是什么？将 pandas 导入为 pd 将 numpy 导入为 np df1 = pd.DataFrame({'col1': [True, False, False]}, dtype='bool') 打印（df1）打印（df1.info（））...

如何从 python pandas 数据帧在雪花中创建表（不使用 sqlalchemy）

有没有一种方法可以仅使用 Snowflake 连接器和 pandas 库从 python 中的 pandas 数据帧创建雪花表？这里的主要目标是只获取 pandas 数据框并使用 ...

Pandas 数据框使用特定列的 interpolate() 分区

我有以下 Pandas 数据框（称为 df）。 +--------+--------+------+--------+ |人 |动物 |年份|数量 | +--------+--------+------+--------+ |约翰 |狗 | 2000 | 2000 2 | |...

有没有办法在 pandas 中使用 usecols 读取必填和可选列？

这是在读取 .csv 文件的情况下。我想要一组 pandas 将读取和解析的“必需”列以及一组 pandas 将提取的“可选”列...

pandas 替换空字符串

替换列中的字符串时，会在每个字符周围添加替换字符串。将 pandas 导入为 pd，将 numpy 导入为 np 将 pandas 导入为 pd，将 numpy 导入为 np data1 = [['符号','上下文'], ...

如何在 pandas 中的特定列索引处插入列？

我可以在 pandas 的特定列索引处插入列吗？将 pandas 导入为 pd df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]}) df['n'] = 0 这会将第 n 列作为...的最后一列

无法在 vscode jupyter 扩展中导入 pandas

正如我提到的，由于某种原因，vscode 中的 jupyter 笔记本扩展不允许我导入 pandas。当我在终端中运行 pip install pandas 时，终端表演然而，在 vscode 中， , 我现在...

使用 python pandas 从 Excel 文件中删除无关数据

我收到了一个 Excel 电子表格，其中包含需要使用 python pandas 进行分析的数据。但是，数据的格式无法直接转换为 pandas 数据帧。传播...

如何在pandas中获取常见的时间间隔

我使用的是pandas版本1.0.5 将 pandas 导入为 pd 数据1 = [ ['2023-12-27','2023-12-27 00:00:00','2023-12-27 02:14:00'], ['2023-12-27','2023-12-27 03:16:00','2023-12-27 04:19:00'], ['20...

Pandas - 使用可变长度滚动窗口聚合值

以下数据框用作输入：将 pandas 导入为 pd 将 numpy 导入为 np json_string = '{"日期时间":{"0":1528955662000,"1":1528959255000,"2":

pandas 系列替换为回填替代品

pandas.Series.replace 的文档包含一个示例： >> 将 pandas 导入为 pd >> s = pd.Series([1, 2, 3, 4, 5]) >> s.replace([1, 2], method='bfill') 0 3 1 3 2 3 ...

将 pandas 数据帧转换为 Spark 数据帧时收到错误

由于spark没有开箱即用的支持读取excel文件，所以我首先将excel文件读入pandas数据帧，然后尝试将pandas数据帧转换为spark数据帧，但我得到了...

Pandas：查找 Excel 文件中的工作表列表

新版本的Pandas使用以下接口加载Excel文件： read_excel('path_to_file.xls', 'Sheet1', index_col=无, na_values=['NA']) 但如果我不知道哪些床单怎么办

多重处理似乎不适用于 df.apply()

我有一个 pandas 数据框，我想在其上对几列应用行操作。返回我需要的 pandas 系列的函数如下所示： def get_info_previous_flight(行,

pandas 重新索引多重索引无法正常工作

我有一个 pandas（版本 1.0.5）DataFrame，具有两个级别的 MultiIndex，例如喜欢： mi = pd.MultiIndex.from_product((('a', 'c'), (5, 12))) np.随机.种子(123) df = pd.DataFrame(data=np.random.ran...

两列之和应根据 Pandas 中的结果得出两列之一

我有这个数据集将 pandas 导入为 pd 数据 = pd.DataFrame({ ‘ID’: [1,2,3,4,5,2,3,1], '借方': [0, 5000, 0, 5000, 3000, 0, 2000, 1000], “信用”：[-100, 0, -700, 0, 0, -8000, ...

Python Pandas ~ != 和 == 之间布尔索引的差异

我对在 != 之后使用 ~ 与仅使用 == 时使用布尔索引的不同结果感到困惑我有一个有 4 列的 pandas df：迪克 = { “一”：[1,1,1,0,0,1,1], “b&...

获取每个组值的列表列表，而无需在 pandas 中旋转表格

我有以下数据框：将 numpy 导入为 np 将 pandas 导入为 pd 数据 = np.random.uniform(0, 1, (4, 5)) df = pd.DataFrame(数据, 列 = [2010,2011,2012,2013,2014]) df = df.stack().reset_ind...

模块“pandas”没有属性“read_csv

将 pandas 导入为 pd df = pd.read_csv('FBI-CRIME11.csv') 打印（df.head（））运行这个简单的代码会出现错误：回溯（最近一次调用最后一次）：文件“C:/Users/Dita/Desktop/python/les...

pandas ta ema 计算不准确

当使用Pandas TA计算EMA时，我发现EMA与交易视图中的EMA不匹配。考虑 EMA 为 200 的任何股票。接下来，以任意金额计算最后一个 EMA...

如何获得 Pandas 系列的 NaN 索引范围？

我在 Pandas 中有一个数据框，其中索引是日期，列是代码，如下所示：我需要识别具有 NaN 值的列，我像这样实现了这部分：

为什么我使用 pandas 读取 csv 文件的对象是 TextFileReader 对象

我使用 pandas 读取了 csv 文件： data_raw = pd.read_csv(文件名, chunksize=chunksize) 打印（data_raw['id']）然后，它报告TypeError：回溯（最近一次调用最后一次）：文件“”，...

Excel条件格式规则Openpyxl或Pandas

我正在尝试使用 openpyxl 或 Pandas 为单元格创建条件格式规则。我要写入Excel文件的规则是：如果单元格的值小于1，则将其格式化为% a...

Pandas - Lambda 内部应用以返回一行

我原本期望在 Pandas DataFrame 中的 apply 中使用 lambda 函数时获得整行，但看起来我得到了一个“单个元素”。看那段代码： # 数据样本评论_2 = pd。

使用 Python Pandas 从 CSV 文件中删除重复记录

我想使用 Python Pandas 从 csv 文件中删除重复记录 CSV 包含具有三个属性scale、minzoom、maxzoom 的记录。我想用 minzoo 得到一个结果数据框...

扩大 pandas 数据框中值之间的距离

如何扩大pandas数据框中值之间的距离？ A 1 3 2 5 3 6 5 5 6 9 我想将相邻元素之间的距离增加x倍，例如两倍。预期输出： ...

使用 pyspark pandas 的自定义聚合

我有一个 pyspark pandas 数据框。我想使用一些预定义函数执行自定义聚合，并为了简单起见使用 numpy.nanmean 我收到以下错误“aggs 必须是一个字典

高效将numpy数组数组转换为pandas系列数组

如何有效地将数组的 numpy 数组转换为数组列表？最终，我想让 pandas 系列数组成为一个列，一个数据框。如果有更好的方法...

将 Fastq 文件直接读取到 Pandas Dataframe 中

我正在尝试将 Fastq 文件直接读入 pandas 数据帧，类似于下面的链接：将 FASTQ 文件读入 Spark 数据帧我到处搜索，但找不到可行的选择。电流...

匹配 pandas 数据框中的嵌套列

我有一个包含 5 列的 pandas 数据框，其中一列是一个列表。如果我只打印列表，我会得到这样的结果：行(a='abc',b='def',c=['qwe','rty']) 行(a='123',b='456',c=['789...

如何防止Pandas将日期时间转换为datetime64

需要我正在尝试将数据帧导出到 Parquet 文件，稍后该文件将在管道中被非 Python 或 Pandas 的内容消耗。（Azure 数据工厂）当我摄取 Parquet 文件时

Pandas 数据帧计算引用前一行

您好，很抱歉再次询问这个问题，但我无法在这个问题的所有以前版本中找到解决方案。我正在尝试矢量化 pandas 计算，其中前一行是...

使用 xlwings 将整张表放入 pandas 数据框

感谢 pandas，我们可以使用“read_excel”函数将整张工作表读取到数据框中。我想使用 xlwings 使用相同的方法。事实上，我的工作簿已经打开并且......

（非常）大的 QVD 文件到 pandas DataFrame

我尝试使用此工具将 QVD 文件加载到 pandas 数据帧，如下面的脚本所示。问题是它工作完美，但没有优化，而且它只提供了一种获取行的方法...

DataFrame 到 XML 的转换：Pandas 中的价格值乘法问题

我在 Python 中使用 pandas 时遇到问题。我有一个脚本，用于接收包含产品详细信息、价格和其他信息的 DataFrame。我的目标是转换这个 DataFr...

使用 Z - Score 方法删除 pandas 数据框中具有异常值的行

我正在使用此代码来删除异常值。将 pandas 导入为 pd 将 numpy 导入为 np 从 scipy 导入统计数据 df = pd.DataFrame(np.random.randn(100, 3)) df[np.abs(stats.zscore(df[0])) < 1.5] This wo...

使用 Grouper 的 pandas 系列日期时间索引中的月份名称

我正在将一年的数据（六月至五月）按月绘制成胡须箱图。我有 pandas 系列的数据：日期 2018-06-01 0.012997 2018-06-02 0.009615 2018-06-03 0.012884 2018-06-04 ...

将 pandas 单元格中的多维 numpy 数组保存到 Excel 中

我想将存储在 Pandas 单元格中的多维 numpy 数组保存到 Excel 文件中。但 Excel 将数组转换为字符串。我的熊猫数据框看起来像这样： df_数据 ...

检查pandas中的日期时间对象是否有时区？

我正在将数据导入 pandas 并希望删除任何时区 - 如果它们存在于数据中。如果数据有时区，则以下代码可以成功运行： col =“我的日期列”...

与pandas有条件合并

我有一个 pandas 数据框，如下所示，其中详细说明了对某个区域的其他调用：通讯日期区域 Day0 增量 Day1 增量 Day2 增量 01/01/24 销售量 43 36 29 01/01/24 服务 85 74 6...

如何选择 pandas Sparse dtype 以及对内存有何影响？

我试图了解如何设置稀疏熊猫矩阵以最大限度地减少内存使用并保留所有值的精度。我在 pandas Sparse 文档中没有找到答案。下面是一个

如何在多索引 pandas 数据框中填充列名称

我的数据框列如下所示： >> df.列输出： MultiIndex([('月份', nan), （“TG”，...

数据框中的pandas迭代列和行，以将组合的输出扫描到列表

我有一个像下面的数据框架

如何在多索引 pandas 数据框中填充列名称

我的数据框列如下所示： >> df.列输出： MultiIndex([('月份', nan), （“TG”，...

删除两组字符串之间的所有字符，第一个是名称对（Python-Pandas）

嗨，我在 pandas 中有一个专栏，其结构如下约翰·多伊黑色的简·无名氏紫色所有相关的不必要的字符串块都以 '\' 开头，紧接着...

用 pandas 在空列表中追加项目

我正在尝试使用 Pandas 创建一个过滤数据框，并将其发送到使用 matplotlib 按条件分割的屏幕，但是当我尝试将项目添加到空列表中时，该列表不会按条件过滤...

如何从 Pandas 数据框中获取操作序列

我有一个 Python 中的 Pandas 数据框，当拉米雷斯进入和离开建筑物时会在其中注册。我还有一个列表，其中记录了建筑物中的所有事件，从打开灯开始......

如何从具有重复项的现有列为 Pandas 数据框设置新索引？

我正在从 MongoDB 数据库获取数据并将其转换为 Pandas 数据框，以便稍后完成其他操作。 MongoDB 数据库包含一堆基于时间的条目和到期...

使用 pandas dataframe 将时间序列中每个日期的行转置为列

我有一系列去年每个到期日和期限的互换时间序列数据 - 我希望使用 pandas 数据框将其转换为每天的简单网格（使用日期作为索引）（

pandas-profiling 相关问题

最新问题