pandas 相关问题

Pandas是一个用于数据处理和分析的Python库，例如统计数据，实验科学结果，计量经济学或金融学中常见的数据框架，多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

使用 pandas 和 pyxlsb 以 xlsb 文件格式（Excel 二进制文件格式）写入输出

我读过很多 stackoverflow 和其他线程，其中提到了如何读取 excel 二进制文件。参考：在 Pandas Python 中读取 XLSB 文件将 pandas 导入为 pd df = pd.read_excel('path_t...

python-3.x pandas xlsb pyxlsb

回答 3 投票 0

从 SQL Server 数据库加载大量数据时出现问题

我当前的问题是从 SQL Server 数据库的大约 5.000.000 行的表中加载大量数据。设置（我无法影响）是： 0 个图形处理器 4000个CPU 15.0G内存我的...

python sql-server pandas sqlalchemy dask

回答 2 投票 0

抓取动态数据表，没有简单的参考

我正在尝试从以下网站的简单表格中获取数据（https://bvmf.bmfbovespa.com.br/clube-de-investimento/clube-de-investimento.aspx?Idioma=pt- br）。我能够获取数据...

python pandas web-scraping beautifulsoup python-requests

回答 2 投票 0

按数据类型和相关列过滤列

我正在尝试按数据类型和 2 个额外的必需列来过滤列。将 pandas 导入为 pd 数据 = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 数据。

python pandas

回答 1 投票 0

Pandas 和 Pyspark 在 Quantile 的实现上有所不同

我在下面的示例中注意到，pandas 和 pyspark 在分位数计算上有所不同。数据 = {“A”：[1,2,3,4,5]} pdf = pd.DataFrame(数据) sdf = Spark.createDataFrame(pdf) 上校...

python pandas pyspark quantile

回答 1 投票 0

使用filter_func更新pandas数据框

我有两个形状相同的数据框，如果满足某些条件，希望用 df2 更新 df1 将 pandas 导入为 pd 从输入导入任何 df1 = pd.DataFrame({"A": [1, 2, 3], "B&

python pandas dataframe

回答 1 投票 0

将spark df中的所有列从十进制转换为浮点数以进行pandas转换

我想创建一个函数来将所有 Spark 数据帧列的数据类型从十进制转换为浮点数。我事先不知道我的列名，也不知道是否以及有多少列是 deci 类型...

python pandas apache-spark databricks

回答 1 投票 0

只有 2 个类，但为什么我收到 ValueError: Target is multiclass butaverage = 'binary'。请选择其他平均设置

我正在尝试在 OneClassSVM 上使用 GridSearchCV 构建员工流失预测模型。我的代码如下：从 sklearn.svm 导入 OneClassSVM 从 sklearn.model_selection 导入 GridSearchCV 来自

python pandas svm gridsearchcv

回答 1 投票 0

基于有条件的第二个数据帧逐行更新/更改值

我有一个像这样的条件数据框，大约有 300 行 pd.DataFrame({"PERSONALNR":["000009461","000009461"],"PERIODE":["202401","...

pandas iterated-function

回答 1 投票 0

无法在 Pandas 中打开受保护的视图 Excel 文件

我正在尝试打开从互联网下载的人口数据 Excel 文件到 Pandas 数据框中。虽然 Excel 文件不受密码保护，但它确实默认为某种 &...

python excel pandas

回答 1 投票 0

属性错误：“连接”对象没有属性“exec_driver_sql”

def request_pickup（连接，request_id）： env_path =connections.loc[0, 'm_drive'] hip_directory = 连接.loc[0, 'hip_directory'] sys.path.append(env_path + '/global_info') 来自 py_varia...

python pandas alteryx

回答 1 投票 0

解析pandas中的路径目录和文件位置直到最后x个路径

我有一个文件路径位置：文件 df = /a/b/c/d/e/f/g/h/i/j/k/l/m/n/a.c /a/b/c/d/e/x/b.c 我正在使用以下逻辑来删除冗余路径 df["文件"]= df["文件"].str.

python pandas dataframe

回答 1 投票 0

从突触将文件写入 Azure Blob 存储会抛出 TASK_WRITE_FAILED

我正在创建一些 parquet 文件，我需要将它们保存到 Azure blob 存储中。对于这个问题，我重新创建了尝试从数据框中写入 csv 文件的错误。我正在处理这个脚本...

pandas pyspark parquet azure-synapse sas-token

回答 1 投票 0

如何按位置切片 pandas DataFrame？

我有一个 Pandas 数据框对象，有 1000 行和 10 列。我只想对数据框进行切片并获取前 10 行。我该怎么做？我一直在尝试使用这个： >&g...

python pandas dataframe slice

回答 6 投票 0

将 pandas 数据帧格式更改为另一种格式？

给定的数据框如下所示：传感器A 传感器B 设备A 设备B 输入A 输入B 机器A 机器B 标志A 标志B 主A 时间...

pandas dataframe indexing group-by influxdb

回答 1 投票 0

提取组 Pandas 数据框中具有最大值的行

这里提出了类似的问题： Python：使用groupby获取组中具有最大值的行但是，即使有多个具有 max 的记录，我也只需要每组一条记录...

python pandas

回答 4 投票 0

从groupby中选择具有最高值的行[重复]

我有一个数据框，其中包含有关用户的一些信息。有一个用户列、类型列和计数列，如下所示：名称类型计数罗伯特 x 123 罗...

python pandas

回答 4 投票 0

如何获取具有所属组最大值的行？ [重复]

我改写我的问题。我正在寻找以下问题的解决方案：我有一个像这样的数据框： Sp Mt 值计数 4 MM2 S4 背景 10 5 MM2 S4 dgd 1 6 MM4 S2 第 2 个 7MM...

python pandas

回答 1 投票 0

如何显示样式化 DataFrame 中的随机样本？

我经常想查看 DataFrame 中 k 行的随机样本，而不仅仅是头/尾，为此我将使用 df.sample(frac=1.0).iloc[:k]。当我将 .style 链接到此示例时，样式器...

pandas dataframe pandas-styles

回答 1 投票 0

使用 Python 的 ScikitLearn 中的管道代码出现错误

在下面的管道代码中，尽管我已经对性别列进行了编码，但我收到了 string to flaot 错误。从 sklearn.compose 导入 ColumnTransformer 从 sklearn.pipeline 导入管道来自

python pandas scikit-learn scikit-learn-pipeline

回答 1 投票 0

pandas 相关问题

最新问题