PANDAS 性能:哪个更好

问题描述 投票:0回答:1

好的母羊专家,以下哪种 python pandas 更出色:性能 1)使用Python列表理解

import pandas as pd
df = pd.read_csv('datasets/Admission_Predict.csv', index_col=0)
df.columns = [x.lower().strip() for x in df.columns]
df.head()

2)使用内置的 pandas 数据框功能

df = pd.read_csv('datasets/Admission_Predict.csv', index_col=0)
df = df.rename(mapper=lambda str: str.lower().strip(), axis='columns')
df.head()

谷歌双子座指出: “在大多数情况下,使用 Python 列表理解比使用内置的 pandas DataFrame 功能进行列重命名性能更高。”

我已经尝试过,它们产生相同的结果

python-3.x
1个回答
0
投票

谈论性能,首先我认为我们应该关心它是否可能获得巨大的数量。所以我不认为标题有几列,甚至一千列会是这种情况。
试着这么说,如果我们关心函数如何工作,

df.columns
正在立即写入
columns
属性。但是
df.rename
必须经过几个逻辑和参数输入,那么编写
columns
是众多选择之一。我们可以在rename中读到逻辑。
=>
columns
作业肯定会更快。但如果我们只想重命名几个列并进行转换,我们需要
rename

© www.soinside.com 2019 - 2024. All rights reserved.