我目前正在尝试为一个项目创建两个文件,一个用于清理和格式化我的原始数据
cleanfile.py
,其函数clean(df1, df2)
返回一个连接的干净数据帧,另一个文件analysis.ipynb
我可以在其中进行分析数据框。我尝试使用以下
from cleanfile import clean
df = clean(df1, df2)
但是这样做时我收到错误
NameError: name 'pd' is not defined
我的函数
clean
确实涉及到pandas函数。我已在 analysis.ipynb
中将 pandas 作为 pd 导入,并且尝试在 cleanfile.py
中的函数内部和外部导入 pandas。当我简单地在 analysis.ipynb
中的代码单元中定义函数时,clean 函数就可以工作,所以我知道它可以工作,但是该函数大约有 100 行代码,我将在几个不同的项目中使用它们,所以我觉得保留功能代码分开,以便我可以在需要时导入它,这样会更高效、更有条理。
pandas 已导入到
cleanfile
中,但不在当前文件中。
只需添加:
import pandas as pd
不建议使用星号导入
from cleanfile import *
。它污染了命名空间并且不利于可读性。
重新启动内核。我也遇到了同样的问题。