我想在一个大型 Python 项目中从 Pandas 过渡到 Polars。有没有办法突出显示或查找我在 Visual Studio Code(或其他 IDE,如果需要)中编写的所有 Pandas 命令,以便我可以看到需要编辑的内容?
重构代码库以切换依赖项可能需要比预期更多的时间,并且这通常会随着代码库的大小呈指数级增长。为了确保没有爆炸,请确保您拥有代码功能的可靠文档(例如,通过注释、文档字符串和显示示例输入输出对的测试套件),以便在对代码库进行受控烧录时您知道需要重建什么以及如何重建。此外,确保您的代码库遵循依赖注入/关注点分离的原则也很重要,这样您就可以破坏和重建代码中的一个文件或模块,而不会导致其他所有内容随之崩溃。
要弄清楚代码的哪些部分依赖于 Pandas(或任何其他库),通常可以通过以某种方式删除对该库的访问权限来实现。然后,像 VS Code 这样的 IDE 会突出显示或对具有未定义变量或可预测名称错误的文件进行颜色编码,以及每个文件中检测到使用来自不可用库的变量或方法的特定行。除了使用 IDE 检测由此产生的问题之外,您还可以使用静态类型检查器(如 Mypy)来检测代码中需要 Pandas 对象但现在将接收 Polars 对象的区域。
删除库的访问/使用的一种方法是在文件或整个代码库中进行查找和替换,以删除
import pandas
、import pandas as pd
、from pandas import DataFrame
等的所有实例。如果您想确保您的项目不依赖于某个包——即使是隐式依赖,那么您可以卸载该包(pip uninstall pandas
)。您也可以简单地从用于开发的虚拟环境中卸载它(这可能比从您的计算机中完全删除它更好)。