我有一个目录,其中包含超过100k个文件。我需要遍历它们并执行操作。我不想将整个文件列表加载到内存中,而是想同步遍历。用Python实现此目标的最佳方法是什么?
编辑:
此question与我的问题不相似,因为我不想一次将所有文件名都加载到内存中。
这是假设您在名为myDirectory的变量中拥有目录路径作为str对象的方式,这将循环浏览目录中的文件列表>
import os directory = os.fsencode(myDirectory) for file in os.listdir(directory): filename = os.fsdecode(file) # do opperations with filename
或者您可以使用pathlib
from pathlib import Path
pathlist = Path(myDirectory)
for path in pathlist:
filename = str(path)
# Do opperations with filename