我正在循环一个目录,并希望将一个文件夹中的所有文件存储为字典中的列表,其中每个键都是一个文件夹,文件列表是值。
循环中的第一个打印显示了我期望的输出。
但是,第二个打印显示空值。
初始化类之后的第三个打印显示最后一个子文件夹的列表作为每个键的值。
我在忽视或做错了什么?
class FileAndFolderHandling() :
folders_and_files = dict()
def __init__(self) :
self.getSubfolderAndImageFileNames()
def getSubfolderAndImageFileNames(self) :
subfolder = ""
files_in_subfolder = []
for filename in glob.iglob('X:\\Some_Directory\\**\\*.tif', recursive=True) :
if not subfolder == os.path.dirname(filename) and not subfolder == "" :
print(subfolder + " / / " + str(files_in_subfolder))
self.folders_and_files[subfolder] = files_in_subfolder
files_in_subfolder.clear()
print(self.folders_and_files)
subfolder = os.path.dirname(filename) # new subfolder
files_in_subfolder.append(os.path.basename(filename))
folder_content = FileAndFolderHandling()
print(folder_content.folders_and_files)
这听起来像你在追求defaultdict
。
我改编了这样的代码:
import glob, os
from collections import defaultdict
class FileAndFolderHandling() :
folders_and_files = defaultdict(list)
def __init__(self) :
self.getSubfolderAndImageFileNames()
def getSubfolderAndImageFileNames(self) :
for filename in glob.iglob(r'C:\Temp\T\**\*.txt', recursive=True) :
# print(filename)
subfolder = os.path.dirname(filename)
self.folders_and_files[subfolder].append(os.path.basename(filename))
folder_content = FileAndFolderHandling()
print(dict(folder_content.folders_and_files))
Output:
{'C:\\Temp\\T': ['X.txt'], 'C:\\Temp\\T\\X': ['X1.txt', 'X2.txt'], 'C:\\Temp\\T\\X2': ['X1.txt']}
defaultdict(list)
为每个添加的新密钥创建一个新列表。这就是您希望在代码中发生的事情。
看起来你遇到的问题是你实际上总是使用相同的列表。
定义files_in_subfolder = []
会创建一个列表,并在您刚刚定义的变量中指定一个指向该列表的指针。那么当你分配self.folders_and_files[subfolder] = files_in_subfolder
时,你只会在字典中存储指向列表的指针(在每次迭代中都是相同的)而不是实际的列表。
稍后,当您执行files_in_subfolder.clear()
时,您将清除该指针指向的列表,因此清除字典的所有条目(因为它始终是相同的列表)。
为了解决这个问题,我建议您为字典中的每个不同条目创建一个新列表,而不是为每次迭代清除它。这就是将files_in_subfolder
的定义从循环外部移到其内部。
希望能帮助到你!
你正在清理阵列,从我看到...
files_in_subfolder.clear()
删除它并确保在任何清除操作之前将值添加到folders_and_files变量中。