Python:根据csv文件中的条目对文件进行排序的程序

问题描述 投票:1回答:1
import os, unicodecsv as csv
# open and store the csv file
IDs = {}
with open('labels.csv','rb') as csvfile:
    timeReader = csv.reader(csvfile, delimiter = ',')
    # build dictionary with associated IDs
    for row in timeReader:
        IDs[row[0]] = row[1]
# move files
path = 'train/'
tmpPath = 'train2/'
for oldname in os.listdir(path):
    # ignore files in path which aren't in the csv file
    if oldname in IDs:
        try:
            os.rename(os.path.join(path, oldname), os.path.join(tmpPath, IDs[oldname]))
        except:
            print 'File ' + oldname + ' could not be renamed to ' + IDs[oldname] + '!'

我试图根据this csv文件对我的文件进行排序。但该文件包含许多具有相同名称的ID。有没有办法将具有相同名称的文件移动到1个文件夹,或者如果目录中已存在同名文件,则在文件前添加数字?

Example-

id                   name
001232131hja1.jpg     golden_retreiver
0121221122ld.jpg      black_hound
0232113222kl.jpg      golden_retreiver
0213113jjdsh.jpg      alsetian
05hkhdsk1233a.jpg     black_hound

我实际上想将所有具有对应于golden_retreiver的id的文件移动到一个文件夹,依此类推。

python csv
1个回答
1
投票

根据您的描述,这是我的方法:

import csv
import os

SOURCE_ROOT = 'train'
DEST_ROOT = 'train2'

with open('labels.csv') as infile:
    next(infile)  # Skip the header row
    reader = csv.reader(infile)
    seen = set()
    for dogid, breed in reader:
        # Create a new directory if needed
        if breed not in seen:
            os.mkdir(os.path.join(DEST_ROOT, breed))
            seen.add(breed)

        src = os.path.join(SOURCE_ROOT, dogid + '.jpg')
        dest = os.path.join(DEST_ROOT, breed, dogid + '.jpg')

        try:
            os.rename(src, dest)
        except WindowsError as e:
            print e

Notes

  • 对于数据文件中的每一行,我在目的地创建品种目录。我使用set seen来确保我只创建一次目录。
  • 在那之后,将文件移动到位是一个小问题
  • 一个可能的移动错误:源目录中不存在文件。在这种情况下,代码只打印出错误并忽略它。
© www.soinside.com 2019 - 2024. All rights reserved.