如何为文件名添加字段,以填充从解析的pdf提取的每一行数据的文件名?

问题描述 投票:0回答:1

我正在从目录中解析文件,并将数据编译为csv。我想通过创建一个称为“标签”的列来将每个解析的文件的文件名添加到我的输出中。下面是我当前的工作代码。我只需要添加文件名(标签)。我将不胜感激。

import sys
import os
from pyresparser import ResumeParser
output = 'EMAIL,SKILLS,'
for filename in os.listdir('/Users/NSam/Documents/resume/directory'):
    output += '\n'
    d = ResumeParser('/Users/NSam/Documents/resume/directory/' + filename).get_extracted_data()
    for key, value in d.items():
        if str(key) == 'email':
            output += str(value) + ','
        if str(key) == 'skills':    
            for skillkey in value:
                output += str(skillkey) + ','
sys.stdout.write(output)
with open('/Users/NSam/Documents/resume/directory/output.csv', 'w') as f:
    print('', output, file=f) 
python parsing append
1个回答
0
投票

似乎上面的代码似乎缺少您写入csv文件的部分。我通常喜欢使用标准库DictWriter中的csv写入csv文件。以下是其工作方式的代码片段。测试一下,看看它是否适合您的代码。

© www.soinside.com 2019 - 2024. All rights reserved.