我在云端硬盘上有200多个文件,主要是文本,doc和pdf。我需要从中提取电子邮件地址到电子表格中。
是否有可以使我的生活更轻松的脚本(Python,PHP?)?>
我在云端硬盘上有200多个文件,主要是文本,doc和pdf。我需要从中提取电子邮件地址到电子表格中。是否有可以使我的生活更轻松的脚本(Python,PHP?)?
不,如果没有大量代码,这似乎不太可能。我个人要做的是打开google docs中的每个文件,搜索@
,然后一次复制一个(您需要查找多少电子邮件?)。
对于txt文件,您可以直接使用reges直接读取文件并提取电子邮件,对于docx文件,请使用docx库,对于pdfs,PyPDF2库很好,遍历整个文件并使用正则表达式。我尝试将它们集成到webapp中,请参阅api希望对您有所帮助。