带有Camelot 0.7.3。的Python 3.7。当前,Camelot导出转换后的文件,并在文件名后附加'page--table--我们对应用程序有非常特定的文件名要求,而我正在尝试导出文件而不附加任何额外的字符串到文件名。这可能吗?该文档未提及任何解决方法。
文档未提及如何解决此问题。
我不确定您的意思。 https://camelot-py.readthedocs.io/en/master/说:
此处介绍了如何从PDF文件提取表格。查看PDF在此示例中使用。
>>> import camelot >>> tables = camelot.read_pdf('foo.pdf') >>> tables <TableList n=1> >>> tables.export('foo.csv', f='csv', compress=True) # json, excel, html
使用tables.export
将PDF中的所有表导出到单独的文件,并需要通过文件名来区分它们。
如果只需要导出特定的表,请使用页面下方的示例:
>>> tables[0].to_csv('foo.csv') # to_json, to_excel, to_html
如pandas.DataFrame.to_csv
所示,这会将文件名原封不动地传递给https://github.com/camelot-dev/camelot/blob/master/camelot/core.py#L571。>