我正在尝试将我从网上删除的 Reddit 评论列表导出到 Excel 文件。文件已创建,但在 Excel 中出现此错误:
“Excel 无法打开文件“test1.xlsx”,因为文件格式或文件扩展名无效。请验证该文件是否已损坏,并且文件扩展名是否与文件格式匹配。”
到目前为止我的代码:
url = "https://www.reddit.com/r/bayarea/comments/17v80j5/do_you_see_yourself_using_the_ca_high_speed_rail/"
submission = reddit.submission(url=url)
posts = []
for top_level_comment in submission.comments:
if isinstance(top_level_comment, MoreComments):
continue
posts.append(top_level_comment.body)
posts = pd.DataFrame(posts,columns=["body"])
indexNames = posts[(posts.body == '[removed]') | (posts.body == '[deleted]')].index
posts.drop(indexNames, inplace=True)
print(posts)
writer = pd.ExcelWriter('test1.xlsx', engine = 'openpyxl')
posts.to_excel(writer, sheet_name='data', index = False)
我应该使用不同的库导出到 Excel 吗?
因为我之前没有使用过reddit scraped,所以我只是尝试了dataframe保存代码。 这是我的尝试:
import pandas as pd
data = {'1': [1, 2, 3, 4, 5],
'2': ['A', 'B', 'C', 'D', 'E'],
'3': [0.1, 0.2, 0.3, 0.4, 0.5]}
posts = pd.DataFrame(data)
print(posts)
writer = pd.ExcelWriter('test1.xlsx', engine = 'openpyxl')
# posts.to_excel('test1.xlsx', sheet_name='data', index = False)
posts.to_excel(writer, sheet_name='data', index = False)
writer.save()
或者您可以使用 posts.to_excel('test1.xlsx',sheet_name='data',index = False) 来就位
writer = pd.ExcelWriter('test1.xlsx', engine = 'openpyxl')
posts.to_excel(writer, sheet_name='data', index = False)
writer.save()
通过阅读你的代码,我认为附加Excel数据不会引起问题,因为你最后只使用了一次to_excel
仅此而已。希望能帮助你。