当我尝试从名为“RC_2015-01”的JSON文件中读取时,我收到解码错误。问题出现在提取的第8行,“for f in row:”。
JSON文件没有其他用户报告的问题,所以我认为这是我的代码的问题。
我使用python 3.7和pycharm作为我的IDE。
我尝试将多个encoding =“example”参数添加到open函数但没有成功。
if __name__ == '__main__':
create_table()
row_counter = 0
paired_rows = 0
with open('RC_{}.bz2'.format(timeframe), buffering=1000) as f:
print(f)
for row in f:
print(row)
row_counter += 1
row = json.loads(row)
parent_id = row['parent_id']
body = format_data(row['body'])
created_utc = row['created_utc']
score = row['score']
comment_id = row['name']
subreddit = row['subreddit']
在您的帮助下,我发现错误是通过尝试直接从压缩文件中读取,一旦解压缩后文件就能够被读取而没有任何问题。