我有一个
data.txt
文件,我想将其转换为 data.json
文件并打印漂亮的前 2 个条目(data.txt
包含 3 个唯一 ID)。
data.txt
可以在这里公开找到(这是一个示例 - 原始文件包含 10000 个独特的"linkedin_internal_id
)。
我尝试了以下方法:
with open("data.txt", "r") as f:
content = f.read()
data = json.dumps(content, indent=3)
此代码不会打印
JSON
的适当 data.txt
格式(它还包括 \\
)。另外,由于文件太大,我的 jupyter notebook
被堆叠起来,为此,我想只打印前 2 个条目。
它被称为 new line delimited
json
其中 每行是一个有效的 JSON 值并且 行分隔符是 '
',你可以像这样逐行读取它,并将其推送到list
,这样以后你就可以很容易地进一步迭代/处理它。请参阅:ldjson
import json
with open("data.txt", "r") as f:
contents = f.read()
data = [json.loads(item) for item in contents.strip().split('\n')]
print(data[0:2])
有这样的事吗?
import json
with open('data.txt', 'r') as f:
data = [json.loads(f.readline()) for i in range(2)]
print(json.dumps(data))
这仅读取并解析数据文件的前两行,而不是加载整个文件然后提取前两项。
您可以在任何文本编辑器中保存 JSON 文本。以下是一些常见选项: 记事本 (Windows):一个简单的内置文本编辑器。 TextEdit (macOS):一个简单的内置文本编辑器。 VS Code(Windows、macOS、Linux):一款功能强大、免费且流行的代码编辑器,也适用于纯文本文件。 Sublime Text(Windows、macOS、Linux):另一种流行且功能强大的文本编辑器。 Atom(Windows、macOS、Linux):免费开源文本编辑器。 只需打开这些编辑器之一,将 JSON 文本粘贴到编辑器窗口中,然后使用以结尾的文件名(例如: )保存文件。在计算机上选择要保存文件的位置。确保将其保存为纯文本文件,而不是富文本文件 (.rtf) 或其他格式的类型,以确保保留 JSON 结构