我正在尝试计算一大组文本中的双字母组的数量。我已经从标准输入中逐行提取了文本,清理了文本,并由bigrams生成了文本。现在我有一个嵌套的循环,看起来像这样一行一行:
Input:
[['breakfast', 'large'], ['large', 'portions'], ['portions', 'and'], ['friendly', 'staff']]
[['highly', 'recommend'), ['recommend', 'coming'], ['coming', 'here'], ['here', 'excellent'], ['excellent', 'service']]
我想做的是将这些嵌套列表中的每一个都分成一行,这样我就可以使用]打印到标准输出>
print ('%s\t%s' % (list(bigrams), 1))
这将提供一行一行的输出,例如:
Output:
['breakfast', 'large'], 1
['large', 'portions'], 1
['portions', 'and'], 1
我正在尝试计算一大组文本中的双字母组的数量。我已经从标准输入中逐行提取了文本,清理了文本,并由bigrams生成了文本。现在我有一个嵌套循环...
您可以将单个列表项转换为元组,然后比较元组。创建一个以元组为键的字典来维护计数。 Python将元组与内部内容进行比较,因为它们是不可变的。