我有一个文本文件,我需要通过python使用Huffman编码进行编码和解码。但是,我需要根据单词来分割字符串,并且我需要保留解码时的间距。但是,如果我使用普通的.split(" ")函数,它就会把双空格当作单空格。我需要将字符串存储为如下图所示。有什么方法可以让我保持双倍的间距吗?
下图是我想实现的
print([ y for x in phrase.split(" ") for y in (x," ") if y != "" ][:-1])
试试这个
>>> import re
>>> phrase = " whatsoever. You may copy it, give it"
>>> result = re.findall('[\s]|[^\s]+', phrase)
[' ', 'whatsoever.', ' ', ' ', 'You', ' ', 'may', ' ', 'copy', ' ', 'it,', ' ', 'give', ' ', 'it']