大家好
我试图理解
Deflate
压缩,但从我所看到的来看,我认为我误解了或做错了什么。
所以我获取了 7zip
的源代码,这样我可能会理解发生了什么,但源代码很难阅读,而且我找不到负责 Deflate
压缩的函数
但这是困扰我的事情。
我有 2 个文本文件。
Test1.txt 有:
”大家好 我试图理解 Deflate 压缩,但从我所看到的情况来看,我认为我误解了或做错了什么。 所以我获取了 7zip 的源代码,这样我可能会明白发生了什么,但源代码很难阅读,而且我找不到负责 Deflate 压缩的函数 但这就是困扰我的事情。”
Test2.txt 有:
”大家好 我试图理解 Deflate 压缩,但从我所看到的情况来看,我认为我误解了或做错了什么。 所以我获取了 7zip 的源代码”
如果我使用
zlib.compress()
import zlib
def deflate_file(input_filename, output_filename):
with open(input_filename, 'rb') as input_file:
data = input_file.read()
compressed_data = zlib.compress(data, zlib.Z_BEST_COMPRESSION)
with open(output_filename, 'wb') as output_file:
output_file.write(compressed_data)
input_file = 'test1.txt'
output_file = 'compressed.deflate'
deflate_file(input_file, output_file)
我明白了

但是用 7zip 压缩文件我得到
50 4B 03 04 14 00 00 00 08 00 72 8C 4C 58 BF BE E6 4C D7 00 00 00 66 01 00 00 09 00 00 00 74 65 73 74 31 2E 74 78 74 6D 50 3B 52 03 31 0C ED 77 66 EF A0 2E 5D 5A 2E 40 01 35 27 F0 AE B5 B6 07 5B F2 C8 72 32 E1 F4 48 09 0C 14 E9 6C E9 7D F5 86 95 01 2F 28 37 26 5C 97 75 79 87 D0 40 E5 56 28 81 32 4C 8A 28 43 03 45 78 C5 A3 06 45 D8 B9 75 C1 31 0A 13 6C 53 E1 10 6E 70 CD 41 A1 40 0E 17 84 81 48 F6 D6 5C E8 F3 77 D6 CA F8 91 62 8E C0 02 D1 FC 60 70 43 87 25 B8 0A 53 3A AF CB 07 1B 23 49 D8 36 8C 10 0C 30 65 77 CB 88 70 18 EB E5 AB 74 1B 1A A6 95 94 F5 7F BC 47 82 61 76 BD 23 B9 A6 87 D3 EC 2E 7F 22 77 80 44 AF 26 18 CC C2 98 C5 56 B3 46 3A 59 97 62 7F E7 1C 93 76 F5 86 D6 B4 33 8D B2 D5 47 82 27 57 58 17 77 CA 28 77 79 CF 71 1A 76 42 9E 5B F5 18 0D CF DF 50 4B 01 02 3F 00 14 00 00 00 08 00 72 8C 4C 58 BF BE E6 4C D7 00 00 00 66 01 00 00 09 00 24 00 00 00 00 00 00 00 20 00 00 00 00 00 00 00 74 65 73 74 31 2E 74 78 74 0A 00 20 00 00 00 00 00 01 00 18 00 2F 80 43 1F C9 5D DA 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 50 4B 05 06 00 00 00 00 01 00 01 00 5B 00 00 00 FE 00 00 00 00 00
问题。
zlib.compress()
和7zip的deflate有什么区别?
如何从 zlib 获得与 7zip 相同的输出?
为什么 7zip 的 Deflate 对 test1.txt 和 test2.txt 的输出与输入具有不同的最高有效位?
如果可能的话,我想在我的7zip源代码中添加一个功能来保存压缩的数据以供分析。
您正在压缩为两种不同的格式。
78 da
是 zlib 流的开始。 50 4B
是 zip 文件的开头。请参阅https://stackoverflow.com/a/20765054/1180620
我不相信 7zip 有生成 zlib 流的选项。