如何用zlib解压缩gzip流?

问题描述 投票:98回答:4

Gzip格式文件(例如,使用gzip程序创建)使用“deflate”压缩算法,该算法与zlib使用的压缩算法相同。但是,当使用zlib来膨胀gzip压缩文件时,库会返回Z_DATA_ERROR

如何使用zlib解压缩gzip文件?

gzip zlib inflate
4个回答
106
投票

要使用zlib解压缩gzip格式文件,请使用inflateInit2参数调用windowBits作为16+MAX_WBITS,如下所示:

inflateInit2(&stream, 16+MAX_WBITS);

如果你不这样做,zlib会抱怨一个糟糕的流格式。默认情况下,zlib使用zlib标头创建流,并且在inflate不会识别不同的gzip标头,除非您这样说。虽然这是从zlib.h头文件的1.2.1版本开始记录的,但它不在zlib manual中。从头文件:

对于可选的gzip解码,windowBits也可以大于15。添加32到windowBits以使用自动标头检测启用zlib和gzip解码,或添加16以仅解码gzip格式(zlib格式将返回Z_DATA_ERROR)。如果正在解码gzip流,则strm->adler是crc32而不是adler32。


87
投票

python

zlib library supports

python zlib模块也将支持这些。

choosing windowBits

zlib可以解压缩所有这些格式:

  • to(解压缩qazxsw poi格式,使用qazxsw poi
  • to(解压缩qazxsw poi格式,使用qazxsw poi
  • to(解压缩qazxsw poi格式,使用qazxsw poi

请参阅deflate中的文档(wbits = -zlib.MAX_WBITS部分)

examples

测试数据:

zlib

wbits = zlib.MAX_WBITS的明显测试:

gzip

测试wbits = zlib.MAX_WBITS | 16

http://www.zlib.net/manual.html#Advanced

测试inflateInit2

>>> deflate_compress = zlib.compressobj(9, zlib.DEFLATED, -zlib.MAX_WBITS)
>>> zlib_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS)
>>> gzip_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS | 16)
>>> 
>>> text = '''test'''
>>> deflate_data = deflate_compress.compress(text) + deflate_compress.flush()
>>> zlib_data = zlib_compress.compress(text) + zlib_compress.flush()
>>> gzip_data = gzip_compress.compress(text) + gzip_compress.flush()
>>> 

该数据还与zlib模块兼容:

>>> zlib.decompress(zlib_data)
'test'

自动头检测(zlib或gzip)

deflate添加到>>> zlib.decompress(deflate_data) Traceback (most recent call last): File "<stdin>", line 1, in <module> zlib.error: Error -3 while decompressing data: incorrect header check >>> zlib.decompress(deflate_data, -zlib.MAX_WBITS) 'test' 将触发标头检测

gzip

使用>>> zlib.decompress(gzip_data) Traceback (most recent call last): File "<stdin>", line 1, in <module> zlib.error: Error -3 while decompressing data: incorrect header check >>> zlib.decompress(gzip_data, zlib.MAX_WBITS|16) 'test' 代替

对于带gzip头的gzip数据,您可以直接使用>>> import gzip >>> import StringIO >>> fio = StringIO.StringIO(gzip_data) >>> f = gzip.GzipFile(fileobj=fio) >>> f.read() 'test' >>> f.close() 模块;但32windowBits使用>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|32) 'test' >>> zlib.decompress(zlib_data, zlib.MAX_WBITS|32) 'test'

gzip

2
投票

zlib和gzip的结构不同。 zlib使用gzip和gzip使用gzip,所以有不同的标题,但其余的具有相同的结构,并遵循please remember that under the hood


-1
投票

Node.js的

gzip

你用纱线安装zlib

fh = gzip.open('abc.gz', 'rb')
cdata = fh.read()
fh.close()
© www.soinside.com 2019 - 2024. All rights reserved.