焦油球的大小与解压数据的大小相比

问题描述 投票:0回答:1

我有一堆焦油球,大小从 1 GB 到几百 GB 不等。 tar 球(未压缩)的大小比解压数据大 2.32% 到 2.38%。因此,对于较大的文件,差异为几 GB。这是相当恒定的相对差异,与整体文件大小是 1 GB 还是 100 GB 无关。

文件头似乎不会导致这种情况,因为它比观察到的差异小得多,并且文件数量(10 到几百个)几乎对此比率有任何影响。

是什么导致焦油球尺寸相对增加?

我不是问为什么存在尺寸差异,而是问为什么存在相对尺寸差异

header size tar
1个回答
0
投票

如果无法访问您的特定文件,就不可能明确地说。

来自 GNU tar 规范 v1.35
“从物理上讲,存档由一系列以存档结束条目终止的文件条目组成”。

这意味着完全标准的 tarball 应该仅具有基于存档中文件数量的“相对”大小差异。 但是,从同一页面:

“除了描述存档成员的条目之外,存档还可能包含 tar 本身用来存储信息的条目”,使用标签作为不包含实际文件数据的条目的示例。


在寻找这方面的信息时,我发现了

这篇文章

,其中包含: “让我们考虑一个场景,我们有一个 tarball,压缩后大小为 1GB,解压后,解压后的数据有好几个 100GB。tarball 和解压数据之间的大小差异为 2.32% 到 2.38%。”
数字完全一致,但本文讨论的是单个 1GB

压缩

tarball 与 100GB 未压缩原始数据。如果您可以提供有关您的具体案例的更多信息,将会更容易给出明确的答案。

© www.soinside.com 2019 - 2024. All rights reserved.