我有一堆焦油球,大小从 1 GB 到几百 GB 不等。 tar 球(未压缩)的大小比解压数据大 2.32% 到 2.38%。因此,对于较大的文件,差异为几 GB。这是相当恒定的相对差异,与整体文件大小是 1 GB 还是 100 GB 无关。
文件头似乎不会导致这种情况,因为它比观察到的差异小得多,并且文件数量(10 到几百个)几乎对此比率有任何影响。
是什么导致焦油球尺寸相对增加?
我不是问为什么存在尺寸差异,而是问为什么存在相对尺寸差异。
如果无法访问您的特定文件,就不可能明确地说。
来自 GNU tar 规范 v1.35:
“从物理上讲,存档由一系列以存档结束条目终止的文件条目组成”。
这意味着完全标准的 tarball 应该仅具有基于存档中文件数量的“相对”大小差异。 但是,从同一页面:
“除了描述存档成员的条目之外,存档还可能包含 tar 本身用来存储信息的条目”,使用标签作为不包含实际文件数据的条目的示例。
在寻找这方面的信息时,我发现了
,其中包含:
“让我们考虑一个场景,我们有一个 tarball,压缩后大小为 1GB,解压后,解压后的数据有好几个 100GB。tarball 和解压数据之间的大小差异为 2.32% 到 2.38%。”
数字完全一致,但本文讨论的是单个 1GB
tarball 与 100GB 未压缩原始数据。如果您可以提供有关您的具体案例的更多信息,将会更容易给出明确的答案。