我正在编写一个小程序来使用libsodium来计算文件的哈希值(blake2b)并发现自己正在盯着一个奇怪的bug。
我的十六进制输出中缺少零,这不是由哈希过程引起的,因为我们使用相同的256位截断哈希函数。
两者都使用Blake2b(针对x64进行了优化)。
我确保验证文件是否被读取,即使是输出完全不同,因为它是一个散列函数(1位足以有不同的输出)。
我还使用C风格的打印和C ++流来查看它是否与格式说明符有关,这表明情况并非如此。
我的程序输出如下:
479b5e6da5eb90a19ae1777c8ccc614b5c8f695c9cffbfe78d38b89e40b865
使用b2sum命令行工具时
b2sum /bin/ls -l 256 479b5e6da5eb90a19ae1777c8ccc614b**0**5c8f695c9cffbfe78d38b89**0**e40b865
#include<iostream>
#include<fstream>
#include<sstream>
#include<ios>
#include<vector>
#include<sodium.h>
using namespace std;
int main(int argc, char** argv)
{
using buffer = vector<char>;
ifstream input(argv[1],ios::binary | ios::ate);
// get file size
streamsize filesize = input.tellg();
input.seekg(0,ios::beg);
// make a buffer with that filesize
buffer buf(filesize);
// read the file
input.read(buf.data(),buf.size());
input.close();
// show filesize
cout << "Filesize : " << filesize << endl;
// using the snipped from libsodium docs
// https://libsodium.gitbook.io/doc/hashing/generic_hashing
// Example 1
unsigned char hash[crypto_generichash_BYTES];
crypto_generichash(hash,sizeof(hash),(unsigned char*)buf.data(),buf.size(),NULL,0);
// Print the hash in hexadecimal
for(int i = 0; i < crypto_generichash_BYTES; i++)
{
printf("%x",hash[i]);
}
cout << endl;
// load the hash into a stringstream using hexadecimal
stringstream ss;
for(int i=0; i<crypto_generichash_BYTES;++i)
ss << std::hex << (int)hash[i];
std::string mystr = ss.str();
// output the stringstream
cout << mystr << endl;
cout << "hash length :" << mystr.length() << endl;
}
printf("%x",hash[i]);
不输出十六进制值<0x10的前导零。您需要使用printf("%02x", hash[i]);
,它告诉printf()
输出最少2个十六进制数字,如果需要,在前导零之前。
否则,请改用C ++流输出:
std::cout << std::hex << std::setw(2) << std::setfill('0') << (int)hash[i];
你还需要为你的std::streamstream
做什么,因为你的代码也省略了十六进制值<0x10的前导零。
你应该使用类似的东西:
printf("%02x",hash[i]);
打印出字节。这将正确处理小于16的十六进制值,在您的版本中,它将只输出一个十六进制数字。
您可以在以下程序中看到:
#include <cstdio>
#define FMT "%02x"
int main() {
printf(FMT, 0x4b);
printf(FMT, 0x05);
printf(FMT, 0xc8);
putchar('\n');
}
如上所述定义FMT
,您会看到正确的4b05c8
。随着它被定义(如你所知)为"%x"
,你会看到错误的4b5c8
。
而且,顺便说一下,你可能想要考虑放弃C遗留物(a)像printf
。我知道它在标准中,但几乎没有人(b)因为它的局限性而使用它,尽管iostream
相当于更加冗长。
或者做我们已经完成的工作,只使用fmt
库更简洁但仍然是类型安全的输出,特别是因为它目前正在针对C + 20(因此几乎肯定会在某些时候成为标准的一部分)。
(a)没有人希望被称为C +程序员,那个从未完全接受语言全部功能的奇怪品种:-)
(b)基于我曾与之合作的中等数量C ++开发人员的样本:-)