尝试打印文件的十六进制Blake2哈希时非常奇怪的错误

问题描述 投票:0回答:2

我正在编写一个小程序来使用libsodium来计算文件的哈希值(blake2b)并发现自己正在盯着一个奇怪的bug。

我的十六进制输出中缺少零,这不是由哈希过程引起的,因为我们使用相同的256位截断哈希函数。

两者都使用Blake2b(针对x64进行了优化)。

我确保验证文件是否被读取,即使是输出完全不同,因为它是一个散列函数(1位足以有不同的输出)。

我还使用C风格的打印和C ++流来查看它是否与格式说明符有关,这表明情况并非如此。

我的程序输出如下:

479b5e6da5eb90a19ae1777c8ccc614b5c8f695c9cffbfe78d38b89e40b865

使用b2sum命令行工具时

b2sum /bin/ls -l 256
479b5e6da5eb90a19ae1777c8ccc614b**0**5c8f695c9cffbfe78d38b89**0**e40b865
#include<iostream>
#include<fstream>
#include<sstream>
#include<ios>
#include<vector>

#include<sodium.h>

using namespace std;

int main(int argc, char** argv)
{
    using buffer = vector<char>;

    ifstream input(argv[1],ios::binary | ios::ate); 
    // get file size 
    streamsize filesize = input.tellg();
    input.seekg(0,ios::beg);
    // make a buffer with that filesize
    buffer buf(filesize);
    // read the file
    input.read(buf.data(),buf.size());
    input.close();
    // show filesize 
    cout << "Filesize : " << filesize << endl;
    // using the snipped from libsodium docs 
    // https://libsodium.gitbook.io/doc/hashing/generic_hashing
    // Example 1
    unsigned char hash[crypto_generichash_BYTES];

    crypto_generichash(hash,sizeof(hash),(unsigned char*)buf.data(),buf.size(),NULL,0);

    // Print the hash in hexadecimal
    for(int i = 0; i < crypto_generichash_BYTES; i++)
    {
        printf("%x",hash[i]);
    }
    cout << endl;
    // load the hash into a stringstream using hexadecimal
    stringstream ss;
    for(int i=0; i<crypto_generichash_BYTES;++i)
        ss << std::hex << (int)hash[i];
    std::string mystr = ss.str();  
    // output the stringstream
    cout << mystr << endl;
    cout << "hash length :" << mystr.length() << endl;


}
c++ hash libsodium
2个回答
1
投票

printf("%x",hash[i]);不输出十六进制值<0x10的前导零。您需要使用printf("%02x", hash[i]);,它告诉printf()输出最少2个十六进制数字,如果需要,在前导零之前。

否则,请改用C ++流输出:

std::cout << std::hex << std::setw(2) << std::setfill('0') << (int)hash[i];

你还需要为你的std::streamstream做什么,因为你的代码也省略了十六进制值<0x10的前导零。


1
投票

你应该使用类似的东西:

printf("%02x",hash[i]);

打印出字节。这将正确处理小于16的十六进制值,在您的版本中,它将只输出一个十六进制数字。

您可以在以下程序中看到:

#include <cstdio>

#define FMT "%02x"
int main() {
    printf(FMT, 0x4b);
    printf(FMT, 0x05);
    printf(FMT, 0xc8);
    putchar('\n');
}

如上所述定义FMT,您会看到正确的4b05c8。随着它被定义(如你所知)为"%x",你会看到错误的4b5c8


而且,顺便说一下,你可能想要考虑放弃C遗留物(a)像printf。我知道它在标准中,但几乎没有人(b)因为它的局限性而使用它,尽管iostream相当于更加冗长。

或者做我们已经完成的工作,只使用fmt库更简洁但仍然是类型安全的输出,特别是因为它目前正在针对C + 20(因此几乎肯定会在某些时候成为标准的一部分)。


(a)没有人希望被称为C +程序员,那个从未完全接受语言全部功能的奇怪品种:-)

(b)基于我曾与之合作的中等数量C ++开发人员的样本:-)

© www.soinside.com 2019 - 2024. All rights reserved.