openmp 相关问题

OpenMP是一种跨平台的多线程API,它允许使用特殊的编译器指令进行细粒度的任务并行化和同步。

libgomp.so.1:无法打开共享对象文件

我在我的 C++ 代码中使用 OpenMP。 libgomp.so.1 存在于我的 lib 文件夹中。我还将其路径添加到 LD_LIBRARY_PATH 仍然在运行时我收到错误消息:libgomp.so.1:无法打开共享...

回答 1 投票 0

如何使用 OpenMP 在共享内存系统上并行化 Fortran 中的嵌套循环,并将线程显式分配给内部和外部循环?

我正在开发一个带有嵌套循环的 Fortran 程序,我想使用 OpenMP 对其进行并行化。该程序在共享内存多处理器系统上运行,我想要以下内容: 内循环...

回答 1 投票 0

OpenMP 性能问题:并行性没有改善执行时间

我有这个代码; #包括 #包括 #包括 #包括 #定义 NUM_VERTICES 1024 int 距离[NUM_VERTICES]; int 最短路径树[

回答 1 投票 0

OpenMP 并行递归与分支

我正在尝试使用 OpenMP 加快计算速度,但我不确定并行化是否适用于分支。 这是代码(删除了不必要的部分): 如果(标志){ int val;...

回答 1 投票 0

在 Visual Studio 2022 中将 OpenMP 更新到更高版本

在VS22中,OpenMP仍为2.0版本。可以更新到5.0或者至少3.0吗?我还没有在 VS22 安装程序中找到任何允许这样做的选项。

回答 2 投票 0

是否可以以某种方式混合静态和动态循环调度?

我使用的机器有 2 个 Xeon CPU,每个 CPU 16 个核心。有 2 个 NUMA 域,每个 CPU 一个。 我有密集的计算,也使用大量内存,而且一切都是多线程的......

回答 1 投票 0

声波方程传播的实现在两个线程之外根本无法扩展

在下面的 OpenMP C 代码中,我期望使用 tempfield 可以帮助在一个缓存行中写入 p1,在我的例子中是 64 字节。相比之下,使用两个线程我几乎获得了 2 倍的加速...

回答 1 投票 0

我的声波方程传播的 OpenMP 实现在两个线程之外根本无法扩展,这可能是什么问题?

在下面的 OpenMP C 代码中,我期望使用 tempfield 可以帮助在一个缓存行中写入 p1,在我的例子中是 64 字节。相比之下,使用两个线程我几乎获得了 2 倍的加速...

回答 1 投票 0

树中的最高和路径

问题描述: 给定一棵通用树,目标是识别并计算从根到具有最大节点值总和的叶子的路径。树中的每个节点都有一个关联的

回答 1 投票 0

libgomp 缺失:在主目录中安装 C++ 编译器?

我正在一台机器上工作 Linux 版本 2.6.16.46-0.12-smp (geeko@buildhost)(gcc 版本 4.1.2 20070115(预发布)(SUSE Linux))#1 SMP 5 月 17 日星期四 14:00:09 UTC 2007 而且我没有 root

回答 2 投票 0

并行化 for 循环执行数组赋值时的问题

我正在学习omp并遇到这个问题...... 考虑以下代码: 数组 a、b 和 c 已初始化 #pragma omp 并行 num_threads(4) { #pragma omp for Schedule(静态,64) ...

回答 2 投票 0

使用 Visual Studio 2022 通过 C++ 通过 for 循环应用 Open MP (omp) 来执行数组分配时出现问题

我正在学习omp并遇到这个问题...... 考虑以下代码: (i) 数组a、b、c被初始化 #pragma omp 并行 num_threads(4) { #pragma omp for Schedule(静态,64) ...

回答 1 投票 0

并行双调排序实现加速

我正在尝试使用 C++ 在 CPU 上实现双调排序的多线程版本。目前,我通过此实现可以获得的最佳加速约为 4.3,(订购 128 MB 的数组)

回答 1 投票 0

一旦“生成例程”退出,OpenMP 任务就会崩溃

我有以下程序结构: 类型(mytype)::x(10) !$OMP 并行默认值(共享) !$OMP 大师 我 = 1, 10 调用 sub1(x(i)) !一些无法并行化的东西 调用 sub2(x(i)...

回答 1 投票 0

gcc 11.4 openmp 似乎没有生成 AVX2 指令。根据之前的 stackoverflow,我做错了什么?

我在 popos 上使用 gcc 11.4 我尝试过的命令: g++ -fopenmp-simd -O2 -S simd_reduction.cpp g++ -fopenmp-simd -O2 -mavx2 -march=native -S simd_reduction.cpp 代码: #包括 佛罗里达...

回答 1 投票 0

带有 OpenCv 和指针的 OpenMp

我正在开发一个 C++ 程序,该程序使用 OpenCv 分析来自网络摄像头的视频并进行一些运动跟踪(最终目标是尝试为学校项目构建自动气枪哨兵炮塔!) 我是

回答 1 投票 0

如何在Xcode中正确链接libomp动态库?

我正在编写一个 OpenMP C 程序(它可以只是一个 omp_set_num_threads(x) 指令)。我可以使用命令 clang -Xclang -fopenmp -L/opt/homebrew/opt/libomp/l... 在终端中构建并执行它。

回答 1 投票 0

使用 OpenMP 计算直方图

我想并行化此代码以获得最佳性能。 “histogram”存储某种颜色出现的次数(有10种不同的颜色,因此直方图的大小为10)。 “img”是...

回答 4 投票 0

MPI_Wait 不会释放 MPI_Ibcast 请求

考虑以下程序: #包括 #包括 int main() { 提供的整数=-1; MPI_Init_thread(NULL, NULL, MPI_THREAD_MULTIPLE, &提供); 如果(提供...

回答 1 投票 0

使用#pragma omp paralle for

我正在使用 C++ 和 OMP 库练习 2 个线程的暴力破解: #包括 #包括 #包括 #包括 #包括 我正在使用 C++ 和 OMP 库练习 2 个线程的暴力破解: #include <iomanip> #include <sstream> #include <openssl/md5.h> #include <cstring> #include <iostream> #include <omp.h> #define NUM_THREADS 2 int main() { unsigned char digest[MD5_DIGEST_LENGTH]; std::cout << "Enter hash: "; std::string target; std::cin >> target; char password[11] = "0000000000"; bool flag = true; std::ostringstream password_stream; std::ostringstream hex_hash; while (flag) { #pragma omp parallel for num_threads(NUM_THREADS) for (unsigned long long i = 0; i <= 9999999999ULL; ++i) { password_stream << std::setfill('0') << std::setw(10) << i; std::string password_str = password_stream.str(); MD5(reinterpret_cast<const unsigned char*>(password_str.c_str()), password_str.length(), digest); for (int i = 0; i < MD5_DIGEST_LENGTH; ++i) { #pragma omp critical hex_hash << std::hex << std::setw(2) << std::setfill('0') << (int)digest[i]; } std::string hex_hash_str = hex_hash.str(); //std::cout << omp_get_thread_num() << std::endl; if (hex_hash_str == target) { #pragma omp critical std::cout << "Orginal password: " << password_str << std::endl; flag = false; } if (i % 100000 == 0) { std::cout << "Wrong: " << password_str << " " << hex_hash_str << " Trying again..." << std::endl; } } } return 0; } 但是他们要么试图写入一个流,要么我得到了错误的十六进制数字哈希计算,或者是分段错误或总线错误。 我正在尝试使用 #pragma omp critical 以避免线程写入一个流。另外,我尝试在 #pragma omp parallel for 之前将带有密码和十六进制哈希的变量放入全局变量中。所有这些都会导致哈希计算错误或分段错误。 密码由10位数字组成 我认为有几个问题: password_stream 和 hex_hash 不是线程安全的 std::ostringstream 不是线程安全的 变量 flag 和 password_stream 由所有线程共享。 password_stream、hex_hash和digest未本地化到线程 没有测试自己,但试试这个: while (flag) { #pragma omp parallel for num_threads(NUM_THREADS) for (unsigned long long i = 0; i <= 9999999999ULL; ++i) { std::ostringstream password_stream; // moved inside the loop password_stream << std::setfill('0') << std::setw(10) << i; std::string password_str = password_stream.str(); unsigned char local_digest[MD5_DIGEST_LENGTH]; // changed to local MD5(reinterpret_cast<const unsigned char*>(password_str.c_str()), password_str.length(), local_digest); std::ostringstream hex_hash; // moved inside the loop for (int j = 0; j < MD5_DIGEST_LENGTH; ++j) { hex_hash << std::hex << std::setw(2) << std::setfill('0') << (int)local_digest[j]; } std::string hex_hash_str = hex_hash.str(); if (hex_hash_str == target) { #pragma omp critical { std::cout << "Original password: " << password_str << std::endl; flag = false; } } if (i % 100000 == 0) { #pragma omp critical { std::cout << "Wrong: " << password_str << " " << hex_hash_str << " Trying again..." << std::endl; } } #pragma omp flush(flag) // improved if (!flag) break; } }

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.