perf 相关问题

Perf是基于Linux 2.6+系统的分析器工具。

如何确定cacheline的write allocate产生的内存负载数量?

根据本页和本页,读操作首先会发生对L3缓存的存储未命中,并且在某些情况下可以通过非临时存储来避免。 有没有办法(比如一些 perf ev...

回答 1 投票 0

perf 不在注释中显示源代码,尽管包含了符号

在注释中,perf 只向我显示汇编代码。但是,它确实正确列出了所有符号,并且二进制文件是使用 -g 编译的。此外,文件列出了与 debug_info 相同的二进制文件,而不是

回答 1 投票 0


为什么mem_load_retired.l1_hit和mem_load_retired.l1_miss没有添加到加载总数中?

我正在研究缓存对 x86-64 CPU 性能的影响。我一直在使用 Linux 的 perf 来监控缓存命中/未命中率,特别是这些计数器: mem_inst_retired.all_loads

回答 1 投票 0

Perf:内核模块符号未显示在分析中

加载并运行内核模块,然后通过 perf 进行分析。 $ perf record -a -g --call-graph 矮人睡眠 30 $ 性能报告 我的内核模块的符号不存在于性能报告中。

回答 1 投票 0

测量 AMD Zen2 CPU 上的 LLC/L3 缓存缺失率

我有与此相关的问题。 我想(以编程方式)测量 AMD EPYC 7742 CPU (Zen2) 上的 L3 命中(访问)和未命中。我在 Ubuntu Server 20.04.2 L 上运行 Linux Kernel 5.4.0-66-generic...

回答 1 投票 0

如何解释两个处理器之间巨大的执行速度差异?

我写了一个fortran程序来模拟分子系统。我在一台台式计算机上开发了它,其处理器是 Intel(R) Core(TM) i7-6700 CPU @ 3.40GHz。之后,为了启动大规模模拟,我...

回答 1 投票 0

使用延迟开关时,Perf stat 不会计算事件

我尝试在启动后 20 秒分析我的应用程序,因为我对初始化阶段不感兴趣。 所以我将 perf 与延迟(微秒)开关一起使用: sudo perf stat --delay=2...

回答 1 投票 0

为什么需要mcyclecfg和minstretcfg?

在 RISC-V 中,计划添加新的 CSR。这是 Github 页面上的文档。它针对以下两个问题。 • 它会给观察到的计数器值带来不可预测的噪声...

回答 1 投票 0

CPU 缓存性能。存储未命中与加载未命中

我使用 perf 作为基本事件计数器。我正在开发一个遭受数据缓存存储未命中的程序。其中比例高达80%。 我知道缓存原则上是如何工作的。它从内存加载...

回答 2 投票 0

从寄存器移动到频繁访问的变量时性能出乎意料地缓慢

我正在使用以下示例了解缓存的工作原理: #包括 #包括 #包括 typedef uint32_t data_t; 常量 int U = 10000000; //...

回答 2 投票 0

insmod 命令在插入内核模块时抛出警告消息

我正在测试一个内核模块,它在每个内核上创建性能事件并计算 L2D_CACHE_REFILL 的总数。 系统详细信息:NVIDIA Jetson nano,操作系统:Ubuntu 18.04.6 LTS,内核:4.9.255,L ...

回答 0 投票 0

使用 perf 测量 CPU 周期

目前我正在测量代码执行的时间。 我可以测量执行函数花费了多少时间(使用跟踪点),但我还需要测量执行

回答 0 投票 0

如何保存 perf sched latency 的结果

我使用以下命令: perf 计划记录 -- 睡眠 1 性能调度延迟 它将打印任务的延迟。 然后,我使用命令 perf sched latency &> abc.txt。然而,它不会结束......

回答 0 投票 0

perf_event_open - 监控多个事件时限制

有谁知道我们可以在单个组 PERF_FORMAT_GROUP 中监视的 PERF_TYPE_HARDWARE 事件的数量是否有限制? 我正在尝试监视多个事件,但发现 ...

回答 1 投票 0

如何从 __NR_perf_event_open 返回的文件描述符中读取

我正在阅读 Lemire 编写的代码,它对 CPU 周期数和指令数进行了基准测试。 以下是主要逻辑: #define N_CONFIG 2 int CONFIGS[N_CONFIG] = {

回答 0 投票 0

entry_SYSCALL_64_after_hwframe 根据“性能记录”突然有高 CPU 负载

它是关于在几种情况下浪费大量 CPU 能力的系统调用。 perf 显示我面临的问题是使用 20-35% 的 CPU 功率来处理我不知道的事情。 我可以找到一些 (o...

回答 1 投票 0

perf .data 有信息(大小)但似乎是空的

有一个我正在运行 perf 的安卓设备。我有时会运行长达一个小时的测试,在运行 stressapptest 时跟踪 cpu 容量和 cpu 频率。从 .data 到 .txt 的转换似乎...

回答 0 投票 0

没有回溯的 Perf 记录报告缓冲区溢出

我正在使用 perf 来分析节点服务器。问题是在我停止服务器后,perf 记录缓冲区溢出并且不写入任何数据。 命令 perf record -e cycles:u -g -- npm ...

回答 0 投票 0

为什么 LLC 相关的性能事件在 perf 中共享相同的事件 id?

我用的是Intel spr架构,内核版本5.14,perf版本4.18。 我尝试根据这个答案中的方法来分析LLC相关事件的含义,但是发现...

回答 0 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.