x86-64 相关问题

x86-64是Intel x86架构的64位扩展

AVX512 自动向量化 C++ 矩阵向量函数在源 = 目标、就地时要慢得多

我尝试编写一些函数来使用单个矩阵和源向量数组来执行矩阵向量乘法。我曾经用 C++ 编写过这些函数,也用 x86 编写过一次

回答 1 投票 0

被调用者保存的寄存器如何工作?谁应该将原始值压入堆栈?

我正在从 pg251 上的 CSAPP(第三版)学习被调用者和调用者保存的寄存器,我知道对于被调用者保存的寄存器: 过程 Q(被调用者)可以通过以下任一方式保存寄存器值...

回答 1 投票 0

所有支持AVX2的CPU都支持BMI2或popcnt吗?

从这里我了解到AVX的支持并不意味着BMI1的支持。那么AVX2怎么样:所有支持AVX2的CPU也都支持BMI2吗?另外,支持AVX2是否意味着支持...

回答 2 投票 0

AVX512 汇编和 C++ 矩阵向量函数有奇怪的速度差异

我尝试编写一些函数来使用单个矩阵和源向量数组来执行矩阵向量乘法。我曾经用 C++ 编写过这些函数,也用 x86 编写过一次

回答 1 投票 0

返回数字偶数位之和的汇编代码

全球主线 .data 节 msgeven db "数字中偶数位的总和为:",0 总和 db 0 UC 数据库 0 数据库0 编号 db 234 节.文本 主要的: mov ax,[数字] _计算总和: cmp 斧头,'0' 我

回答 1 投票 0

如何在arm64主机平台上运行amd64 docker镜像?

我有一台 m1 mac,我正在尝试在基于 arm64 的主机平台上运行基于 amd64 的 docker 映像。但是,当我尝试这样做(使用 docker run)时,出现以下错误: 警告:所要求的...

回答 3 投票 0

从进程入口点调用时发生 Printf 访问冲突

我是一名初学汇编程序员。我正在尝试使用 Visual Studio 2022 在 Windows 上创建 Hello World。无论我尝试什么,我总是遇到相同的错误。我在网上查了一下,但我的代码似乎......

回答 1 投票 0

SIGSYS 错误系统调用(Android)

我正在为 Android 编写一些内联汇编代码,在 x64 Android 模拟器中使用 GDB 逐步执行代码时,我看到我尝试执行的系统调用出现了 SIGSYS Bad System Call 错误。我

回答 1 投票 0

-mavx2 是否意味着 -mavx 和 -msse4.2

据我了解,每个支持AVX2的CPU都支持AVX,每个支持AVX的CPU都支持SSE4.2。 这是否意味着仅指定 -mavx2 就足够了,还是两者之间存在差异......

回答 1 投票 0

访问客户操作系统内的虚拟化异常区域

我目前正在实施一个利用 Intel CPU 中的虚拟化异常 #VE 的解决方案。我的代码在 KVM 中启用#VE,以便来宾操作系统可以处理它。 不过,根据英特尔 SDM,

回答 1 投票 0

SSE指令加载零扩展字节?

假设我有一个指向 RDI 中一堆 uint8_t 的指针,我想将 4 个 uint8_t 加载到 XMM0 中,并使用 SIMD 指令将其与 XMM1 相乘,其中我存储了 4 个浮点值。 我怎么能...

回答 1 投票 0

非法指令”在 Debian 12(书虫)x86_64 上运行 ollama 时出错

身体 当我尝试在 x86_64 架构的 Debian 12(书虫)系统上运行 ollama 程序时,遇到“非法指令”错误。此问题经常发生

回答 1 投票 0

64位汇编代码添加2个数字

我用 64 位汇编编写了这个程序来添加两个数字。它适用于 1 位数字,但不适用于 2 位数字。 我的代码有什么问题吗? 段.data msg1 db“输入数字”,...

回答 2 投票 0

为什么gcc将8字节格式的char类型传递给函数汇编

为了学习汇编,我正在查看 GCC 使用 -S 命令为一些简单的 c 程序生成的汇编。我有一个 add 函数,它接受一些整数和一些字符并将它们添加在一起。 ...

回答 2 投票 0

为什么简单的 FP 循环不自动矢量化,并且比 SIMD 内在函数计算慢?

(为什么?)即使使用 -03 和 -march=native 进行编译,编译器也不使用 SIMD 指令来计算总和的简单循环吗? 考虑以下两个函数: 浮点数 sum_simd(const std::

回答 1 投票 0

LEA 与 MOV imm64 将地址常量加载到寄存器中

我有一个常量(64 位)地址,我想将其加载到寄存器中。该地址位于代码段中,因此可以相对于RIP 进行寻址。两者有什么区别 移动...

回答 2 投票 0

lea 与 mov 在寄存器中存储地址常量

我有一个常量(64 位)地址,我想将其加载到寄存器中。该地址位于代码段中,因此可以相对于RIP 进行寻址。两者有什么区别 移动...

回答 1 投票 0

“%d”在哪里 " 存储的格式字符串以及 GCC 如何将其传递给 x86-64 上的 printf?

所以我正在调试一个简单的c程序,如下在gdb中查看程序集 #包括 #包括 int main() { 整数a=12; printf("%d “, A); }

回答 1 投票 0

(为什么?)simpe 循环不是矢量化的并且比 SIMD 计算慢吗?

(为什么?)即使使用 -03 和 -march=native 进行编译,编译器也不使用 SIMD 指令来计算总和的简单循环吗? 考虑以下两个函数: 浮点数 sum_simd(const std::

回答 1 投票 0

在.text节中使用DB(定义字节)时出现分段错误

[编辑:这个问题有点老了,我仍在学习低级计算机的基础知识。我没有看到 db 0x41 被视为一条指令,而不是实际的 de...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.