Haskell 编译器如何决定是在堆上分配还是在堆栈上分配?

问题描述 投票:0回答:2

Haskell 不具有显式内存管理功能,并且所有对象都是按值传递的,因此也没有明显的引用计数或垃圾收集。 Haskell 编译器通常如何决定是为给定变量生成在堆栈上分配的代码还是在堆上分配的代码?它是否会在堆或堆栈上为同一函数的不同调用站点一致分配相同的变量?当它分配时,它如何决定何时释放内存?堆栈分配和释放是否仍以与 C 中相同的函数入口/出口模式执行?

haskell memory-management heap-memory stack-memory
2个回答
39
投票

当你调用这样的函数时

f 42 (g x y)

那么运行时行为如下:

p1 = malloc(2 * sizeof(Word))
p1[0] = &Tag_for_Int
p1[1] = 42
p2 = malloc(3 * sizeof(Word))
p2[0] = &Code_for_g_x_y
p2[1] = x
p2[2] = y
f(p1, p2)

也就是说,参数通常像 Java 中那样作为指向堆上对象的指针传递,但与 Java 不同的是,这些对象可能表示挂起的计算,又名 thunks,例如我们示例中的 (

g x y
/
p2
)。 如果不进行优化,这种执行模型的效率相当低下,但是有一些方法可以避免其中的许多开销。

  1. GHC 做了很多内联和拆箱工作。 内联消除了函数调用开销,并且通常可以实现进一步的优化。 拆箱意味着改变调用约定,在上面的例子中我们可以直接传递

    42
    而不是创建堆对象
    p1

  2. 严格分析可以确定是否保证对某个参数进行评估。 在这种情况下,我们不需要创建 thunk,而是完全评估表达式,然后将最终结果作为参数传递。

  3. 小对象(目前只有 8 位

    Char
    Int
    )被缓存。 也就是说,不是为每个对象分配一个新的指针,而是返回一个指向缓存对象的指针。即使该对象最初是在堆上分配的,垃圾收集器稍后也会删除它们的重复项(只有很小的
    Int
    s 和
    Char
    s)。 由于对象是不可变的,所以这是安全的。

  4. 有限的逃逸分析。 对于本地函数,一些参数可能会在堆栈上传递,因为在外部函数返回时它们已知为死代码。

编辑:有关(更多)更多信息,请参阅“在库存硬件上实现惰性函数语言:无骨干无标签 G 机”。 本文使用“push/enter”作为调用约定。 较新版本的 GHC 使用“eval/apply”调用约定。 有关该切换的权衡和原因的讨论,请参阅 “如何进行快速柯里化:push/enter 与 eval/apply”


3
投票

GHC 放入堆栈的唯一内容是评估上下文。 使用 let/where 绑定分配的任何内容以及所有数据构造函数和函数都存储在堆中。 惰性求值使您所知道的有关严格语言执行策略的一切都变得无关紧要。

© www.soinside.com 2019 - 2024. All rights reserved.