我在 Go 中实现了一个 HTTP 服务器。
对于每个请求,我需要为特定结构创建数百个对象,并且我有大约 10 个这样的结构。因此,根据 Go 实现,请求完成后,它将被垃圾收集。
因此,对于每个请求,都会分配和释放这么多内存。
相反,我想实现内存池来提高分配端和 GC 端的性能
在请求开始时,我将从池中取出并在请求得到满足后放回原处
从池实现方面来看
在内存分配和释放的情况下还有其他提高性能的建议吗?
提前注意:
sync.Pool
,这是对 临时 对象的快速、良好的实现。但请注意,sync.Pool
并不保证保留池化对象。引用其文档:
池中存储的任何项目可能会随时自动删除,恕不另行通知。如果发生这种情况时池保留唯一的引用,则该项目可能会被释放。
因此,如果您不希望
Pool
中的对象被垃圾收集(这取决于您的情况可能会导致更多分配),那么下面提供的解决方案更好,因为通道缓冲区中的值不会被垃圾收集。如果您的对象确实大到内存池合理,则池通道的开销将被摊销。
此外,
sync.Pool
不允许您限制池化对象的数量,而下面提出的解决方案自然可以。
最简单的内存池“实现”是缓冲通道。
假设您想要一个包含一些大对象的内存池。创建一个缓冲通道来保存指向此类昂贵对象的值的指针,并且每当需要时,就从池(通道)中接收一个。使用完毕后,将其放回池中(在通道上发送)。为避免意外丢失物品(例如在恐慌的情况下),请在放回物品时使用
defer
语句。
让我们用它作为我们的大对象的类型:
type BigObject struct {
Id int
Something string
}
创建池是:
pool := make(chan *BigObject, 10)
池的大小就是通道缓冲区的大小。
用昂贵对象的指针填充池(这是可选的,请参阅最后的注释):
for i := 0; i < cap(pool); i++ {
bo := &BigObject{Id: i}
pool <- bo
}
多个 goroutine 使用池:
wg := sync.WaitGroup{}
for i := 0; i < 100; i++ {
wg.Add(1)
go func() {
defer wg.Done()
bo := <-pool
defer func() { pool <- bo }()
fmt.Println("Using", bo.Id)
fmt.Println("Releasing", bo.Id)
}()
}
wg.Wait()
在Go Playground尝试一下。
请注意,如果所有“池化”对象都在使用中,则此实现会阻塞。如果您不希望这样,您可以使用
select
强制创建新对象(如果所有对象都在使用中):
var bo *BigObject
select {
case bo = <-pool: // Try to get one from the pool
default: // All in use, create a new, temporary:
bo = &BigObject{Id:-1}
}
在这种情况下,您不需要将其放回池中。或者,如果池中有空间,您可以选择尝试将所有内容放回池中,而不会阻塞,再次使用
select
:
select {
case pool <- bo: // Try to put back into the pool
default: // Pool is full, will be garbage collected
}
备注:
可以选择提前填充泳池。如果您使用
select
尝试从池中获取/放回值,则池最初可能是空的。
您必须确保在请求之间不会泄露信息,例如确保您不使用已设置且属于其他请求的共享对象中的字段和值。
这是@JimB提到的
sync.Pool
实现。请注意使用 defer
将对象返回到池中。
package main
import "sync"
type Something struct {
Name string
}
var pool = sync.Pool{
New: func() interface{} {
return &Something{}
},
}
func main() {
s := pool.Get().(*Something)
defer pool.Put(s)
s.Name = "hello"
// use the object
}
需要注意的是,
sync.Pool
必须与相似尺寸的物体一起使用。如果它们的大小不同(例如,bytes.Buffer
),您将遇到问题:缓冲区将增长到最大数据大小并保持这种状态,即使您稍后需要更少的缓冲区。目前还没有好的解决方案,但是 fmt
包 通过删除大于 64 KB 的缓冲区来解决这个问题,即,您只是不将更大的缓冲区返回到池中。