”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > Gosync.Pool 及其背后的机制

Gosync.Pool 及其背后的机制

发布于2024-11-06
浏览:124

这是帖子的摘录;完整的帖子可以在这里找到:https://victoriametrics.com/blog/go-sync-pool/


这篇文章是关于 Go 中处理并发的系列文章的一部分:

  • Gosync.Mutex:正常和饥饿模式
  • Gosync.WaitGroup 和对齐问题
  • Gosync.Pool 及其背后的机制(我们在这里)
  • Gosync.Cond,最被忽视的同步机制

在VictoriaMetrics源代码中,我们经常使用sync.Pool,老实说它非常适合我们处理临时对象的方式,特别是字节缓冲区或切片。

标准库中常用。例如,在encoding/json包中:

package json

var encodeStatePool sync.Pool

// An encodeState encodes JSON into a bytes.Buffer.
type encodeState struct {
    bytes.Buffer // accumulated output

    ptrLevel uint
    ptrSeen  map[any]struct{}
}

在本例中,sync.Pool 用于重用 *encodeState 对象,该对象处理将 JSON 编码为 bytes.Buffer 的过程。

我们不会在每次使用后抛出这些对象,这只会给垃圾收集器带来更多工作,而是将它们存储在池中(sync.Pool)。下次当我们需要类似的东西时,我们只需从池中获取它,而不是从头开始制作一个新的。

您还会在net/http包中找到多个sync.Pool实例,它们用于优化I/O操作:

package http

var (
    bufioReaderPool   sync.Pool
    bufioWriter2kPool sync.Pool
    bufioWriter4kPool sync.Pool
)

当服务器读取请求主体或写入响应时,它可以快速从这些池中提取预先分配的读取器或写入器,从而跳过额外的分配。此外,还设置了*bufioWriter2kPool和*bufioWriter4kPool这2个写入池来处理不同的写入需求。

func bufioWriterPool(size int) *sync.Pool {
    switch size {
    case 2 



好了,介绍就这么多了。

今天,我们将深入探讨sync.Pool的全部内容、定义、它的使用方式、幕后情况以及您可能想知道的所有其他内容。

顺便说一句,如果你想要更实用的东西,我们的 Go 专家有一篇很好的文章,展示了我们如何在 VictoriaMetrics 中使用sync.Pool:时间序列数据库中的性能优化技术:sync.Pool 用于 CPU 绑定操作

什么是sync.Pool?

简单来说,Go 中的sync.Pool 是一个可以保存临时对象以供以后重用的地方。

但是事情是这样的,你无法控制池中保留多少对象,并且你放入其中的任何东西都可以随时删除,没有任何警告,阅读上一节时你就会知道为什么。

好处是,池被构建为线程安全的,因此多个 goroutine 可以同时利用它。考虑到它是同步包的一部分,这并不奇怪。

“但是我们为什么要费心重用对象呢?”

当你同时运行很多 goroutine 时,它​​们通常需要类似的对象。想象一下同时运行 go f() 多次。

如果每个 goroutine 创建自己的对象,内存使用量会快速增加,这会给垃圾收集器带来压力,因为一旦不再需要这些对象,它就必须清理它们。

这种情况会造成一个循环,高并发导致高内存使用率,从而减慢垃圾收集器的速度。 sync.Pool 旨在帮助打破这个循环。

type Object struct {
    Data []byte
}

var pool sync.Pool = sync.Pool{
    New: func() any {
        return &Object{
            Data: make([]byte, 0, 1024),
        }
    },
}

要创建一个池,您可以提供一个 New() 函数,该函数在池为空时返回一个新对象。这个函数是可选的,如果你不提供它,如果池为空,则返回 nil。

在上面的代码片段中,目标是重用 Object 结构实例,特别是其中的切片。

重复使用切片有助于减少不必要的生长。

例如,如果切片在使用过程中增长到 8192 字节,您可以将其长度重置为零,然后再将其放回池中。底层数组的容量仍然是 8192,因此下次需要时,这 8192 字节就可以重用了。

func (o *Object) Reset() {
    o.Data = o.Data[:0]
}

func main() {
    testObject := pool.Get().(*Object)

    // do something with testObject

    testObject.Reset()
    pool.Put(testObject)
}

流程非常清晰:您从池中获取一个对象,使用它,重置它,然后将其放回池中。重置对象可以在将其放回之前或从池中获取它之后立即完成,但这不是强制性的,这是常见的做法。

如果您不喜欢使用类型断言 pool.Get().(*Object),有几种方法可以避免它:

  • 使用专用函数从池中获取对象:
func getObjectFromPool() *Object {
    obj := pool.Get().(*Object)
    return obj
}
  • 创建您自己的sync.Pool通用版本:
type Pool[T any] struct {
    sync.Pool
}

func (p *Pool[T]) Get() T {
    return p.Pool.Get().(T)
}

func (p *Pool[T]) Put(x T) {
    p.Pool.Put(x)
}

func NewPool[T any](newF func() T) *Pool[T] {
    return &Pool[T]{
        Pool: sync.Pool{
            New: func() interface{} {
                return newF()
            },
        },
    }
}

通用包装器为您提供了一种更类型安全的方式来使用池,避免类型断言。

请注意,由于额外的间接层,它增加了一点点开销。在大多数情况下,这种开销很小,但如果您处于对 CPU 高度敏感的环境中,最好运行基准测试来看看是否值得。

但是等等,还有更多。

同步池和分配陷阱

如果您从之前的许多示例(包括标准库中的示例)中注意到,我们在池中存储的通常不是对象本身,而是指向该对象的指针。

让我用一个例子来解释为什么:

var pool = sync.Pool{
    New: func() any {
        return []byte{}
    },
}

func main() {
    bytes := pool.Get().([]byte)

    // do something with bytes
    _ = bytes

    pool.Put(bytes)
}

我们正在使用[]字节池。通常(尽管并非总是),当您将值传递给接口时,可能会导致该值被放置在堆上。这种情况也发生在这里,不仅适用于切片,还适用于传递给 pool.Put() 的任何不是指针的内容。

如果使用逃逸分析进行检查:

// escape analysis
$ go build -gcflags=-m

bytes escapes to heap

现在,我不是说我们的变量字节移动到堆,我会说“字节的值通过接口转义到堆”。

为了真正理解为什么会发生这种情况,我们需要深入研究逃逸分析的工作原理(我们可能会在另一篇文章中这样做)。但是,如果我们将指针传递给 pool.Put(),则没有额外的分配:

var pool = sync.Pool{
    New: func() any {
        return new([]byte)
    },
}

func main() {
    bytes := pool.Get().(*[]byte)

    // do something with bytes
    _ = bytes

    pool.Put(bytes)
}

再次运行逃逸分析,你会发现它不再逃逸到堆中。如果你想了解更多,Go源码中有一个例子。

同步池内部结构

在我们了解sync.Pool的实际工作原理之前,有必要先了解一下Go的PMG调度模型的基础知识,这确实是sync.Pool如此高效的支柱。

有一篇很好的文章用一些视觉效果分解了 PMG 模型:Go 中的 PMG 模型

如果您今天感到懒惰并正在寻找简化的摘要,我会支持您:

PMG 代表 P(逻辑 p处理器)、M(m机器线程)和 G(g或例程)。关键是每个逻辑处理器(P)在任何时候只能有一个机器线程(M)在其上运行。为了让 goroutine (G) 运行,它需要附加到线程 (M)。

Go sync.Pool and the Mechanics Behind It

PMG模型

这可以归结为两个关键点:

  1. 如果你有 n 个逻辑处理器 (P),只要你至少有 n 个机器线程 (M) 可用,你就可以并行运行最多 n 个 goroutine。
  2. 在任一时刻,单个处理器(P)上只能运行一个 goroutine(G)。因此,当 P1 忙于 G 时,没有其他 G 可以在该 P1 上运行,直到当前 G 被阻塞、完成或发生其他事情将其释放。

但问题是,Go 中的sync.Pool 不仅仅是一个大池,它实际上由几个“本地”池组成,每个池都与一个特定的处理器上下文(或 P)相关联,Go 的运行时是在任何给定时间进行管理。

Go sync.Pool and the Mechanics Behind It

本地池

当运行在处理器(P)上的 goroutine 需要池中的对象时,它会首先检查自己的 P 本地池,然后再查找其他地方。


完整的帖子可以在这里找到:https://victoriametrics.com/blog/go-sync-pool/

版本声明 本文转载于:https://dev.to/func25/go-syncpool-and-the-mechanics-behind-it-52c1?1如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 如何处理PHP文件系统功能中的UTF-8文件名?
    如何处理PHP文件系统功能中的UTF-8文件名?
    在PHP的Filesystem functions中处理UTF-8 FileNames 在使用PHP的MKDIR函数中含有UTF-8字符的文件很多flusf-8字符时,您可能会在Windows Explorer中遇到comploreer grounder grounder grounder gro...
    编程 发布于2025-03-28
  • 如何使用组在MySQL中旋转数据?
    如何使用组在MySQL中旋转数据?
    在关系数据库中使用mySQL组使用mySQL组进行查询结果,在关系数据库中使用MySQL组,转移数据的数据是指重新排列的行和列的重排以增强数据可视化。在这里,我们面对一个共同的挑战:使用组的组将数据从基于行的基于列的转换为基于列。 Let's consider the following ...
    编程 发布于2025-03-28
  • 为什么我的CSS背景图像出现?
    为什么我的CSS背景图像出现?
    故障排除:CSS背景图像未出现 ,您的背景图像尽管遵循教程说明,但您的背景图像仍未加载。图像和样式表位于相同的目录中,但背景仍然是空白的白色帆布。而不是不弃用的,您已经使用了CSS样式: bockent {背景:封闭图像文件名:背景图:url(nickcage.jpg); 如果您的html,css...
    编程 发布于2025-03-28
  • 如何在全高布局中有效地将Flexbox和垂直滚动结合在一起?
    如何在全高布局中有效地将Flexbox和垂直滚动结合在一起?
    在全高布局中集成flexbox和垂直滚动Traditional Flexbox Approach (Old Properties)Flexbox layouts using the old syntax (display: box) permit full-height apps with ver...
    编程 发布于2025-03-28
  • 如何使用Python理解有效地创建字典?
    如何使用Python理解有效地创建字典?
    在python中,词典综合提供了一种生成新词典的简洁方法。尽管它们与列表综合相似,但存在一些显着差异。与问题所暗示的不同,您无法为钥匙创建字典理解。您必须明确指定键和值。 For example:d = {n: n**2 for n in range(5)}This creates a dicti...
    编程 发布于2025-03-28
  • 为什么PYTZ最初显示出意外的时区偏移?
    为什么PYTZ最初显示出意外的时区偏移?
    与pytz 最初从pytz获得特定的偏移。例如,亚洲/hong_kong最初显示一个七个小时37分钟的偏移: 差异源利用本地化将时区分配给日期,使用了适当的时区名称和偏移量。但是,直接使用DateTime构造器分配时区不允许进行正确的调整。 example pytz.timezone(...
    编程 发布于2025-03-28
  • 如何配置Pytesseract以使用数字输出的单位数字识别?
    如何配置Pytesseract以使用数字输出的单位数字识别?
    Pytesseract OCR具有单位数字识别和仅数字约束 在pytesseract的上下文中,在配置tesseract以识别单位数字和限制单个数字和限制输出对数字可能会提出质疑。 To address this issue, we delve into the specifics of Te...
    编程 发布于2025-03-28
  • 如何检查对象是否具有Python中的特定属性?
    如何检查对象是否具有Python中的特定属性?
    方法来确定对象属性存在寻求一种方法来验证对象中特定属性的存在。考虑以下示例,其中尝试访问不确定属性会引起错误: >>> a = someClass() >>> A.property Trackback(最近的最新电话): 文件“ ”,第1行, AttributeError: SomeClass...
    编程 发布于2025-03-28
  • 如何在Java中执行命令提示命令,包括目录更改,包括目录更改?
    如何在Java中执行命令提示命令,包括目录更改,包括目录更改?
    在java 通过Java通过Java运行命令命令可能很具有挑战性。尽管您可能会找到打开命令提示符的代码段,但他们通常缺乏更改目录并执行其他命令的能力。 solution:使用Java使用Java,使用processBuilder。这种方法允许您:启动一个过程,然后将其标准错误重定向到其标准输出。...
    编程 发布于2025-03-28
  • 为什么尽管有效代码,为什么在PHP中捕获输入?
    为什么尽管有效代码,为什么在PHP中捕获输入?
    在php ;?>" method="post">The intention is to capture the input from the text box and display it when the submit button is clicked.但是,输出...
    编程 发布于2025-03-28
  • 如何在Java的全屏独家模式下处理用户输入?
    如何在Java的全屏独家模式下处理用户输入?
    Handling User Input in Full Screen Exclusive Mode in JavaIntroductionWhen running a Java application in full screen exclusive mode, the usual event ha...
    编程 发布于2025-03-28
  • Python读取CSV文件UnicodeDecodeError终极解决方法
    Python读取CSV文件UnicodeDecodeError终极解决方法
    在试图使用已内置的CSV模块读取Python中时,CSV文件中的Unicode Decode Decode Decode Decode decode Error读取,您可能会遇到错误的错误:无法解码字节 在位置2-3中:截断\ uxxxxxxxx逃脱当CSV文件包含特殊字符或Unicode的路径逃...
    编程 发布于2025-03-28
  • 找到最大计数时,如何解决mySQL中的“组函数\”错误的“无效使用”?
    找到最大计数时,如何解决mySQL中的“组函数\”错误的“无效使用”?
    如何在mySQL中使用mySql 检索最大计数,您可能会遇到一个问题,您可能会在尝试使用以下命令:理解错误正确找到由名称列分组的值的最大计数,请使用以下修改后的查询: 计数(*)为c 来自EMP1 按名称组 c desc订购 限制1 查询说明 select语句提取名称列和每个名称...
    编程 发布于2025-03-28
  • 为什么使用固定定位时,为什么具有100%网格板柱的网格超越身体?
    为什么使用固定定位时,为什么具有100%网格板柱的网格超越身体?
    网格超过身体,用100%grid-template-columns 为什么在grid-template-colms中具有100%的显示器,当位置设置为设置的位置时,grid-template-colly修复了?问题: 考虑以下CSS和html: class =“ snippet-code”> g...
    编程 发布于2025-03-28
  • 如何使用Java.net.urlConnection和Multipart/form-data编码使用其他参数上传文件?
    如何使用Java.net.urlConnection和Multipart/form-data编码使用其他参数上传文件?
    使用http request 上传文件上传到http server,同时也提交其他参数,java.net.net.urlconnection and Multipart/form-data Encoding是普遍的。 Here's a breakdown of the process:Mu...
    编程 发布于2025-03-28

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3