表紙 > プログラミング > Golang: 可観測性とプロファイリングにより、ほぼ検出不可能なスロットリングがどのように明らかにされたか

Golang: 可観測性とプロファイリングにより、ほぼ検出不可能なスロットリングがどのように明らかにされたか

2024 年 11 月 8 日に公開

ブラウズ：552

Go との個人プロジェクトで、Bovespa から金融資産に関する情報を取得します。
このシステムはゴルーチンによる同時実行性と並列性を最大限に活用し、8 秒ごとに資産情報 (ビジネス計算とともに) を更新します。
当初、エラーや警告は表示されませんでしたが、一部のゴルーチンの実行に他のゴルーチンよりも時間がかかっていることに気付きました。

より具体的には、p99 時間は 0.03 ms でしたが、ある時点では 0.9 ms まで増加しました。これにより、問題をさらに調査することになりました。

GOMAXPROCS 変数に基づいて作成されたセマフォ goroutine プールを使用していることがわかりました。
しかし、このアプローチには問題があることに気づきました。

GOMAXPROCS 変数を使用すると、コンテナーで使用可能なコアの数が正しく取得されません。コンテナーの使用可能なコアが VM の合計よりも少ない場合、VM の合計が考慮されます。たとえば、私の VM には利用可能なコアが 8 個ありますが、コンテナーには 4 個しかありませんでした。その結果、同時に実行する 8 つのゴルーチンが作成され、スロットリングが発生しました。

一晩かけて多くの調査を行った結果、コンテナ内にあるかどうかに関係なく、GOMAXPROCS 変数をより効率的に自動的に調整する Uber によって開発されたライブラリを発見しました。このソリューションは非常に安定していて効率的であることが証明されました: automaxprocs

ウーバーゴー / automaxproc

Linux コンテナーの CPU クォータと一致するように GOMAXPROCS を自動的に設定します。

automaxprocs

Linux コンテナーの CPU クォータと一致するように GOMAXPROCS を自動的に設定します。

インストール

go get -u go.uber.org/automaxprocs

クイックスタート

import _ "go.uber.org/automaxprocs"

func main() {
  // Your application logic here.
}

パフォーマンス

Uber の内部ロードバランサーから測定されたデータ。 200% の CPU クォータ (つまり 2 コア) でロードバランサーを実行しました:

GOMAXPROCS	RPS	P50 (ミリ秒)	P99.9 (ミリ秒)
1	28,893.18	1.46	19.70
2 (クォータと等しい)	44,715.07	0.84	26.38
3	44,212.93	0.66	30.07
4	41,071.15	0.57	42.94
8	33,111.69	0.43	64.32
デフォルト (24)	22,191.40	0.45	76.19

GOMAXPROCS が CPU クォータを超えて増加すると、P50 はわずかに減少しますが、P99 まで大幅に増加します。また、処理される合計 RPS も減少していることがわかります。

GOMAXPROCS が割り当てられた CPU クォータよりも高い場合、大幅なスロットルも発生しました:

$ cat /sys/fs/cgroup/cpu,cpuacct/system.slice/[...]/cpu.stat
nr_periods 42227334
nr_throttled 131923
throttled_time 88613212216618

GOMAXPROCS が CPU クォータに一致するように削減されると、CPU スロットルは発生しなくなりました。

…

GitHub で表示

。

このライブラリの使用を実装した後、問題は解決され、p99 時間は常に 0.02 ms のままになりました。この経験により、同時システムにおける可観測性とプロファイリングの重要性が強調されました。

以下は非常に単純な例ですが、パフォーマンスの違いを示しています。

Go のネイティブテストと benckmak パッケージを使用して、2 つのファイルを作成しました:

benchmarking_with_enhancement_test.go:

package main

import (
    _ "go.uber.org/automaxprocs"
    "runtime"
    "sync"
    "testing"
)

// BenchmarkWithEnhancement Função com melhoria, para adicionar o indice do loop em um array de inteiro
func BenchmarkWithEnhancement(b *testing.B) {
    // Obtém o número de CPUs disponíveis
    numCPUs := runtime.NumCPU()
    // Define o máximo de CPUs para serem usadas pelo programa
    maxGoroutines := runtime.GOMAXPROCS(numCPUs)
    // Criação do semáforo
    semaphore := make(chan struct{}, maxGoroutines)

    var (
        // Espera para grupo de goroutines finalizar
        wg sync.WaitGroup
        // Propriade
        mu sync.Mutex
        // Lista para armazenar inteiros
        list []int
    )

    // Loop com mihão de indices
    for i := 0; i 



benchmarking_without_enhancement_test.go:



package main

import (
    "runtime"
    "sync"
    "testing"
)

// BenchmarkWithoutEnhancement Função sem a melhoria, para adicionar o indice do loop em um array de inteiro
func BenchmarkWithoutEnhancement(b *testing.B) {
    // Obtém o número de CPUs disponíveis
    numCPUs := runtime.NumCPU()
    // Define o máximo de CPUs para serem usadas pelo programa
    maxGoroutines := runtime.GOMAXPROCS(numCPUs)
    // Criação do semáforo
    semaphore := make(chan struct{}, maxGoroutines)

    var (
        // Espera para grupo de goroutines finalizar
        wg sync.WaitGroup
        // Propriade
        mu sync.Mutex
        // Lista para armazenar inteiros
        list []int
    )

    // Loop com mihão de indices
    for i := 0; i 



これらの違いは、Uber ライブラリのインポートを使用することです。

2 つの CPU が使用されると想定してベンチマークを実行した場合、結果は次のようになりました。



ns/op: 特定の操作の実行にかかる時間の平均をナノ秒単位で提供します。

使用可能な CPU の合計は 8 コアであり、これが runtime.NumCPU() プロパティによって返されたものであることに注意してください。ただし、ベンチマークの実行時と同様に、使用する CPU は 2 つだけであると定義し、automaxprocs を使用しないファイルでは、一度に実行できるゴルーチンの制限が 8 つであり、最も効率的なのは 2 つであると定義しました。この方法では、割り当てを少なくすることで実行がより効率的になります。

したがって、アプリケーションの可観測性とプロファイリングの重要性は明らかです。

リリースステートメントこの記事は次の場所に転載されています: https://dev.to/mggcmatheus/golang-como-a-observabilidade-e-profiling-revelaram-um-throttling-quase-indetectavel-1h5p?1 侵害がある場合は、study_golang にご連絡ください。 @163.com 削除

最新のチュートリアルもっと>

formdata（）で複数のファイルアップロードを処理するにはどうすればよいですか？
formdata（）を使用して複数のファイルアップロードを処理すると、複数のファイルアップロードを処理する必要があることがよくあります。 fd.append("fileToUpload[]", files[x]);メソッドはこの目的に使用でき、単一のリクエストで複数...

プログラミング 2025-04-20に投稿しました
さまざまな数の列を持つデータベーステーブルを結合するにはどうすればよいですか？
異なる列とのテーブルを組み合わせた ] は、データベーステーブルを異なる列とマージしようとする場合に課題に遭遇する可能性があります。簡単な方法は、列が少ないテーブルに欠落している列にnull値を追加することです。たとえば、テーブルAと表Bの2つの表Aと表AがテーブルBよりも多くの列がある...

プログラミング 2025-04-20に投稿しました
GO言語ガベージコレクションでスライスメモリを処理する方法は？
Go slices：aftertial analysis *q =（*q）[1：len（*q）] rを返します } FUNCプッシュバック（Q *[]文字列、文字列）{ *q = append（*q、a） } この場合、要素が正面からポップされると、スライスが...

プログラミング 2025-04-20に投稿しました
匿名のJavaScriptイベントハンドラーをきれいに削除する方法は？
匿名イベントリスナーを削除する]イベントリスナーを追加する要素を追加すると、柔軟性とシンプルさを提供しますが、要素自体を置き換えることなく挑戦をもたらすことができます。 element？ element.addeventlistener（event、function（）{/はここで動作し...

プログラミング 2025-04-20に投稿しました
PHPの配列からランダムな要素をどのように抽出しますか？
配列からのランダム選択は、配列からランダムなアイテムを取得することができます。次の配列を検討してください： $items = [523, 3452, 334, 31, 5346]; この配列からランダムなアイテムを取得するために、array_rand（）関数を利用することは効果的なソリューシ...

プログラミング 2025-04-20に投稿しました
すべてのブラウザでテキストを左調整するスラッシュメソッドを実装する
] ] text line background background を斜めのラインで左に並べたテキストを達成することは、課題を引き起こす可能性があります。互換性（IE9に戻る）。 .lop（（@i -1））; .space@{i} { 幅：floor（@i*@hsize...

プログラミング 2025-04-20に投稿しました
UTF8 MySQLテーブルでLATIN1文字をUTF8に正しく変換する方法
latin1文字をUTF8テーブル内のutf8に変換する diaCriticsのキャラクターが遭遇した問題に遭遇しました（ "Jáuòiñe"）がUTF8テーブルで存在していないために、utf8テーブルが不足しているために存在していませんでした。「mysql_se...

プログラミング 2025-04-20に投稿しました
Laravel Bladeテンプレートの変数をエレガントに定義するにはどうすればよいですか？
Laravel Bladeテンプレートの変数を優雅さで定義するブレードテンプレートに変数を割り当てる方法を理解することは、後で使用するためにデータを保存するために重要です。「{{{{}}}」を使用して変数を割り当てるのは簡単ですが、常に最もエレガントなソリューションであるとは限りませ...

プログラミング 2025-04-20に投稿しました
Javaのコレクショントラバーサルのために、for-for-eachループとイテレーターを使用することにパフォーマンスの違いはありますか？
vs. Iterator：コレクショントラバーサルの効率この記事では、これら2つのアプローチの効率の違いを調査します。内部的にiteratorを使用します： list a = new ArrayList （）; for（整数整数：a）{ integer.toString（）; } ...

プログラミング 2025-04-20に投稿しました
セル編集後にカスタムJTableセルレンダリングを維持するにはどうすればよいですか？
セル編集後のjtableセルレンダリングの維持は、カスタムセルのレンダリングと編集機能を実装することでユーザーエクスペリエンスを向上させることができます。ただし、操作を編集した後でも目的のフォーマットが保存されることを保証することが重要です。このようなシナリオでは、編集がコミットされた後...

プログラミング 2025-04-20に投稿しました
なぜ有効なコードにもかかわらず、PHPで入力をキャプチャするリクエストを要求するのはなぜですか？
アドレス指定Php action='' を使用して、フォームの提出後に$ _POSTアレイの内容を確認します。適切に： if（empty（$ _ server ['content_type']）） { $ _Server ['content_typ...

プログラミング 2025-04-20に投稿しました
非同期操作を同時に実行し、JavaScriptでエラーを正しく処理する方法は？
並行操作実行を待つ問題のコードスニペットは非同期操作を実行する際の問題に遭遇します：この実装は、次の操作を開始する前に各操作の完了を順次待ちます。同時実行を有効にするには、修正されたアプローチが必要です。 getValue2async（）; const value1 = awa...

プログラミング 2025-04-20に投稿しました
なぜ画像はまだChromeに境界があるのですか？ `border：none;`無効な解決策
cromeの画像境界を削除する 1つの頻繁な問題は、chromeとie9の画像を操作する際に遭遇する頻繁な問題です。と「国境：なし;」 CSSで。この問題を解決するには、次のアプローチを検討してください。スタイル。これを回避するには、次のCSS IDブロックを使用して、目的のパディング...

プログラミング 2025-04-20に投稿しました
なぜ `body {margin：0; } `常にCSSの上限を削除しますか？
css の扱います。多くの場合、「ボディ{マージン：0;}」などの提供されたコードは、目的の結果を生成しません。これは、コンテンツの親要素が正のパディング値を持っている場合に発生する可能性があります。特定のマージンの問題に対処することをお勧めします。親要素にパディングがある場合、それを...

プログラミング 2025-04-20に投稿しました
なぜJavaに署名されていない整数がないのですか？
Javaが署名されていない腸の不在を理解するは、オーバーフロー、自己文書化、効率的なゲイン、&& Javaのクリエイターの1人であるGoslingは、シンプルさを主な理由として引用しました。ゴスリングは、ほとんどの人が完全に把握するのに苦労するコーナーケースとニュアンスを追加することに...

プログラミング 2025-04-20に投稿しました