表紙 > プログラミング > Golang: 可観測性とプロファイリングにより、ほぼ検出不可能なスロットリングがどのように明らかにされたか

Golang: 可観測性とプロファイリングにより、ほぼ検出不可能なスロットリングがどのように明らかにされたか

2024 年 11 月 8 日に公開

ブラウズ：951

Go との個人プロジェクトで、Bovespa から金融資産に関する情報を取得します。
このシステムはゴルーチンによる同時実行性と並列性を最大限に活用し、8 秒ごとに資産情報 (ビジネス計算とともに) を更新します。
当初、エラーや警告は表示されませんでしたが、一部のゴルーチンの実行に他のゴルーチンよりも時間がかかっていることに気付きました。

より具体的には、p99 時間は 0.03 ms でしたが、ある時点では 0.9 ms まで増加しました。これにより、問題をさらに調査することになりました。

GOMAXPROCS 変数に基づいて作成されたセマフォ goroutine プールを使用していることがわかりました。
しかし、このアプローチには問題があることに気づきました。

GOMAXPROCS 変数を使用すると、コンテナーで使用可能なコアの数が正しく取得されません。コンテナーの使用可能なコアが VM の合計よりも少ない場合、VM の合計が考慮されます。たとえば、私の VM には利用可能なコアが 8 個ありますが、コンテナーには 4 個しかありませんでした。その結果、同時に実行する 8 つのゴルーチンが作成され、スロットリングが発生しました。

一晩かけて多くの調査を行った結果、コンテナ内にあるかどうかに関係なく、GOMAXPROCS 変数をより効率的に自動的に調整する Uber によって開発されたライブラリを発見しました。このソリューションは非常に安定していて効率的であることが証明されました: automaxprocs

ウーバーゴー / automaxproc

Linux コンテナーの CPU クォータと一致するように GOMAXPROCS を自動的に設定します。

automaxprocs

Linux コンテナーの CPU クォータと一致するように GOMAXPROCS を自動的に設定します。

インストール

go get -u go.uber.org/automaxprocs

クイックスタート

import _ "go.uber.org/automaxprocs"

func main() {
  // Your application logic here.
}

パフォーマンス

Uber の内部ロードバランサーから測定されたデータ。 200% の CPU クォータ (つまり 2 コア) でロードバランサーを実行しました:

GOMAXPROCS	RPS	P50 (ミリ秒)	P99.9 (ミリ秒)
1	28,893.18	1.46	19.70
2 (クォータと等しい)	44,715.07	0.84	26.38
3	44,212.93	0.66	30.07
4	41,071.15	0.57	42.94
8	33,111.69	0.43	64.32
デフォルト (24)	22,191.40	0.45	76.19

GOMAXPROCS が CPU クォータを超えて増加すると、P50 はわずかに減少しますが、P99 まで大幅に増加します。また、処理される合計 RPS も減少していることがわかります。

GOMAXPROCS が割り当てられた CPU クォータよりも高い場合、大幅なスロットルも発生しました:

$ cat /sys/fs/cgroup/cpu,cpuacct/system.slice/[...]/cpu.stat
nr_periods 42227334
nr_throttled 131923
throttled_time 88613212216618

GOMAXPROCS が CPU クォータに一致するように削減されると、CPU スロットルは発生しなくなりました。

…

GitHub で表示

。

このライブラリの使用を実装した後、問題は解決され、p99 時間は常に 0.02 ms のままになりました。この経験により、同時システムにおける可観測性とプロファイリングの重要性が強調されました。

以下は非常に単純な例ですが、パフォーマンスの違いを示しています。

Go のネイティブテストと benckmak パッケージを使用して、2 つのファイルを作成しました:

benchmarking_with_enhancement_test.go:

package main

import (
    _ "go.uber.org/automaxprocs"
    "runtime"
    "sync"
    "testing"
)

// BenchmarkWithEnhancement Função com melhoria, para adicionar o indice do loop em um array de inteiro
func BenchmarkWithEnhancement(b *testing.B) {
    // Obtém o número de CPUs disponíveis
    numCPUs := runtime.NumCPU()
    // Define o máximo de CPUs para serem usadas pelo programa
    maxGoroutines := runtime.GOMAXPROCS(numCPUs)
    // Criação do semáforo
    semaphore := make(chan struct{}, maxGoroutines)

    var (
        // Espera para grupo de goroutines finalizar
        wg sync.WaitGroup
        // Propriade
        mu sync.Mutex
        // Lista para armazenar inteiros
        list []int
    )

    // Loop com mihão de indices
    for i := 0; i 



benchmarking_without_enhancement_test.go:



package main

import (
    "runtime"
    "sync"
    "testing"
)

// BenchmarkWithoutEnhancement Função sem a melhoria, para adicionar o indice do loop em um array de inteiro
func BenchmarkWithoutEnhancement(b *testing.B) {
    // Obtém o número de CPUs disponíveis
    numCPUs := runtime.NumCPU()
    // Define o máximo de CPUs para serem usadas pelo programa
    maxGoroutines := runtime.GOMAXPROCS(numCPUs)
    // Criação do semáforo
    semaphore := make(chan struct{}, maxGoroutines)

    var (
        // Espera para grupo de goroutines finalizar
        wg sync.WaitGroup
        // Propriade
        mu sync.Mutex
        // Lista para armazenar inteiros
        list []int
    )

    // Loop com mihão de indices
    for i := 0; i 



これらの違いは、Uber ライブラリのインポートを使用することです。

2 つの CPU が使用されると想定してベンチマークを実行した場合、結果は次のようになりました。



ns/op: 特定の操作の実行にかかる時間の平均をナノ秒単位で提供します。

使用可能な CPU の合計は 8 コアであり、これが runtime.NumCPU() プロパティによって返されたものであることに注意してください。ただし、ベンチマークの実行時と同様に、使用する CPU は 2 つだけであると定義し、automaxprocs を使用しないファイルでは、一度に実行できるゴルーチンの制限が 8 つであり、最も効率的なのは 2 つであると定義しました。この方法では、割り当てを少なくすることで実行がより効率的になります。

したがって、アプリケーションの可観測性とプロファイリングの重要性は明らかです。

リリースステートメントこの記事は次の場所に転載されています: https://dev.to/mggcmatheus/golang-como-a-observabilidade-e-profiling-revelaram-um-throttling-quase-indetectavel-1h5p?1 侵害がある場合は、study_golang にご連絡ください。 @163.com 削除

最新のチュートリアルもっと>

formdata（）で複数のファイルアップロードを処理するにはどうすればよいですか？
formdata（）を使用して複数のファイルアップロードを処理すると、複数のファイルアップロードを処理する必要があることがよくあります。 fd.append("fileToUpload[]", files[x]);メソッドはこの目的に使用でき、単一のリクエストで複数...

プログラミング 2025-04-30に投稿されました
GOでSQLクエリを構築するときに、テキストと値を安全に連結するにはどうすればよいですか？
go sql queries のテキストと値を連結するgoのテキストsqlクエリを構築する際に、特に文字列を使用した場合、文字列を使用した場合に、文字列を使用する場合、アプローチはGOでは有効ではなく、文字列としてパラメーターをキャストしようとすると、タイプのミスマッチエラーが発生しま...

プログラミング 2025-04-30に投稿されました
$最大カウントを見つけるときにmysqlで\ "無効なグループ関数の使用を解決する方法\"エラーは？$
最大カウントを見つけるときにmysqlで\ "無効なグループ関数の使用を解決する方法\"エラーは？
mysql を使用して最大カウントを取得する方法mysqlでは、次のコマンドを使用して特定の列によってグループ化された値の最大値を見つけようとする際に問題に遭遇する可能性があります。 emp1グループからmax（count（*））を名前で選択します。エラー1111（HY000）：グル...

プログラミング 2025-04-30に投稿されました
Firefoxバックボタンを使用すると、JavaScriptの実行が停止するのはなぜですか？
navigational Historyの問題：JavaScriptは、Firefoxバックボタンを使用した後に実行を停止しますユーザーは、JavaScriptスクリプトが以前の訪問ページを介して回復したときに実行されない問題に遭遇する可能性があります。この問題は、ChromeやInt...

プログラミング 2025-04-30に投稿されました
オブジェクトフィット：IEとEdgeでカバーが失敗します、修正方法は？
object-fit：カバーがIEとEDGEで失敗します。 CSSでは、一貫した画像の高さを維持するために、ブラウザ全体でシームレスに動作します。ただし、IEとEdgeでは、独特の問題が発生します。ブラウザをスケーリングすると、画像は高さをズームするのではなく幅でサイズを変更し、外観を歪め...

プログラミング 2025-04-30に投稿されました
PHPとC ++関数の過負荷処理の違い
PHP関数の過負荷：cの観点から謎を解き明かす PHPの領域に挑戦する経験豊富なC開発者として、関数過負荷の概念に遭遇するかもしれません。この概念は、Cではありふれたものですが、PHPでユニークな課題を提起しています。 PHP関数の過負荷の複雑さを掘り下げて、それが提供する可能性を掘り下げ...

プログラミング 2025-04-30に投稿されました
Pythonの理解を使用して辞書を効率的に作成するにはどうすればよいですか？
python辞書の理解 Pythonでは、辞書の概念は新しい辞書を生成するための簡潔な方法を提供します。それらはリストの概念に似ていますが、いくつかの顕著な違いがあります。キーと値を明示的に指定する必要があります。たとえば、 d = {n：n ** 2の範囲（5）} これは、0から4の...

プログラミング 2025-04-30に投稿されました
プロキシサーバーとは何ですか？ネットワークを復号化する仲介者
プロキシサーバーとは何ですか？この例を考慮してください。ここでは、アリスとボブの二人を見ることができます。真ん中にプロキシがあります。アリスはプロキシにメッセージを彼に転送するように頼みました、ボブも同じことをします。プロキシは、ここでこれらの2人の間に情報を渡す仲介...

プログラミング 2025-04-30に投稿されました
なぜsqlalchemyフィルター条項で「flake8」はブールの比較にフラグを立てるのですか？
flake8 Flake8 Flake8フラグをフィルター節のブール比較 SQLのブール比較に基づいてクエリ結果をフィルタリングしようとすると、開発者は「==」の使用に関してFLAKE8から警告を発する可能性があります。一般に、「condがfalse」または「condではない場合：」を...

プログラミング 2025-04-30に投稿されました
Appengineでは、エラー「ファイルタイプを推測できない、アプリケーション/Octet-Streamを使用できません...」を解くにはどうすればよいですか？
appengine static file mime mime type override appengineでは、正しいマイムタイプを時々オーバーライドすることができます。 Application/Octet-Stream ... " 問題解決 ]を修正し、...

プログラミング 2025-04-30に投稿されました
JavaScriptオブジェクトにキーを動的に設定する方法は？
JavaScriptオブジェクト変数の動的キーを作成する方法この構文jsObj['key' i] = 'example' 1; はjavascriptで、アレイは特殊なタイプのオブジェクトです。この特別な動作は標準のオブジェクトによって模倣されていませんが、四角いブラケット演算子は...

プログラミング 2025-04-30に投稿されました
PostgreSQLの各一意の識別子の最後の行を効率的に取得するにはどうすればよいですか？
postgresql：各一意の識別子の最後の行を抽出します。次のデータを検討してください： select distinct on (id) id, date, another_info from the_table order by id, date desc; データセット内の一...

プログラミング 2025-04-30に投稿されました
$Linuxサーバーにarchive_zipをインストールした後、\ "class \ 'ziparchive \'が見つかりません\"エラーを取得するのはなぜですか？$
Linuxサーバーにarchive_zipをインストールした後、\ "class \ 'ziparchive \'が見つかりません\"エラーを取得するのはなぜですか？
class 'ziparchive' linuxサーバーにarchive_zipをインストールする際のエラーは見つかりません症状：を実行しようとするときに、Ziparkive follingive folling_zip 0.1.1.1.1.1.1.1.1.1.1.1...

プログラミング 2025-04-30に投稿されました
Java開発者は、データベースの資格情報を逆コンパイルからどのように保護しますか？
データベース資格情報をJava のjavaで保護することは、クラスファイルを比較的簡単です。これは、データベース資格情報などの機密データがコード内でハードコーディングされている場合、セキュリティの懸念をもたらします。この情報を保護するには、実行可能なコードからそれを分離することが不可欠に...

プログラミング 2025-04-30に投稿されました
なぜ「ポジション：粘着性」と「ボトム：0」がMDN説明の反対ですか？
位置の反対の動作：底部：0 位置を指定する場合：bottom：0に付着する場合、mdnが提供する定義とは異なる動作をします。要素が最初にしきい値を超えて固定されるまで比較的配置されたものとして最初に扱われる説明とは異なり、bottom：0が指定します。 footer { ...

プログラミング 2025-04-30に投稿されました