ZigとPythonを備えたパフォーマンスと拡張可能なWebサーバー

表紙 > プログラミング > ZigとPythonを備えたパフォーマンスと拡張可能なWebサーバー

ZigとPythonを備えたパフォーマンスと拡張可能なWebサーバー

2025-03-22に投稿されました

ブラウズ：305

序文

私はソフトウェア開発への関心、特に可能な限り少ない妥協を行いながら最も広範な問題を解決する人間工学に基づいたソフトウェアシステムを作成するパズルに情熱を注いでいます。また、Andrew Kelleyの定義により、作業中のシステムを完全に理解することに関心のある開発者を意味するシステム開発者と考えたいと思います。このブログでは、次の問題を解決するための私のアイデアを共有しています。かなりの挑戦ですね。ブログでは、「パフォーマンスのWebサーバー」の部分に焦点を当てています。これは、残りが十分に踏まれているか、追加するものがないので、新鮮な視点を提供できると感じています。大きな警告 -

はコードサンプル

がありません。実際にこれをテストしていません。うん、これは大きな欠陥ですが、実際にこれを実装するには多くの時間がかかりますが、私は持っていません。欠陥のあるブログを公開してまったく公開しない間、私は前者に固執しました。あなたは警告されています。

A performant and extensible Web Server with Zig and Python そして、アプリケーションをどのピースから組み立てますか？

快適なフロントエンドですが、最小限の依存関係が必要な場合は、wasm form htmxにzigがあります。

Linuxカーネルと密接に統合されたZig Webサーバー。これは、このブログで焦点を当てるパフォーマンスの部分です。
zigと統合されたPythonバックエンド。これが複雑な部分です。
一時的で流れやすいなどの耐久性のある実行システムとの統合。これは信頼性を支援し、ブログでは議論されません。

とにかくCoroutinesは過大評価されていますか？

ZigにはCoroutinesの言語レベルのサポートがありません:(コルーチンは、すべてのパフォーマントWebサーバーが構築されているものです。

保持、最初にシステムプログラマーの帽子をかぶってみましょう。コルーチンは銀の弾丸ではなく、何もありません。実際の利点と欠点は何ですか？

Coroutines（ユーザースペーススレッド）がより軽量で高速であることは一般的な知識です。しかし、正確にどのような方法で？（ここでの答えは主に憶測であり、一粒の塩を取り、自分でそれをテストしてください）

デフォルトでは、スタックスペースが少ない（4MBではなく2kb）から始めます。しかし、これは手動で調整できます。

たとえば、GOランタイムは、OSスレッドにゴルチンをマルチプレックスします。スレッドは、プロセスが所有する他のリソースと同様に、ページテーブルを共有します。ミックスにCPUの分離と親和性を導入すると、スレッドがそれぞれのCPUコアで継続的に実行されると、すべてのOSデータ構造はメモリに留まり、交換する必要はありません。競争は可能ですか？ A performant and extensible Web Server with Zig and Python

パフォーマンスの勝利は、スレッドのOSレベルの抽象化を傍観し、それをゴルーチンの抽象化に置き換えることで達成されます。しかし、翻訳では何も失われていませんか？

カーネルと協力できますか？

独立した実行ユニットの「真の」OSレベルの抽象化はスレッドでさえないと主張します - 実際にはOSプロセスです。実際、ここでの区別はそれほど明白ではありません - スレッドとプロセスを区別するのは、異なるPIDとTID値だけです。ファイル記述子、仮想メモリ、信号ハンドラー、追跡されたリソースについては、これらが「クローン」syscallの引数で指定されているかどうか。したがって、「プロセス」という用語を使用して、主にCPU時間、メモリ、オープンファイル記述子を所有する独自のシステムリソースを所有する実行スレッドを意味します。

。

今、なぜこれが重要なのですか？実行の各ユニットには、システムリソースに対する独自の要求があります。各複雑なタスクはユニットに分解できます。各タスクでは、それぞれがリソースの予測可能なリクエスト - メモリとCPU時間を作成できます。そして、より一般的なタスクに向かって、あなたが行くサブタスクの木をさらに上に上げると、システムリソースグラフは長い尾を持つベル曲線を形成します。そして、テールがシステムリソースの制限をオーバーランしないようにすることはあなたの責任です。しかし、それはどのように行われ、その制限が実際にオーバーランした場合はどうなりますか？ A performant and extensible Web Server with Zig and Python

単一のプロセスのモデルと独立したタスクに多くのコルーチンを使用すると、1つのコルーチンがメモリの制限をオーバーランする場合 - メモリ使用量がプロセスレベルで追跡されるため、プロセス全体が殺されます。それは最良のケースです - あなたがcgroupsを使用する場合（これは自動的にポッドあたりのcgroupを持っているKubernetesのポッドの場合です） - cgroup全体が殺されます。信頼できるシステムを作成するには、これを考慮に入れる必要があります。そして、CPU時間はどうですか？当社のサービスが同時に多くの計算集約型のリクエストでヒットした場合、それは反応しなくなります。その後、締め切り、キャンセル、再試行、再起動が続きます。

ほとんどの主流のソフトウェアスタックのこれらのシナリオに対処する唯一の現実的な方法は、システムに「脂肪」を残し、ベルカーブの尾の未使用のリソース - と同時リクエストの数を制限することです。そして、それでも、私たちは時々OOMを殺したり、時々反応したりします。この妥協は多くの人に受け入れられ、実際にソフトウェアシステムに十分にサービスを提供しています。しかし、私たちはもっとうまくやることができますか？

並行性モデル

リソースの使用はプロセスごとに追跡されるため、理想的には、小さな予測可能な実行ユニットごとに新しいプロセスを生成します。次に、CPUの時間と記憶のためにUlimitを設定します - そして、私たちは行ってもいいです！ Ulimitにはソフトとハードリミットがあります。これにより、プロセスはソフトリミットを打つと優雅に終了することができます。それが発生しない場合は、おそらくバグが原因で、ハードリミットを打つと強制的に終了します。残念ながら、Linuxで新しいプロセスを生み出すことは遅く、リクエストごとに新しいプロセスを生み出すことは、多くのWebフレームワークやThipporalなどの他のシステムではサポートされていません。さらに、プロセスの切り替えはより高価です - これは牛とCPUのピン留めによって軽減されますが、それでも理想的ではありません。残念ながら、長期にわたるプロセスは避けられない現実です。

短命のプロセスのきれいな抽象化からさらに進むほど、OSレベルの作業が必要になります。しかし、多くの実行スレッド間でIOをバッチするためにIO_IRINGを使用するなど、得られるメリットもあります。実際、大規模なタスクがサブタスクで構成されている場合、私たちは彼らの個々のリソースの利用を本当に気にしますか？プロファイリングのみ。しかし、大きなタスクのために、リソースベルカーブの尾を管理する（切り取る）ことができれば、それは十分に良いでしょう。したがって、同時に処理したい要求と同じくらい多くのプロセスを生み出し、それらを長寿命にし、新しいリクエストごとにulimitを再調整することができます。そのため、リクエストがリソースの制約をオーバーランすると、OS信号が取得され、他のリクエストが認められず、優雅に終了することができます。または、高いリソースの使用が意図的である場合、クライアントに、より高いリソースの割り当てにお金を払うように伝えることができます。私にはかなりいいですね。 A performant and extensible Web Server with Zig and Python

しかし、リクエストあたりのコルーチンのアプローチと比較して、パフォーマンスは依然として損なわれます。まず、プロセスメモリテーブルの周りにコピーするのは高価です。テーブルにはメモリページへの参照が含まれているため、巨大なページを利用できるため、コピーするデータのサイズが制限されます。これは、Zigなどの低レベルの言語でのみ直接可能です。さらに、OSレベルのマルチタスクは先制的であり、協調性ではなく、常に効率が低くなります。それとも？

Linuxを使用した協同マルチタスク

Syscall Sched_yieldがあります。これにより、スレッドが作業の一部を完了したときにCPUを放棄することができます。非常に協力的なようです。特定のサイズの時間スライスを要求する方法はありますか？実際、スケジューリングポリシーSched_Deadlineにあります。これはリアルタイムポリシーです。つまり、要求されたCPU時間スライスでは、スレッドが途切れることなく実行されます。しかし、スライスがオーバーランしている場合 - 先制が始まり、スレッドが交換されて剥奪されます。また、スライスがアンダーランの場合 - スレッドはSched_Yieldを呼び出して早期フィニッシュを信号し、他のスレッドを実行できるようにします。それは両方の世界の最高のように見えます - 協同組合と前提条件のモデル。

制限とは、sched_deadlineスレッドがフォークできないという事実です。これにより、2つのモデルが並行しています。リクエストごとのプロセス、それ自体の締め切りを設定し、効率的なIOのためにイベントループを実行するか、それぞれが独自の期限を設定し、互いに通信するためのキューを使用する各マイクロタスクのスレッドを生成するプロセスを実行します。前者はよりシュトラフワードですが、ユーザースペースでイベントループが必要であり、後者はカーネルをより多く使用します。 A performant and extensible Web Server with Zig and Python 。

両方の戦略は、カーネルと協力することにより、Coroutineモデルと同じ終わりを達成します。

埋め込まれたスクリプト言語としてのPython

これは、ジグが輝く場所の高性能で低レベルの低レベルの側面のためのすべてです。しかし、アプリケーションの実際のビジネスに関しては、柔軟性は待ち時間よりもはるかに価値があります。プロセスに本物の人々がドキュメントにサインオフすることを含む場合、コンピューターの遅延は無視できます。また、パフォーマンスに苦しんでいるにもかかわらず、オブジェクト指向の言語は、開発者にビジネスのドメインをモデル化するためのより良いプリミティブを提供します。そして、これの最も遠い端で、FlowableやCamundaなどのシステムにより、管理スタッフと運用スタッフは、より柔軟性とより低い入場障壁でビジネスロジックをプログラムすることができます。 Zigのような言語はこれには役に立たず、あなたの邪魔になるだけです。

Pythonは、一方で、最も動的な言語の1つです。クラス、オブジェクト - それらはすべてフードの下の辞書であり、あなたが好きなように実行時に操作することができます。これにはパフォーマンスのペナルティがありますが、クラスやオブジェクトを使用してビジネスをモデル化し、多くの巧妙なトリックを実用的にします。 Zigはそれの反対です - Zigには意図的に巧妙なトリックはほとんどありません。最大限のコントロールを提供します。彼らの力を相互運用させることで彼らの力を組み合わせることができますか？

実際には、両方ともC ABIをサポートしているためです。 PythonインタープリターをZigプロセス内から実行することができますが、別のプロセスとしてではなく、ランタイムコストと接着コードでオーバーヘッドを削減できます。これにより、Python内のZigのカスタムアロケーターを使用することができます。これは、個々のリクエストを処理するためのアリーナを設定するため、ガベージコレクターのオーバーヘッドを排除しない場合、メモリキャップを設定することができます。大きな制限は、Garbage CollectionとIOのCpythonランタイムスポーニングスレッドですが、それがそうであるという証拠は見つかりませんでした。 AbstractMemoryloopの「コンテキスト」フィールドを使用することにより、パイソンがZigのカスタムイベントループにZigのカスタムイベントループに接続できます。可能性は無限です。

A performant and extensible Web Server with Zig and Python 結論

並行性、並列性、およびOSカーネルとのさまざまな形態の統合のメリットについて説明しました。探索にはベンチマークとコードがありません。これは、提供されるアイデアの品質で補うことを願っています。似たようなことを試しましたか？あなたの考えは何ですか？フィードバック歓迎：）

さらに読む

https://linux.die.net/man/2/clone

https://man7.org/linux/man-pages/man7/sched.7.html

https://man7.org/linux/man-pages/man2/sched_yield.2.html

https://rigtorp.se/low-latency-guide/
https://eli.thegreenplace.net/2018/measuring-context-switching-and-memory-overheads-for-linux-threads/
https://hadar.gr/2017/lightweight-goroutines

リリースステートメントこの記事は、https：//dev.to/brogrammerjohn/a-performant-and-extensible-web-server with zig-and-python-4adl？1に再現されています。

最新のチュートリアルもっと>

カスタムHTML属性を使用する必要がありますか？
custom html属性：長所と短所分析カスタムHTML属性は、javascriptコードで使用するためにWebページに追加データを埋め込む手段として牽引力を獲得しました。しかし、この慣行は、その有効性と基準への遵守についての議論を引き起こしました。サーバー側とクライアント側のコード...

プログラミング 2025-03-23に投稿されました
GOのスライスについて話しましょう：アレイのダイナミックなデュオ！
だから、あなたは外に飛び込んで、スライスについて聞いています。「スライスとは何ですか？」あなたは不思議に思うかもしれません。アレイは十分ではありませんか？さて、それを分解しましょう！スライスはGOのキラー機能です。それらはアレイのようなものですが、はるかに涼しいです。動的で柔軟で、プログラムに必要...

プログラミング 2025-03-23に投稿されました
CSSを使用してChromeとFirefoxのコンソール出力を着色できますか？
javaScriptコンソールの色の表示は、クロムのコンソールを使用してエラー用の赤、警告用のオレンジ、コンソール用グリーンなどの色のテキストを表示することは可能です。メッセージ？回答はい、CSSを使用して、ChromeとFirefox（バージョン31以降）のコンソールに表示さ...

プログラミング 2025-03-23に投稿されました
C＃の大きな文字列内でサブストリングのすべての発生を見つけるにはどうすればよいですか？
c＃の大きな文字列内のすべてのサブストリング位置を見つける大きな文字列を操作する場合、特定のサブストリングのすべてのインスタンスを配置することとデータ分析には重要です。この記事では、そのようなすべてのインスタンスを見つけてインデックスをリストに保存するという課題について説明します。この...

プログラミング 2025-03-23に投稿されました
純粋なCSSでは、複数の粘着性要素を互いに積み重ねることができますか？
純粋なCSSで複数の粘着性要素を互いに積み重ねることは可能ですか？ここ： https://webthemez.com/demo/sticky-multi-header-scroll/index.html JavaScriptの実装ではなく、純粋なCSSを使用することのみです。複数の粘...

プログラミング 2025-03-23に投稿されました
さまざまな数の列を持つデータベーステーブルを結合するにはどうすればよいですか？
異なる列とのテーブルを組み合わせた ] は、データベーステーブルを異なる列とマージしようとする場合に課題に遭遇する可能性があります。簡単な方法は、列が少ないテーブルに欠落している列にnull値を追加することです。たとえば、表Aの2つの表Aと表Bを検討してください。表Aには、表Bよりも多く...

プログラミング 2025-03-23に投稿されました
$\ "while（1）vs。for（;;）：コンパイラの最適化はパフォーマンスの違いを排除しますか？\"$
\ "while（1）vs。for（;;）：コンパイラの最適化はパフォーマンスの違いを排除しますか？\"
while（1）vs。for（;;）：速度の違いはありますか？ loops？回答：では、ほとんどの最新のコンパイラでは、（1）と（;;）。コンパイラー： perl：の両方が（1）と（;;）が同じオプコードをもたらします。 1 入力 - > 2を入力します 2 NextSt...

プログラミング 2025-03-23に投稿されました
Microsoft Visual C ++が2フェーズテンプレートのインスタンス化を正しく実装できないのはなぜですか？
Microsoft Visual Cの「壊れた」2フェーズテンプレートのインスタンス化の謎問題声明：ユーザーは、Microsoft Visual C（MSVC）の懸念を表現する一般的な懸念を表明します。メカニズムの特定の側面は、予想どおりに動作できませんか？ただし、このチェックがテンプ...

プログラミング 2025-03-23に投稿されました
CSS「コンテンツ」プロパティを使用してFirefoxが画像を表示しないのはなぜですか？
firefox のコンテンツURLを使用して画像を表示します。これは、提供されたCSSクラスで見ることができます： .googlePic { content: url('../../img/googlePlusIcon.PNG'); margin-top: -6.5%;...

プログラミング 2025-03-23に投稿されました
$ポイントインポリゴン検出により効率的な方法：Ray TracingまたはMatplotlib \ 's path.contains_points？$
ポイントインポリゴン検出により効率的な方法：Ray TracingまたはMatplotlib \ 's path.contains_points？
Pythonの効率的なポイントインポリゴン検出ポリゴン内にあるかどうかを決定することは、計算ジオメトリの頻繁なタスクです。このタスクの効率的な方法を見つけることは、多数のポイントを評価する場合に有利です。ここでは、一般的に使用される2つの方法を調査して比較します：Ray TracingとM...

プログラミング 2025-03-23に投稿されました
なぜ `body {margin：0; } `常にCSSの上限を削除しますか？
css の扱います。多くの場合、「ボディ{マージン：0;}」などの提供されたコードは、目的の結果を生成しません。これは、コンテンツの親要素が正のパディング値を持っている場合に発生する可能性があります。特定のマージンの問題に対処することをお勧めします。親要素にパディングがある場合、それを...

プログラミング 2025-03-23に投稿されました
交換指令を使用して、GO modのモジュールパスの不一致を解決する方法は？
go mod のモジュールパスの不一致を克服するgo modを利用する場合、輸入パッケージと実際の輸入パスの間のパスミスマッチとのパスミスマッチで、第三者パッケージが別のパッケージをインポートする紛争に遭遇する可能性があります。エコーされたメッセージで示されているように、これはGo M...

プログラミング 2025-03-23に投稿されました
C ++のクラス宣言の外で静的データメンバーを定義する必要があるのはなぜですか？
静的データメンバーのメモリの割り当ての意味。

プログラミング 2025-03-23に投稿されました
FlexBoxと垂直スクロールをフルハイトレイアウトで効果的に組み合わせるにはどうすればよいですか？
FlexBoxと垂直スクロールをフルハイトレイアウトに統合するフルハイトアプリケーションを操作する場合、FlexBoxと垂直スクロールバーを組み合わせた場合、一般的な要件になります。ただし、フレックスボックスレイアウトのインタラクティブな性質により、課題を引き起こす可能性があります。こ...

プログラミング 2025-03-23に投稿されました
Goの文字列として保存されたfloat64値でJSON文字列をデコードする方法は？
jsonを文字列からfloat64にdecoded float64 in go float64値を含むjson文字列を解析すると、値がストリングとして格納されると課題を引き起こす可能性があります。この問題に対処するために、GOは簡単なソリューションを提供します。エラー： json：...

プログラミング 2025-03-23に投稿されました