Zig 및 Python이있는 성능 및 확장 가능한 웹 서버

첫 장 > 프로그램 작성 > Zig 및 Python이있는 성능 및 확장 가능한 웹 서버

Zig 및 Python이있는 성능 및 확장 가능한 웹 서버

2025-03-22에 게시되었습니다

검색:208

머리말

나는 소프트웨어 개발에 대한 나의 관심, 특히 가장 광범위한 문제를 해결하면서 가능한 한 적은 타협을하는 인체 공학적으로 소프트웨어 시스템을 만드는 퍼즐에 열정적입니다. 또한 Andrew Kelley의 정의에 의해 협력하는 시스템을 완전히 이해하는 데 관심이있는 개발자를 의미하는 시스템 개발자로 생각하고 싶습니다. 이 블로그에서는 다음과 같은 문제를 해결하는 데 대한 내 아이디어를 공유합니다. 꽤 도전이 아니야? 블로그에서 나는 "Performant Web Server"부분에 중점을 둡니다. 그곳에서 나머지는 잘 정리되어 있거나 추가 할 것이 없기 때문에 새로운 관점을 제공 할 수 있다고 생각합니다. 주요 경고 -

코드 샘플이 없을 것입니다.

실제로 테스트하지 않았습니다. 그렇습니다. 이것은 큰 결함이지만 실제로는 이것을 구현하는 데는 많은 시간이 걸리지 않습니다. 내가 가지고 있지 않은 블로그를 게시하고 전혀 게시하지 않는 것 사이에서 나는 전자를 붙잡 았습니다. 당신은 경고를 받았습니다.

A performant and extensible Web Server with Zig and Python 그리고 우리는 응용 프로그램에서 어떤 부분을 조립합니까?

당신이 편한 프론트 엔드이지만 최소한의 종속성을 원한다면 wasm form htmx에 zig가 있습니다.

Linux 커널과 밀접하게 통합 된 zig 웹 서버. 이것은이 블로그에 집중할 수있는 성능 부분입니다.
zig와 통합 된 파이썬 백엔드. 이것은 복잡한 부분입니다.
시간 및 유동성과 같은 내구성있는 실행 시스템과의 통합. 이것은 신뢰성을 돕고 블로그에서 논의되지 않을 것입니다.

어쨌든 코 루틴이 과대 평가 되었습니까?

Zig는 코 루틴에 대한 언어 수준 지원이 없습니다.

Hold, on, 먼저 시스템 프로그래머 모자를 착용합시다. 코 루틴은은 총알이 아니며 아무것도 아닙니다. 실제 이점과 단점은 무엇입니까?

Coroutines (사용자 공간 스레드)가 더 높은 체중이 빠르고 빠르다는 것은 일반적인 지식입니다. 그러나 정확히 어떤면에서? (여기서 답은 대부분 추측입니다. 소금 한 알을 가져 가서 직접 테스트하십시오)

기본적으로 스택 공간이 적은 상태로 시작합니다 (4MB 대신 2KB). 그러나 이것은 수동으로 조정될 수 있습니다.

GO 런타임, 예를 들어, 멀티플렉스는 Goroutines를 OS 스레드로 향하게합니다. 스레드는 페이지 테이블과 프로세스가 소유 한 기타 리소스를 공유합니다. 믹스에 CPU 분리 및 친화력을 도입하면 스레드가 각각의 CPU 코어에서 지속적으로 실행되면 모든 OS 데이터 구조는 교환 할 필요없이 메모리에 머무르며, 사용자 공간 스케줄러는 협력적인 멀티 태스킹 모델을 사용하기 때문에 CPU 시간을 정밀도로 할당합니다. 경쟁은 가능합니까? A performant and extensible Web Server with Zig and Python

성능 승리는 스레드의 OS 수준의 추상화를 사이드로 교체하여 Goroutine의 것과 대체함으로써 달성됩니다. 그러나 번역에서 잃어버린 것은 없습니까?

커널과 협력 할 수 있습니까?

독립적 인 실행 단위에 대한 "진정한"OS 수준의 추상화는 스레드가 아니라고 주장 할 것입니다. 실제로 OS 프로세스입니다. 실제로, 여기서의 구별은 분명하지 않습니다. 스레드와 프로세스를 구별하는 모든 것은 다른 PID 및 TID 값입니다. 파일 설명자, 가상 메모리, 신호 처리기, 추적 리소스에 관해서는 자식이 "클론"SYSCALL에 대한 인수에 명시되어 있는지 여부. 따라서 "프로세스"라는 용어를 사용하여 자체 시스템 리소스를 소유 한 실행 스레드 (주로 CPU 시간, 메모리, 열린 파일 설명자)를 의미합니다.

이제 이것이 중요한 이유는 무엇입니까? 각 실행 단위에는 시스템 리소스에 대한 자체 요구가 있습니다. 각 복잡한 작업은 단위로 분류 될 수 있으며, 각 작업은 자체적으로 예측 가능하며 리소스 요청 (메모리 및 CPU 시간)을 만들 수 있습니다. 그리고 더 일반적인 작업을 향한 하위 작업의 트리가 더 커지면 시스템 리소스 그래프는 긴 꼬리가있는 종 곡선을 형성합니다. 그리고 꼬리가 시스템 리소스 제한을 초과하지 않도록하는 것은 귀하의 책임입니다. 그러나 어떻게 이루어지고, 그 한계가 실제로 초과되면 어떻게됩니까? A performant and extensible Web Server with Zig and Python

단일 프로세스의 모델과 독립 작업에 많은 코 루틴을 사용하는 경우, 하나의 코 루틴이 메모리 제한을 오버런 할 때 - 메모리 사용이 프로세스 수준에서 추적되므로 전체 프로세스가 죽습니다. CGROUPS (포드 당 CGroup이있는 Kubernetes의 포드의 경우)를 사용하는 경우 전체 CGroup이 죽습니다. 신뢰할 수있는 시스템을 만들려면이를 고려해야합니다. 그리고 CPU 시간은 어떻습니까? 많은 컴퓨팅 집약적 인 요청에 동시에 서비스를 받으면 응답이 없을 것입니다. 그런 다음 마감일, 취소, 회수, 다시 시작됩니다.

대부분의 주류 소프트웨어 스택에 대한 이러한 시나리오를 다루는 유일한 현실적인 방법은 시스템에 "지방"을 남기고 (벨 곡선의 꼬리에 대한 미사용 리소스)와 동시 요청 수를 제한하는 것입니다. 그럼에도 불구하고, 우리는 OM을 살해 당하거나 가끔씩 한 번에 한 번에 반응하지 않을 것입니다. 이러한 타협은 많은 사람들에게 허용되며 실제로 소프트웨어 시스템에 충분히 도움이됩니다. 하지만 우리는 더 잘할 수 있습니까?

동시성 모델

리소스 사용량은 프로세스 당 추적되므로 이상적으로는 예측 가능한 각 소규모 실행 단위에 대한 새로운 프로세스를 생성하는 것입니다. 그런 다음 CPU 시간과 기억을위한 Ulimit을 설정했습니다. Ulimit은 소프트 및 하드 제한을 가지고있어 소프트 한계에 부딪히면 프로세스가 우아하게 종료 될 수 있으며, 발생하지 않으면 버그로 인해 하드 한계를 치면 강제로 종료됩니다. 불행히도, Linux에서 새로운 프로세스를 산란하는 것은 느리기 때문에 많은 웹 프레임 워크와 Temporal과 같은 다른 시스템에서 요청 당 새로운 프로세스가 지원되지 않습니다. 또한, 프로세스 전환은 더 비싸다. 이는 Cow 및 CPU 고정으로 완화되지만 여전히 이상적이지 않다. 불행히도 장기 실행 프로세스는 피할 수없는 현실입니다.

짧은 수명의 프로세스의 깨끗한 추상화에서 더 많이 갈수록 OS 수준의 작업이 더 많을수록 우리 자신을 돌봐야합니다. 그러나 많은 실행 스레드 사이에서 IO를 배치하기 위해 io_uring을 사용하는 것과 같이 얻을 수있는 이점도 있습니다. 실제로, 큰 작업이 하위 작업으로 구성된 경우 - 우리는 그들의 개별 자원 활용에 실제로 관심이 있습니까? 프로파일 링을 위해서만. 그러나 큰 작업을 위해 자원 벨 곡선의 꼬리를 관리 (차단) 할 수 있다면 충분할 것입니다. 따라서 우리는 동시에 처리하고자하는 요청만큼 많은 프로세스를 스폰 할 수 있으며,이를 오래 지속되도록하고, 각각의 새로운 요청에 대해 Ulimit을 간단히 재조정합니다. 따라서 요청이 리소스 제약 조건을 오버런하면 OS 신호를 가져오고 다른 요청에 영향을 미치지 않고 우아하게 종료 할 수 있습니다. 또는 높은 리소스 사용량이 의도적 인 경우 고객에게 더 높은 리소스 할당량을 지불하도록 지시 할 수 있습니다. 나에게 꽤 좋은 것 같다. A performant and extensible Web Server with Zig and Python

그러나 요청 당 코 루틴 접근 방식에 비해 성능이 여전히 어려움을 겪을 것입니다. 첫째, 프로세스 메모리 테이블 주위를 복사하는 데 비용이 많이 듭니다. 테이블에는 메모리 페이지에 대한 참조가 포함되어 있으므로 거대한 페이지를 사용할 수 있으므로 데이터 크기를 복사 할 수 있습니다. 이것은 Zig와 같은 저수준 언어에서만 직접 가능합니다. 또한 OS 레벨 멀티 태스킹은 선제 적이며 협력 적이 아니며 항상 덜 효율적입니다. 아니면?

Linux를 사용한 협력 멀티 태스킹

syscall sched_yield가있어서 스레드가 작업 부분을 완료했을 때 CPU를 포기할 수 있습니다. 매우 협조적인 것 같습니다. 주어진 크기의 타임 슬라이스를 요청할 수있는 방법이있을 수 있습니까? 실제로 - 스케줄링 정책 sched_deadline이 있습니다. 이것은 실시간 정책으로, 요청 된 CPU 타임 슬라이스의 경우 스레드가 중단되지 않음을 의미합니다. 그러나 슬라이스가 오버런되면 선점이 시작되고 스레드가 교환되어 박탈 당합니다. 또한 슬라이스가 언더 런 인 경우 - 스레드는 Sched_Yield를 호출하여 조기 마감을 표시하여 다른 스레드를 실행할 수 있습니다. 그것은 두 세계의 최고처럼 보입니다 - 협력적이고 선사의 모델.

한계는 sched_deadline 스레드가 포크 할 수 없다는 사실입니다. 이로 인해 동시성에 대한 두 가지 모델이 남아 있습니다. 요청 당 프로세스 자체를 설정하고 효율적인 IO를위한 이벤트 루프 또는 시작부터 각 마이크로 작업에 대해 스레드를 스폰하고 각각의 마감일을 설정하고 서로 의사 소통을 위해 큐를 사용하는 프로세스가 제공됩니다. 전자는 더욱 추방적이지만 사용자 공간에서 이벤트 루프가 필요하며 후자는 커널을 더 많이 사용합니다. A performant and extensible Web Server with Zig and Python

두 전략 모두 커널과 협력하여 Coroutine 모델과 동일한 끝을 달성하면 최소한의 중단으로 응용 프로그램 작업을 실행할 수 있습니다

임베디드 스크립팅 언어로서의 파이썬 이것은 지그가 빛나는 고성능, 저도, 낮은 수준의 측면을위한 것입니다. 그러나 응용 프로그램의 실제 비즈니스와 관련하여 유연성은 대기 시간보다 훨씬 가치가 있습니다. 프로세스에 실제 사람들이 문서에 서명하는 경우 - 컴퓨터의 대기 시간은 무시할 수 있습니다. 또한 공연의 고통에도 불구하고 객체 지향 언어는 개발자에게 비즈니스 영역을 모델링 할 수있는 더 나은 프리미티브를 제공합니다. 그리고이 중 가장 먼 곳에서 Flowable 및 Camunda와 같은 시스템은 경영진 및 운영 직원이 더 많은 유연성과 더 낮은 입국 장벽으로 비즈니스 논리를 프로그래밍 할 수 있도록 허용합니다. Zig와 같은 언어는 이것에 도움이되지 않으며 당신의 방식으로 만 서 있습니다.

반면에 파이썬은 가장 역동적 인 언어 중 하나입니다. 클래스, 객체 - 그들은 후드 아래의 모든 사전이며, 당신이 좋아하지만 런타임에 조작 할 수 있습니다. 이는 성능 페널티가 있지만 클래스와 객체로 비즈니스를 모델링하고 많은 영리한 트릭을 실용적으로 만듭니다. 지그는 그 반대입니다. Zig에는 의도적으로 영리한 트릭이 거의 없으므로 최대의 제어를 제공합니다. 상호 작용하도록함으로써 그들의 힘을 결합 할 수 있습니까?

실제로 우리는 C ABI를 지원했기 때문에 우리는 할 수 있습니다. Python 통역사를 ZIG 프로세스 내에서 실행할 수 있으며 별도의 프로세스가 아니라 런타임 비용 및 접착제 코드의 오버 헤드를 줄일 수 있습니다. 이를 통해 파이썬 내에서 Zig의 맞춤형 할당자를 활용하여 개별 요청을 처리하기위한 경기장을 설정하여 쓰레기 수집기의 오버 헤드를 제거하지 않으면 메모리 캡을 설정할 수 있습니다. 주요 제한 사항은 쓰레기 수집 및 IO의 CPYTHON 런타임 스폰 스레드입니다. 그러나 나는 그 증거를 찾지 못했습니다. AbstractMemoryLoop의 "컨텍스트"필드를 사용하여 코 루틴 메모리 추적을 통해 Python을 Zig의 사용자 정의 이벤트 루프에 연결할 수 있습니다. 가능성은 무한합니다. A performant and extensible Web Server with Zig and Python

결론

우리는 동시성, 병렬 처리 및 다양한 형태의 OS 커널 통합의 장점에 대해 논의했습니다. 탐사에는 벤치 마크와 코드가 부족하여 제공되는 아이디어의 품질을 보완하기를 바랍니다. 비슷한 것을 시도해 보셨습니까? 당신의 생각은 무엇입니까? 피드백을 환영합니다 :)

추가 독서

https://linux.die.net/man/2/clone

https://man7.org/linux/man-pages/man7/sched.7.html

릴리스 선언문 이 기사는 https://dev.to/brogrammerjohn/a-performant-and-extensible-web-server-with-zig-and-python-4adl ?1에서 재현됩니다.

최신 튜토리얼 더>

파이썬에서 배관 출력시 인코딩을 어떻게 보존 할 수 있습니까?
#-*-코딩 : UTF-8-*- print (u "Åäö".encode ( 'utf-8')) 이것은 파이프가있는 출력이 대상 프로그램의 인코딩에 관계없이 유니 코드 표현과 일치하도록합니다. # -*- coding: ut...

프로그램 작성 2025-03-22에 게시되었습니다
교체 지시문을 사용하여 GO MOD에서 모듈 경로 불일치를 해결하는 방법은 무엇입니까?
[ github.com/coreos/coreos/client github.com/coreos/etcd/client.test imports github.com/coreos/etcd/integration에 의해 테스트 된 Echoed 메시지에 의해 입증 된 바와...

프로그램 작성 2025-03-22에 게시되었습니다
$Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?$
Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?
Ray Tracing MethodThe ray tracing method intersects a horizontal ray from the point under examination with the polygon's sides. 교차로의 수를 계산하고 지점이 패...

프로그램 작성 2025-03-22에 게시되었습니다
Python 's라는 이름의 튜플을 언제 사용해야합니까?
불변의 클래스를 기능이나 전용 필드로 바꾸려고합니다. 표기 일반 튜플과의 거꾸로 호환성 는 기본 클래스 mutation 그러나 속성 변경을 허용하는 Mutable RecordTypes와 같은 대체 유형이 있습니다....

프로그램 작성 2025-03-22에 게시되었습니다
SQLALCHEMY 필터 조항에서 'Flake8'플래킹 부울 비교가 된 이유는 무엇입니까?
데이터베이스 테이블의 부울 필드 (Obsoleted)는 비 초소형 테스트 사례의 수를 결정하는 데 사용됩니다. 이 코드는 필터 절에서 테스트 케이스를 사용합니다. casenum = session.query (testcase) .filter (testcas...

프로그램 작성 2025-03-22에 게시되었습니다
GO에서 임베디드 구조물을 초기화하는 방법 : 2 접근 가이드
다음과 같은 내장 구조 MyRequest를 고려하십시오. http.request PathParams Map [String] 문자열 } myRequest를 초기화하려면 내장 된 http.request struct의 값을 설정해야합니다. 수행 할 ...

프로그램 작성 2025-03-22에 게시되었습니다
플러그인없이 jQuery ajax 파일 업로드를 수행하는 방법은 무엇입니까?
코드 : var formdata = new FormData (); formdata.append ( "파일", 파일); // "파일"을 파일 입력 요소 이름으로 바꾸십시오 $ .ajax ({ 유형 : "...

프로그램 작성 2025-03-22에 게시되었습니다
연관 배열을 병합하고 기본값으로 누락 된 열을 추가하는 데 어떤 기술을 사용할 수 있습니까?
메소드 1 : array_merge 및 recursiveiterationiterator 사용 사용 $ b = 배열 ( 'a'=> '다른 값', 'd'=> '다른 값', 'e'=> '...

프로그램 작성 2025-03-22에 게시되었습니다
PostgreSQL의 각 고유 식별자에 대한 마지막 행을 효율적으로 검색하는 방법은 무엇입니까?
postgresql : 각각의 고유 식별자에 대한 마지막 행을 추출하는 select distinct on (id) id, date, another_info from the_table order by id, date desc; id ...

프로그램 작성 2025-03-22에 게시되었습니다
배열을 사용하여 PHP 양식의 여러 확인란 선택을 어떻게 처리 할 수 있습니까?
문제와 솔루션 배열에 여러 확인란 값을 저장해야 할 필요성은 PHP 양식에서 일반적입니다. 체크 박스 옵션과 제출 버튼이있는 기본 양식에는 확인 된 값을 배열로 캡처하는 솔루션이 필요합니다. 이를 해결하려면 다음 코드 스 니펫을 활용할 수 있습니다. ...

프로그램 작성 2025-03-22에 게시되었습니다
파이썬에서 문자열에서 이모티콘을 제거하는 방법 : 일반적인 오류 수정에 대한 초보자 가이드?
Codecs 가져 오기. 가져 오기 re text = codecs.decode ( '이 개 \ u0001f602'.encode ('utf-8 '),'utf-8 ') 인쇄 (텍스트) # 이모티콘으로 emoji_patter...

프로그램 작성 2025-03-22에 게시되었습니다
Pygame 플랫 포머 게임에서 부드러운 스크롤을 구현하는 방법은 무엇입니까?
스크롤 구현 : 카메라를 구현하려면 카메라 클래스를 사용하여 게임 세계와 플레이어의 위치를 정의합니다. 그런 다음이 오프셋은 화면에 그려 질 때 모든 게임 엔티티의 위치에 적용됩니다. 카메라 클래스 생성 : 클래스 카메라 : 클래스...

프로그램 작성 2025-03-22에 게시되었습니다
PHP 배열 키-값 이상 : 07 및 08의 호기심 사례 이해
이 문제는 PHP의 주요 제로 해석에서 비롯됩니다. 숫자가 0 (예 : 07 또는 08)으로 접두사를 넣으면 PHP는 소수점 값이 아닌 옥탈 값 (기본 8)으로 해석합니다. 설명 : echo 07; // 인쇄 7 (10 월 07 = 10 진수 7) ...

프로그램 작성 2025-03-22에 게시되었습니다
C# 스위치 문의 성능 및 유형 제한은 무엇입니까?
C# 스위치 문의 한계 분석 C#의 스위치 명령문은 편리하고 사용하기 쉬운 프로그램 흐름 제어 방법을 제공하지만 특정 제한 사항도 있습니다. 정수 스위치 표현 ] 스위치 문의 사례 표현식은 정수 값, 즉 기본 데이터 유형이어야합니다. 이 제한은 ...

프로그램 작성 2025-03-22에 게시되었습니다
runtimeexception vs. 예외 : 언제 사용해야합니까?
Defining the DistinctionThe fundamental distinction between RuntimeException and Exception lies in their nature as checked vs. unchecked exceptions. ...

프로그램 작성 2025-03-22에 게시되었습니다