Операционный и расширяемый веб -сервер с Zig и Python

титульная страница > программирование > Операционный и расширяемый веб -сервер с Zig и Python

Операционный и расширяемый веб -сервер с Zig и Python

Опубликовано в 2025-03-22

Просматривать:117

] Предисловие

]

я увлечен своим интересом к разработке программного обеспечения, в частности, загадкой эргономического создания программных систем, которые решают самый широкий набор проблем, делая как можно меньше компромиссов. Мне также нравится думать о себе как о разработчике систем, что, по определению Эндрю Келли, означает разработчик, заинтересованный в полном понимании систем, с которыми они работают. В этом блоге я делюсь с вами своими идеями о решении следующей проблемы: создание надежного и исполнительного приложения для полного стека . Довольно сложная задача, не так ли? В блоге я сосредотачиваюсь на части «Performant Web Server» - вот где я чувствую, что могу предложить свежую перспективу, так как остальное либо хорошо проточено, либо мне нечего добавить.

Основное предостережение - будет нет образцов кода , я на самом деле не проверил это. Да, это серьезный недостаток, но на самом деле это займет много времени, чего у меня нет, и между публикацией некорректного блога и не публикуя его вообще, я застрял с первым. Вы были предупреждены.

]

A performant and extensible Web Server with Zig and Python

и какие части мы собираем наше приложение?

]

фронт, с которым вам удобно, но если вы хотите минимальные зависимости - в форме wasm есть Zig Htmx.
Zig Web Server, тесно интегрированный с ядром Linux. Это исполнительная часть, на которой я сосредоточусь в этом блоге.
бэкэнд Python, интегрированный с Zig. Это сложная часть.
интеграция с прочными системами выполнения, такими как временные и проточные. Это способствует надежности и не будет обсуждаться в блоге.

]

с нашими инструментами, принятыми, давайте начнем!

]

] В любом случае переоценены Coroutines?

]

Zig не имеет поддержки языкового уровня для Coroutines :( и Coroutines - это то, с чем каждый операционный веб -сервер построен. Итак, нет смысла пытаться?

]

держаться, включить, давайте сначала поместим шляпу нашего системного программиста. Кораки - это не серебряная пуля, ничего нет. Каковы фактические преимущества и недостатки?

]

общеизвестно, что Coroutines (потоки пользователей) более легкие и быстрее. Но каким образом именно? (Ответы здесь в основном спекуляции, возьмите с собой соль и протестируйте ее самостоятельно)

]

они начинают с меньшего пространства стека по умолчанию (2 КБ вместо 4 МБ). Но это можно скорректировать вручную.
они лучше сотрудничают с планировщиком пользовательского пространства. Поскольку планировщик ядра превентивен, задачи, выполняемые потоками, предназначены для распределенных срезов времени. Если фактические задачи не вписываются в ломтики - некоторое время процессора потрачено впустую. В отличие от, скажем, goroutines, которые подходят как можно больше микро-задач, выполняемых различными goroutines, в один и тот же срез OS-Thread.

]

A performant and extensible Web Server with Zig and Python

время выполнения GO, например, мультиплексирует Goroutines на потоки ОС. Темы делятся таблицей страниц, а также другие ресурсы, принадлежащие процессу. Если мы введем изоляцию и сродство процессора к миксу - потоки будут постоянно работать на своих соответствующих ядрах процессоров, все структуры данных ОС останутся в памяти, и не нужно быть изменено, пользовательский планировщик будет выделять время ЦП на горутины с точностью, поскольку он использует кооперативную модель многозаданную модель. Возможна ли конкуренция?

]

] победы достигаются путем отсрочки абстракции потока на уровне ОС и замены его на Goroutine. Но ничего не потеряно в переводе?

]

] Можем ли мы сотрудничать с ядром?

]

Я утверждаю, что абстракция «истинного» на уровне ОС для независимой единицы выполнения - это даже не поток - это на самом деле процесс ОС. На самом деле, различие здесь не так очевидно - все, что различает потоки и процессы, - это различные значения PID и TID. Что касается дескрипторов файлов, то виртуальная память, обработчики сигналов, отслеживаемые ресурсы - независимо от того, отдельные ли они для ребенка указаны в аргументах в Syscall "Clone". Таким образом, я буду использовать термин «процесс», чтобы означать поток выполнения, который владеет собственными системными ресурсами - в первую очередь время ЦП, память, открытые дескрипторы файлов.

A performant and extensible Web Server with Zig and Python

теперь почему это важно? Каждая единица исполнения имеет свои собственные требования для системных ресурсов. Каждая сложная задача может быть разбита на единицы, где каждый из них может сделать свой собственный, предсказуемый, запросить ресурсы - память и время процессора. И чем дальше вверх по дереву подзадачи, вы идете, к более общей задаче - график системных ресурсов образует кривую колокола с длинными хвостами. И вы обязаны убедиться, что хвосты не переполняют ограничение системных ресурсов. Но как это делается, и что произойдет, если этот предел на самом деле переполнен?

Если мы используем модель одного процесса и много критиков для независимых задач, когда один из них перевернут предел памяти - поскольку использование памяти отслеживается на уровне процесса, весь процесс убит. Это в лучшем случае - если вы используете CGROUPS (что автоматически относится к стручкам в Kubernetes, которые имеют CGROUP на POD) - вся CGROUP убит. Создание надежной системы необходимо учитывать. А как насчет времени процессора? Если наша услуга получит множество запросов на вычислительные задачи одновременно, он не отвечает. Затем сроки, отмены, повторные перезапуск следуют.

]

] единственный реалистичный способ справиться с этими сценариями для большинства основных программных стеков - оставлять «жир» в системе - некоторые неиспользованные ресурсы для хвоста кривой колокола - и ограничивая количество параллельных запросов - которые, опять же, приводят к неиспользованным ресурсам. И даже с этим мы будем время от времени убить или не отвечать, в том числе для «невинных» запросов, которые оказываются в том же процессе, что и выброс. Этот компромисс приемлем для многих и достаточно хорошо обслуживает программные системы на практике. Но можем ли мы сделать лучше?

]

] Модель параллелизма

]

Поскольку использование ресурсов отслеживается для для процесса, в идеале мы появились бы на новом процессе для каждой небольшой, предсказуемой единицы выполнения. Затем мы установили Ulimit для процессора и памяти - и мы готовы к работе! У Ulimit есть мягкие и жесткие ограничения, что позволит процессу изящно прекращаться после удара по мягкому пределу, и если это не происходит, возможно, из -за ошибки - насильственно прекращается при ударе по жесткому пределу. К сожалению, появление новых процессов на Linux - это медленный, нерестив новый процесс на запрос не поддерживается для многих веб -структур, а также для других систем, таких как височные. Кроме того, переключение процессов дороже - что смягчается закреплением коровы и процессора, но все же не идеально. К сожалению, давние процессы-это неизбежная реальность.

A performant and extensible Web Server with Zig and Python

, чем дальше мы переходим от чистой абстракции недолговечных процессов, тем больше работы на уровне ОС нам необходимо позаботиться о себе. Но есть также преимущества, которые необходимо получить, например, использование io_uring для партии ввода -ввода между многими потоками выполнения. На самом деле, если большая задача состоит из подзадач - действительно ли мы заботимся об их отдельном использовании ресурсов? Только для профилирования. Но если для большой задачи мы могли бы управлять (отрезать) хвосты кривой Resource Bell, это было бы достаточно хорошо. Таким образом, мы могли бы породить столько процессов, сколько и запросов, которые мы хотим обработать одновременно, чтобы они были долгоживущими и просто привыкли к Ulimit для каждого нового запроса. Таким образом, когда запрос переполняет свои ограничения ресурсов, он получает сигнал ОС и способен грациозно прекратить, не влияя на другие запросы. Или, если высокое использование ресурсов является преднамеренным, мы могли бы сказать клиенту платить за более высокую квоту ресурсов. Звучит довольно хорошо для меня.

]

, но производительность все равно будет пострадать, по сравнению с подходом Coroutine-Per-Request. Во -первых, копирование вокруг таблицы памяти процесса стоит дорого. Поскольку таблица содержит ссылки на страницы памяти, мы могли бы использовать огромные страницы, таким образом ограничивая размер данных, которые будут скопированы. Это может быть непосредственно возможно только с языками низкого уровня, такими как Zig. Кроме того, многозадачность уровня ОС является превентивным и не кооперативным, что всегда будет менее эффективным. Или это?

]

] Совместная многозадачность с Linux

]

Существует Syscall sched_yield, которая позволяет потоке отказываться от процессора, когда он завершит свою часть работы. Кажется довольно кооперативным. Может ли также быть способ запросить время времени заданного размера? На самом деле, есть - с политикой планирования rade_deadline. Это политика в режиме реального времени, что означает, что для запрошенного срез времени процессора поток работает непрерывно. Но если ломтик переполнен - нажимает преодоление, и ваша нить заменена и деприоритизирована. И если срез не подходит - поток может вызовать ched_yield, чтобы сигнализировать о ранней отделке, что позволяет запускать другие потоки. Это похоже на лучшее из обоих миров - кооперативная и предварительная модель.

]

A performant and extensible Web Server with Zig and Python

ограничение - это тот факт, что поток read_deadline не может раскошелиться. Это оставляет нас с двумя моделями для параллелистики - либо процесс за запрос, который устанавливает крайний срок для себя, и запускает цикл событий для эффективного IO, либо процесс, который из начала порождает поток для каждой микро -задачи, каждый из которых устанавливает свой собственный крайний срок и использует очередь для связи друг с другом. Первый более прямой, но требует цикла событий в пользовательском пространстве, последний больше использует ядро.

]

обе стратегии достигают того же конца, что и модель Coroutine - , сотрудничая с ядром, можно выполнить задачи применения с минимальными перерывами .

]

] Python как встроенный язык сценариев

]

это все для высокопроизводительной, низкой задержки, низкоуровневой стороны вещей, где сияет Zig. Но когда дело доходит до фактического бизнеса приложения, гибкость гораздо более ценна, чем задержка. Если процесс включает в себя реальных людей, подписавшихся на документы - задержка компьютера незначительна. Кроме того, несмотря на страдания в производительности, объектно -ориентированные языки дают разработчику лучшие примитивы для моделирования домена бизнеса. И в самом дальнем конце этого, такие системы, как Flowable и Camunda, позволяют управленческому и операционному персоналу программировать бизнес -логику с большей гибкостью и более низким барьером въезда. Такие языки, как Zig, не помогут с этим, и только стоят на вашем пути.

]

A performant and extensible Web Server with Zig and Python

Python, с другой стороны, является одним из самых динамичных языков, которые есть. Занятия, объекты - все они являются словари под капотом, и их можно манипулировать во время выполнения, как вам нравится. Это имеет штраф за производительность, но делает моделирование бизнеса с помощью классов и объектов, а также множеством умных трюков практичным. Зиг - это противоположность этому - в Zig намеренно мало умных уловок, что дает вам максимальный контроль. Можем ли мы объединить их силы, заставляя их взаимодействовать?

Действительно, мы можем, благодаря тому, что оба поддерживают C abi. Мы можем заставить интерпретатор Python работать из процесса Zig, а не в качестве отдельного процесса, снижая накладные расходы в стоимости выполнения и код клея. Это также позволяет нам использовать пользовательские распределители Zig в Python - устанавливая арену для обработки отдельного запроса, тем самым уменьшая, если не устранять накладные расходы коллектора мусора, и установить крышку памяти. Основным ограничением станут нерестящие нити выполнения CPYTHON для сбора мусора и IO, но я не нашел никаких доказательств того, что это так. Мы могли бы зацепить Python в пользовательскую петлю события в Zig, с отслеживанием памяти на штуку, используя поле «контекст» в AbstractMemoryLoop. Возможности безграничны.

]

] Заключение

]

мы обсудили достоинства параллелизма, параллелизма и различных форм интеграции с ядром ОС. В исследовании не хватает тестов и кода, которые, я надеюсь, компенсируют качество предлагаемых идей. Вы пробовали что -нибудь подобное? Что вы думаете? Обратная связь приветствуется :)

]

] Дальнейшее чтение

]

https://linux.die.net/man/2/clone
https://man7.org/linux/man-pages/man7/sched.7.html
https://man7.org/linux/man-pages/man2/sched_yield.2.html
https://rigtorp.se/low-latency-guide/
https://eli.thegreenplace.net/2018/measuring-context-switching-and-memory-overheads-for-linux-threads/
https://hadar.gr/2017/Leight-Goroutines

] ] ]

Заявление о выпуске Эта статья воспроизводится по адресу: https://dev.to/brogrammerjohn/a-performant-and-extensible-web-server-with-zig-and-python-4adl?

Последний учебник Более>

Как реализовать универсальную хэш -функцию для кортежей в неупорядоченных коллекциях?
generic hash function для кортежей в неупорядоченных коллекциях . Чтобы исправить это, один подход - это вручную определить функцию HASH для к...

программирование Опубликовано в 2025-04-18
Как Java's Map.Entry и SimpleEntry упрощают управление пары ключей?
Комплексная коллекция для паров значений: введение java's Map.entry и SimpleEntry в Java, при определении коллекции, где каждый элемент со...

программирование Опубликовано в 2025-04-18
Какой метод для объявления нескольких переменных в JavaScript более является более поддерживаемым?
Объявление нескольких переменных в JavaScript: Изучение двух методов в Javascript, разработчики часто сталкиваются с необходимостью объявления...

программирование Опубликовано в 2025-04-18
Как точно измерить время выполнения сценария PHP?
Получение времени выполнения скрипта в PHP в PHP, время выполнения сценария отслеживания имеет решающее значение для обеспечения соблюдения пр...

программирование Опубликовано в 2025-04-18
`console.log` показывает причину исключения измененного значения объекта
objects and console.log: нечетность раскрыта При работе с объектами и console.log вы можете встретить своеобразное поведение. Давайте разгадым...

программирование Опубликовано в 2025-04-18
Как обойти блоки веб -сайтов с помощью запросов Python и фальшивых пользовательских агентов?
Как смоделировать поведение браузера с помощью запросов Python и фальшивых пользовательских агентов библиотеки Python - это мощный инструмент ...

программирование Опубликовано в 2025-04-18
Как эффективно рассчитать разницу между двумя датами в C#?
для эффективного расчета разницы в датах в C# ]] в различных сценариях программирования, определение разницы в количестве дней между двумя датам...

программирование Опубликовано в 2025-04-18
JavaScript Decimal и Hexadecimal Techniques преобразования
десятичное в шестнадцатеричное преобразование в Javascript преобразование десятичных значений в шестнадцатеричные эквиваленты является общей з...

программирование Опубликовано в 2025-04-18
Как проанализировать числа в экспоненциальной нотации с помощью Decimal.parse ()?
анализирует число из экспоненциальной нотации При попытке проанализировать строку, выраженную в экспоненциальной нотации, используя Tecimal.pa...

программирование Опубликовано в 2025-04-18
Можете ли вы использовать CSS для цветной консоли вывода в Chrome и Firefox?
отображение цветов в консоли Javascript ] может ли использовать консоль Chrome для отображения цветного текста, такого как красный для ошибок, ...

программирование Опубликовано в 2025-04-18
Как извлечь значения массивов из массивов объектов JSON в SQL Server 2016?
SQL Server 2016: преобразование массивов объектов JSON в массивы значений ] SQL Server 2016 Возможности JSON 2016 являются надежными, но извлеч...

программирование Опубликовано в 2025-04-18
Как упростить анализ JSON в PHP для многомерных массивов?
sacksing json с php пытаться анализировать данные JSON в PHP может быть сложной, особенно при работе с многомерными массивами. Чтобы упростить п...

программирование Опубликовано в 2025-04-18
Как создать плавную анимацию CSS в левом правом для Div в его контейнере?
generic css анимация для левого правого движения В этой статье мы рассмотрим создание общей анимации CSS, чтобы переместить дивирование влево ...

программирование Опубликовано в 2025-04-18
Как динамически получить доступ к глобальным переменным в JavaScript?
доступ к глобальным переменным динамически по имени в JavaScript Получение доступа к глобальным переменным во время выполнения может быть общим ...

программирование Опубликовано в 2025-04-18
Как эффективно считать частоту символов в строке?
определение частоты символов в строках Подсчет частоты символов в строке является общей задачей в программировании. Чтобы достичь этого, рассм...

программирование Опубликовано в 2025-04-18