Pourquoi le magasin `std::atomic` utilise-t-il XCHG pour la cohérence séquentielle sur x86 ?

Page de garde > La programmation > Pourquoi le magasin `std::atomic` utilise-t-il XCHG pour la cohérence séquentielle sur x86 ?

Pourquoi le magasin `std::atomic` utilise-t-il XCHG pour la cohérence séquentielle sur x86 ?

Publié le 2024-11-18

Parcourir:190

$Why does `std::atomic`\'s store use XCHG for sequential consistency on x86?$

Pourquoi le magasin de std::atomic utilise XCHG pour la cohérence séquentielle

Dans le contexte de std::atomic pour les architectures x86 et x86_64, un L'opération de stockage avec cohérence séquentielle (std::memory_order_seq_cst) utilise XCHG au lieu d'un simple magasin avec une barrière de mémoire comme technique pour obtenir une sémantique de libération séquentielle.

Cohérence séquentielle et xchg

La cohérence séquentielle dicte que toutes les opérations de mémoire semblent s'exécuter dans un ordre séquentiel, et cet ordre est le même pour tous les threads. XCHG, une instruction x86 qui échange atomiquement les valeurs de deux opérandes, satisfait intrinsèquement à cette exigence de cohérence séquentielle. En utilisant XCHG pour effectuer une opération d'écriture, std::atomic garantit que le magasin devient globalement visible par tous les threads à un moment spécifique de l'ordre d'exécution, empêchant ainsi la réorganisation avec les opérations ultérieures.

mov- store mfence vs XCHG

Bien qu'un simple mov-store suivi d'une barrière mémoire (telle que mfence) puisse théoriquement fournir une sémantique de version, cela n'est pas suffisant pour les opérations de stockage à version séquentielle. MFENCE, une instruction de clôture de mémoire qui établit une barrière de mémoire, garantit que les opérations d'écriture précédentes sont validées en mémoire avant de continuer. Cependant, cela n'empêche pas les opérations de chargement ultérieures d'être réorganisées avant le magasin de versions.

Considérations relatives aux performances

Le choix entre mov-store mfence et XCHG pour les versions séquentielles les opérations du magasin impliquent des compromis en termes de performances.

Sur certains processeurs (par exemple, Intel Skylake), XCHG peut être plus efficace que mov-store mfence, en particulier lorsqu'il n'y a pas de code dépendant environnant qui doit être synchronisé. avec l'opération atomique.
Sur d'autres processeurs, mov-store mfence peut être préférable pour les scénarios à haut débit ou lorsque le code environnant peut chevaucher l'exécution avec l'opération atomique.

Détails d'implémentation

En pratique, l'implémentation spécifique du magasin de std::atomic avec cohérence séquentielle varie en fonction du compilateur et de l'architecture matérielle.

GCC/ Clang : Initialement utilisé mov-store mfence, mais a récemment basculé vers XCHG pour les magasins seq-cst.
Compilateur Intel : Utilise XCHG pour les magasins seq-cst.
Microsoft Visual C : Utilise également XCHG pour les magasins seq-cst.

Implicit Acquire Fence

La déclaration selon laquelle x86 les magasins ont une clôture d'acquisition implicite qui est incorrecte. Les magasins sur x86 ont une sémantique de version et non d'acquisition. La sémantique d'acquisition est généralement appliquée à l'aide de barrières de mémoire telles que mfence ou des opérations de lecture atomique avec la sémantique std::memory_order_acquire.

Dernier tutoriel Plus>

L'impact des valeurs nulles sur les performances et le stockage MySQL: analyse de différents moteurs
MySql Null Values: Performance and Storage Considérations L'effet des valeurs null sur les performances et le stockage de MySQL varie cons...

La programmation Publié le 2025-04-12
Pourquoi DateTime :: Modify de PHP («+ 1 mois») produit-il des résultats inattendus?
Modification des mois avec PHP DateTime: Découvrir le comportement prévu Lorsque vous travaillez avec la classe DateTime de Php, l'ajout o...

La programmation Publié le 2025-04-12
Comment puis-je lire efficacement un grand fichier dans l'ordre inverse à l'aide de Python?
en lisant un fichier dans l'ordre inverse dans python Si vous travaillez avec un grand fichier et que vous devez lire son contenu de la de...

La programmation Publié le 2025-04-12
Fonctionnement du curseur jQuery 6 fonctions majeures
Voici quelques puissants extraits de code jQuery pour manipuler le curseur de la souris! Ils peuvent être utilisés pour définir et obtenir une pos...

La programmation Publié le 2025-04-12
Espaces de noms sans nom et mots clés statiques en C ++: qui est mieux encapsulé?
dévoiler la supériorité des espaces de noms sans nom sur le mot-clé statique introduction: L'utilisation de la clé statique a été cohér...

La programmation Publié le 2025-04-12
Raisons de l'échec de l'alias de type GO
Comment lancer à un type d'alias dans go? Considérez le code GO suivant: package main import "fmt" type somethingFuncy func(int) ...

La programmation Publié le 2025-04-12
Python Lire le fichier CSV UnicodedeCodeerror Ultimate Solution
Unicode Decode Erreur dans la lecture du fichier CSV Lorsque vous essayez de lire un fichier CSV dans Python à l'aide du module CSV intégr...

La programmation Publié le 2025-04-12
Ne pas existe par rapport à Not in vs gauche jointer null: quelle clause SQL dois-je choisir?
Comprendre SQL n'existe pas , pas dans , et gauche jointer où est null : une analyse comparative SQL fournit diverses méthodes pour compa...

La programmation Publié le 2025-04-12
Comment puis-je exécuter plusieurs instructions SQL dans une seule requête en utilisant Node-Mysql?
Prise en charge de la requête multi-statement dans Node-Mysql Dans Node.js, la question se pose lors de l'exécution de plusieurs instructi...

La programmation Publié le 2025-04-12
Comment puis-je récupérer efficacement les valeurs d'attribut à partir de fichiers XML à l'aide de PHP?
Récupération des valeurs d'attribut à partir de fichiers xml dans php Chaque développeur rencontre la nécessité de analyser les fichiers X...

La programmation Publié le 2025-04-12
Pourquoi jQuery.Height () renvoie-t-il la valeur d'un élément caché?
jQuery: height () / width () et "affiche: aucun" Dans ce scénario, l'élément avec l'ID "Target" a sa propriété d&#...

La programmation Publié le 2025-04-12
Guide de l'utilisateur de l'API en plein écran HTML5 - SitePoint
If you don’t like change, perhaps web development isn’t for you. I previously described the Full-Screen API in late 2012 and, while I claimed the im...

La programmation Publié le 2025-04-12
Comment puis-je sélectionner par programmation tout le texte dans un clic div sur la souris?
Sélection du texte div sur la souris Cliquez sur Question Étant donné un élément div avec du contenu de texte, comment l'utilisateur peut-...

La programmation Publié le 2025-04-12
$ArrayList to String \ [\] Méthode Array en Java$
ArrayList to String \ [\] Méthode Array en Java
Converting arrayList en string [] dans java lorsque vous travaillez avec des collections dans java, il peut être nécessaire de convertir ...

La programmation Publié le 2025-04-12
Comment supprimer proprement les gestionnaires d'événements JavaScript anonymes?
supprimer les auditeurs d'événements anonymes Ajouter des auditeurs d'événements anonymes aux éléments offre une flexibilité et une simp...

La programmation Publié le 2025-04-12

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article