Trop de guillemets ou pas, telle est la question !

Page de garde > La programmation > Trop de guillemets ou pas, telle est la question !

Trop de guillemets ou pas, telle est la question !

Publié le 2024-08-27

Parcourir:433

Tout récemment, j'ai encore entendu dire que les gens de PHP parlent encore de guillemets simples et de guillemets doubles et que l'utilisation de guillemets simples n'est qu'une micro-optimisation, mais si vous vous habituez à utiliser des guillemets simples tout le temps, vous économiserez beaucoup de CPU cycle !

"Tout a déjà été dit, mais pas encore par tout le monde" – Karl Valentin

C'est dans cet esprit que j'écris un article sur le même sujet que Nikita Popov avait déjà écrit il y a 12 ans (si vous lisez son article, vous pouvez arrêter de lire ici).

De quoi s'agit-il?

PHP effectue une interpolation de chaîne, dans laquelle il recherche l'utilisation de variables dans une chaîne et les remplace par la valeur de la variable utilisée :

$juice = "apple";
echo "They drank some $juice juice.";
// will output: They drank some apple juice.

Cette fonctionnalité est limitée aux chaînes entre guillemets doubles et heredoc. L'utilisation de guillemets simples (ou nowdoc) donnera un résultat différent :

$juice = "apple";
echo 'They drank some $juice juice.';
// will output: They drank some $juice juice.

Regardez ça : PHP ne recherchera pas de variables dans cette chaîne entre guillemets simples. Nous pourrions donc simplement commencer à utiliser des guillemets simples partout. Alors les gens ont commencé à suggérer des changements comme celui-ci.

- $juice = "apple";
  $juice = 'apple';

.. parce que ce sera plus rapide et cela économiserait beaucoup de cycles CPU à chaque exécution de ce code car PHP ne recherche pas de variables dans des chaînes entre guillemets simples (qui sont de toute façon inexistantes dans l'exemple) et tout le monde est content, affaire classée.

Affaire close ?

Évidemment, il y a une différence entre l'utilisation de guillemets simples et de guillemets doubles, mais pour comprendre ce qui se passe, nous devons creuser un peu plus.

Même si PHP est un langage interprété, il utilise une étape de compilation dans laquelle certaines parties jouent ensemble pour obtenir quelque chose que la machine virtuelle peut réellement exécuter, à savoir les opcodes. Alors, comment passer du code source PHP aux opcodes ?

Le lexeur

Lexer analyse le fichier de code source et le décompose en jetons. Un exemple simple de ce que cela signifie peut être trouvé dans la documentation de la fonction token_get_all(). Un code source PHP de juste

T_OPEN_TAG (

Nous pouvons voir cela en action et jouer avec dans cet extrait de 3v4l.org.

L'analyseur

L'analyseur prend ces jetons et génère à partir d'eux un arbre de syntaxe abstrait. Une représentation AST de l'exemple ci-dessus ressemble à ceci lorsqu'elle est représentée sous forme de JSON :

{
  "data": [
    {
      "nodeType": "Stmt_Echo",
      "attributes": {
        "startLine": 1,
        "startTokenPos": 1,
        "startFilePos": 6,
        "endLine": 1,
        "endTokenPos": 4,
        "endFilePos": 13
      },
      "exprs": [
        {
          "nodeType": "Scalar_String",
          "attributes": {
            "startLine": 1,
            "startTokenPos": 3,
            "startFilePos": 11,
            "endLine": 1,
            "endTokenPos": 3,
            "endFilePos": 12,
            "kind": 2,
            "rawValue": "\"\""
          },
          "value": ""
        }
      ]
    }
  ]
}

Au cas où vous voudriez également jouer avec cela et voir à quoi ressemble l'AST pour d'autres codes, j'ai trouvé https://phpast.com/ de Ryan Chandler et https://php-ast-viewer.com/ qui les deux vous montrent l'AST d'un morceau de code PHP donné.

Le compilateur

Le compilateur prend l'AST et crée des opcodes. Les opcodes sont les choses que la machine virtuelle exécute, c'est aussi ce qui sera stocké dans l'OPcache si vous avez cette configuration et activée (ce que je recommande fortement).

Pour afficher les opcodes, nous avons plusieurs options (peut-être plus, mais je connais ces trois ):

utilisez l'extension de dumper logique vulcan. Il est également intégré à 3v4l.org
utilisez phpdbg -p script.php pour vider les opcodes
ou utilisez le paramètre INI opcache.opt_debug_level pour OPcache pour lui faire imprimer les opcodes
- une valeur de 0x10000 génère les opcodes avant l'optimisation
- une valeur de 0x20000 génère des opcodes après l'optimisation

$ echo ' foo.php
$ php -dopcache.opt_debug_level=0x10000 foo.php
$_main:
...
0000 ECHO string("")
0001 RETURN int(1)

Hypothèse

Pour en revenir à l'idée initiale d'économiser les cycles du processeur lors de l'utilisation de guillemets simples plutôt que de guillemets doubles, je pense que nous sommes tous d'accord sur le fait que cela ne serait vrai que si PHP évaluait ces chaînes au moment de l'exécution pour chaque requête.

Que se passe-t-il au moment de l'exécution ?

Voyons donc quels opcodes PHP crée pour les deux versions différentes.

Guillemets doubles :

0000 ECHO string("apple")
0001 RETURN int(1)

contre. guillemets simples :

0000 ECHO string("apple")
0001 RETURN int(1)

Hé, attends, quelque chose de bizarre s'est produit. Cela a l'air identique ! Où est passée ma micro-optimisation ?

Eh bien peut-être, juste peut-être que l'implémentation du gestionnaire d'opcode ECHO analyse la chaîne donnée, bien qu'il n'y ait pas de marqueur ou autre chose qui lui dit de le faire... hmm ?

Essayons une approche différente et voyons ce que fait le lexer dans ces deux cas :

Guillemets doubles :

T_OPEN_TAG (

contre. guillemets simples :

Line 1: T_OPEN_TAG (

Les jetons font toujours la distinction entre les guillemets doubles et simples, mais vérifier l'AST nous donnera un résultat identique dans les deux cas - la seule différence est la valeur rawValue dans les attributs du nœud Scalar_String, qui a toujours les guillemets simples/doubles, mais la valeur utilise des guillemets doubles dans les deux cas.

Nouvelle hypothèse

Se pourrait-il que l'interpolation de chaîne soit réellement effectuée au moment de la compilation ?

Vérifions avec un exemple un peu plus "sophistiqué" :

Les jetons de ce fichier sont :

T_OPEN_TAG (

Regardez les deux derniers jetons ! L'interpolation de chaîne est gérée dans le lexer et, en tant que telle, est une opération de compilation et n'a rien à voir avec l'exécution.

Too double quote or not, that

Pour être complet, regardons les opcodes générés par ceci (après optimisation, en utilisant 0x20000) :

0000 ASSIGN CV0($juice) string("apple")
0001 T2 = FAST_CONCAT string("juice: ") CV0($juice)
0002 ECHO T2
0003 RETURN int(1)

C'est un opcode différent de celui que nous avions dans notre simple

Allez droit au but : dois-je concaténer ou interpoler ?

Jetons un coup d'œil à ces trois versions différentes :

la première version utilise l'interpolation de chaînes
la seconde utilise une séparation par virgule (que AFAIK ne fonctionne qu'avec l'écho et non avec l'attribution de variables ou quoi que ce soit d'autre)
et la troisième option utilise la concaténation de chaînes

Le premier opcode attribue la chaîne "apple" à la variable $juice :

0000 ASSIGN CV0($juice) string("apple")

La première version (interpolation de chaînes) utilise une corde comme structure de données sous-jacente, qui est optimisée pour effectuer le moins de copies de chaînes possible.

0001 T2 = ROPE_INIT 4 string("juice: ")
0002 T2 = ROPE_ADD 1 T2 CV0($juice)
0003 T2 = ROPE_ADD 2 T2 string(" ")
0004 T1 = ROPE_END 3 T2 CV0($juice)
0005 ECHO T1

La deuxième version est la plus efficace en termes de mémoire car elle ne crée pas de représentation sous forme de chaîne intermédiaire. Au lieu de cela, il effectue plusieurs appels à ECHO, ce qui est un appel bloquant du point de vue des E/S, donc selon votre cas d'utilisation, cela peut être un inconvénient.

0006 ECHO string("juice: ")
0007 ECHO CV0($juice)
0008 ECHO string(" ")
0009 ECHO CV0($juice)

La troisième version utilise CONCAT/FAST_CONCAT pour créer une représentation de chaîne intermédiaire et, en tant que telle, peut utiliser plus de mémoire que la version corde.

0010 T1 = CONCAT string("juice: ") CV0($juice)
0011 T2 = FAST_CONCAT T1 string(" ")
0012 T1 = CONCAT T2 CV0($juice)
0013 ECHO T1

Alors... quelle est la bonne chose à faire ici et pourquoi s'agit-il d'une interpolation de chaîne ?

L'interpolation de chaîne utilise soit un FAST_CONCAT dans le cas de echo "juice: $juice" ; ou des opcodes ROPE_* hautement optimisés dans le cas de echo "juice: $juice $juice";, mais le plus important, il communique clairement l'intention et rien de tout cela n'a été un goulot d'étranglement dans aucune des applications PHP avec lesquelles j'ai travaillé jusqu'à présent, donc rien de tout cela n'a d'importance.

TLDR

L'interpolation de chaînes est une opération au moment de la compilation. Certes, sans OPcache, le lexer devra vérifier les variables utilisées dans les chaînes entre guillemets doubles à chaque requête, même s'il n'y en a pas, ce qui réduira les cycles du processeur, mais honnêtement : le problème ne vient pas des chaînes entre guillemets doubles, mais de l'utilisation d'OPcache !

Cependant, il y a une mise en garde : PHP jusqu'à 4 (et je crois même y compris 5.0 et peut-être même 5.1, je ne sais pas) effectuait une interpolation de chaîne au moment de l'exécution, donc en utilisant ces versions... hmm, je suppose que si si quelqu'un utilise encore PHP 5, la même chose que ci-dessus s'applique : le problème ne vient pas des chaînes entre guillemets doubles, mais de l'utilisation d'une version obsolète de PHP.

Dernier conseil

Mettez à jour vers la dernière version de PHP, activez OPcache et vivez heureux pour toujours !

Déclaration de sortie Cet article est reproduit sur : https://dev.to/realflowcontrol/too-double-quote-or-not-thats-the-question-78l?1 En cas de violation, veuillez contacter [email protected] pour supprimer il

Dernier tutoriel Plus>

Comment insérer ou mettre à jour efficacement les lignes en fonction de deux conditions dans MySQL?
insérer ou mettre à jour avec deux conditions Description du problème: L'utilisateur rencontre un défi de concours de temps: insérer u...

La programmation Publié le 2025-07-02
Comment puis-je créer efficacement des dictionnaires en utilisant la compréhension Python?
Python Dictionary Comprehension Dans Python, les compréhensions du dictionnaire offrent un moyen concis de générer de nouveaux dictionnaires. Bi...

La programmation Publié le 2025-07-02
Pourquoi Microsoft Visual C ++ ne parvient pas à implémenter correctement l'instanciation du modèle biphasé?
Le mystère de l'instanciation du modèle deux phases "Broken" dans Microsoft Visual C Instruction Problème: Les utilisateurs ex...

La programmation Publié le 2025-07-02
$Quelle méthode est la plus efficace pour la détection ponctuelle en polygone: traçage des rayons ou path.contains_points de Matplotlib \?$
Quelle méthode est la plus efficace pour la détection ponctuelle en polygone: traçage des rayons ou path.contains_points de Matplotlib \?
détection efficace de ponctuel en polygone dans python déterminer si un point se trouve dans un polygone est une tâche fréquente en géométrie de...

La programmation Publié le 2025-07-02
Comment surmonter les restrictions de redéfinition de la fonction de PHP?
surmonter les limitations de redéfinition de la fonction de Php dans php, définir une fonction avec le même nom plusieurs fois est un non. Ten...

La programmation Publié le 2025-07-02
Comment puis-je syndicrer des tables de base de données avec différents nombres de colonnes?
Tables combinées avec différentes colonnes ] peut rencontrer des défis lorsque vous essayez de fusionner les tables de base de données avec dif...

La programmation Publié le 2025-07-02
Comment empêcher les soumissions en double après la rafraîchissement du formulaire?
Empêcher les soumissions en double avec une manipulation de rafraîchissement dans le développement Web, il est courant d'informer le probl...

La programmation Publié le 2025-07-02
Pourquoi les comparaisons booléennes «Flake8» sont-elles dans les clauses de filtre Sqlalchemy?
flake8 Flagging Boolean Comparison in Filter ClauseWhen attempting to filter query results based on a boolean comparison in SQL, developers may encoun...

La programmation Publié le 2025-07-02
Comment créer des variables dynamiques dans Python?
Création de variables dynamiques dans python La capacité de créer des variables dynamiquement peut être un outil puissant, en particulier lors...

La programmation Publié le 2025-07-02
Pourquoi est-ce que je reçois une erreur "Je n'ai pas trouvé d'implémentation du modèle de requête" dans ma requête Silverlight Linq?
Absence d'implémentation du modèle de requête: Résolution "n'a pas pu trouver" Erreurs dans une application Silverlight, une...

La programmation Publié le 2025-07-02
Comment ajouter la base de données MySQL à la boîte de dialogue DataSource dans Visual Studio 2012?
Ajout de la base de données MySQL à la boîte de dialogue DataSource dans Visual Studio 2012 En travaillant avec Entity Framework et MySQL, l&#...

La programmation Publié le 2025-07-02
Comment implémenter des événements personnalisés en utilisant le modèle d'observateur en Java?
Création d'événements personnalisés dans java Les événements personnalisés sont indispensables dans de nombreux scénarios de programmation, ...

La programmation Publié le 2025-07-02
Comment puis-je personnaliser les optimisations de compilation dans le compilateur Go?
Personnaliser les optimisations de compilation dans go compiller Le processus de compilation par défaut dans Go suit une stratégie d'optim...

La programmation Publié le 2025-07-02
$Pourquoi est-ce que je reçois une erreur \ "class \ 'ziparchive \' non trouvée \" après avoir installé archive_zip sur mon serveur Linux?$
Pourquoi est-ce que je reçois une erreur \ "class \ 'ziparchive \' non trouvée \" après avoir installé archive_zip sur mon serveur Linux?
classe 'ziparchive' introuvable erreur lors de l'installation d'archive_zip sur le serveur Linux symptôme: Lorsque vous tent...

La programmation Publié le 2025-07-02
Pourquoi les images affichent-elles des images à l'aide de la propriété CSS «Content»?
Affichage des images avec URL de contenu dans Firefox Un problème a été rencontré lorsque certains navigateurs, spécifiquement Firefox, n'...

La programmation Publié le 2025-07-02

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article