"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > 큰따옴표가 너무 많은지 여부, 그것이 문제입니다!

큰따옴표가 너무 많은지 여부, 그것이 문제입니다!

2024-08-27에 게시됨
검색:349

최근에 PHP 사람들이 여전히 작은 따옴표와 큰 따옴표에 대해 이야기하고 작은 따옴표를 사용하는 것은 단지 미시적인 최적화일 뿐이지만 항상 작은 따옴표를 사용하는 데 익숙해지면 많은 CPU를 절약할 수 있다는 말을 다시 들었습니다. 사이클!

"모든 것이 이미 언급되었지만 아직 모든 사람이 말한 것은 아닙니다." – Karl Valentin

나는 이러한 정신으로 Nikita Popov가 이미 12년 전에 썼던 것과 동일한 주제에 대한 기사를 쓰고 있습니다(그의 기사를 읽고 있다면 여기에서 읽기를 중단할 수 있습니다).

퍼지는 무엇에 관한 것입니까?

PHP는 문자열 보간을 수행합니다. 여기서는 문자열에서 변수의 사용을 검색하고 이를 사용된 변수의 값으로 바꿉니다.

$juice = "apple";
echo "They drank some $juice juice.";
// will output: They drank some apple juice.

이 기능은 큰따옴표 안의 문자열과 heredoc로 제한됩니다. 작은따옴표(또는 nowdoc)를 사용하면 다른 결과가 나옵니다:

$juice = "apple";
echo 'They drank some $juice juice.';
// will output: They drank some $juice juice.

보세요: PHP는 작은따옴표로 묶인 문자열에서 변수를 검색하지 않습니다. 따라서 우리는 어디에서나 작은따옴표를 사용하기 시작할 수 있습니다. 그래서 사람들은 이런 변화를 제안하기 시작했습니다..

- $juice = "apple";
  $juice = 'apple';

.. PHP는 작은 따옴표로 묶인 문자열(어쨌든 예제에서는 존재하지 않음)에서 변수를 찾지 않기 때문에 해당 코드를 실행할 때마다 더 빠르고 많은 CPU 사이클을 절약할 수 있기 때문입니다. 모두가 행복합니다. 사건은 종료되었습니다.

사건이 종결되었나요?

분명히 작은따옴표와 큰따옴표를 사용하는 것에는 차이가 있지만, 무슨 일이 일어나고 있는지 이해하려면 좀 더 깊이 파고들어볼 필요가 있습니다.

PHP는 해석된 언어임에도 불구하고 가상 머신이 실제로 실행할 수 있는 작업, 즉 opcode를 얻기 위해 특정 부분이 함께 작동하는 컴파일 단계를 사용합니다. 그렇다면 PHP 소스 코드에서 opcode로 어떻게 이동합니까?

어휘 분석기

어휘 분석기는 소스 코드 파일을 스캔하여 이를 토큰으로 나눕니다. 이것이 의미하는 바에 대한 간단한 예는 token_get_all() 함수 문서에서 찾을 수 있습니다.

T_OPEN_TAG (

이 3v4l.org 스니펫에서 실제로 이를 확인하고 가지고 놀 수 있습니다.

파서

파서는 이러한 토큰을 가져와서 추상 구문 트리를 생성합니다. 위 예의 AST 표현은 JSON으로 표현될 때 다음과 같습니다.

{
  "data": [
    {
      "nodeType": "Stmt_Echo",
      "attributes": {
        "startLine": 1,
        "startTokenPos": 1,
        "startFilePos": 6,
        "endLine": 1,
        "endTokenPos": 4,
        "endFilePos": 13
      },
      "exprs": [
        {
          "nodeType": "Scalar_String",
          "attributes": {
            "startLine": 1,
            "startTokenPos": 3,
            "startFilePos": 11,
            "endLine": 1,
            "endTokenPos": 3,
            "endFilePos": 12,
            "kind": 2,
            "rawValue": "\"\""
          },
          "value": ""
        }
      ]
    }
  ]
}

이것을 가지고 놀고 다른 코드의 AST가 어떻게 보이는지 확인하려면 Ryan Chandler의 https://phpast.com/과 https://php-ast-viewer.com/을 찾았습니다. 둘 다 주어진 PHP 코드의 AST를 보여줍니다.

컴파일러

컴파일러는 AST를 가져와 opcode를 생성합니다. Opcode는 가상 머신이 실행하는 것이며 해당 설정이 있고 활성화된 경우 OPcache에 저장되는 것이기도 합니다(강력히 권장합니다).

opcode를 보려면 여러 옵션이 있습니다(더 많을 수도 있지만 다음 세 가지를 알고 있습니다):

  1. vulcan 로직 덤퍼 확장을 사용하세요. 3v4l.org에도 구워졌습니다.
  2. phpdbg -p script.php를 사용하여 opcode를 덤프합니다.
  3. 또는 OPcache에 대한 opcache.opt_debug_level INI 설정을 사용하여 opcode를 인쇄하도록 합니다.
    • 0x10000 값은 최적화 전에 opcode를 출력합니다.
    • 0x20000 값은 최적화 후 opcode를 출력합니다.
$ echo ' foo.php
$ php -dopcache.opt_debug_level=0x10000 foo.php
$_main:
...
0000 ECHO string("")
0001 RETURN int(1)

가설

작은따옴표와 큰따옴표를 사용할 때 CPU 주기를 절약한다는 초기 아이디어로 돌아가서, PHP가 모든 단일 요청에 대해 런타임에 이러한 문자열을 평가하는 경우에만 이것이 사실이라는 데 우리 모두 동의한다고 생각합니다.

런타임에는 어떤 일이 발생하나요?

이제 PHP가 두 가지 버전에 대해 어떤 opcode를 생성하는지 살펴보겠습니다.

큰따옴표:

0000 ECHO string("apple")
0001 RETURN int(1)

대 작은따옴표:

0000 ECHO string("apple")
0001 RETURN int(1)

잠깐만요. 이상한 일이 일어났어요. 이거 똑같아 보이는데! 내 미세 최적화는 어디로 갔나요?

아마도 ECHO opcode 처리기의 구현이 주어진 문자열을 구문 분석할 수도 있지만 그렇게 하도록 지시하는 마커나 다른 것이 없을 수도 있습니다... 흠 ?

다른 접근 방식을 시도하고 어휘 분석기가 이 두 가지 경우에 대해 무엇을 하는지 살펴보겠습니다.

큰따옴표:

T_OPEN_TAG (

대 작은따옴표:

Line 1: T_OPEN_TAG (

토큰은 여전히 ​​큰따옴표와 작은따옴표를 구별하지만 AST를 확인하면 두 경우 모두 동일한 결과를 얻을 수 있습니다. 유일한 차이점은 여전히 ​​작은따옴표/큰따옴표가 있는 Scalar_String 노드 속성의 rawValue입니다. 값은 두 경우 모두 큰따옴표를 사용합니다.

새로운 가설

문자열 보간이 실제로 컴파일 타임에 수행될 수 있습니까?

좀 더 "정교한" 예를 들어 보겠습니다.

이 파일의 토큰은 다음과 같습니다.

T_OPEN_TAG (

마지막 두 개의 토큰을 보세요! 문자열 보간은 어휘 분석기에서 처리되므로 컴파일 타임에 적용되며 런타임과는 아무 관련이 없습니다.

Too double quote or not, that

완전성을 위해 이에 의해 생성된 opcode를 살펴보겠습니다(최적화 후 0x20000 사용):

0000 ASSIGN CV0($juice) string("apple")
0001 T2 = FAST_CONCAT string("juice: ") CV0($juice)
0002 ECHO T2
0003 RETURN int(1)

이것은 간단한

요점을 말하자면, 연결해야 할까요, 아니면 보간해야 할까요?

다음 세 가지 버전을 살펴보겠습니다.

  • 첫 번째 버전은 문자열 보간법을 사용하고 있습니다.
  • 두 번째는 쉼표 구분을 사용합니다(AFAIK는 에코에서만 작동하고 변수나 다른 할당에는 작동하지 않음)
  • 세 ​​번째 옵션은 문자열 연결을 사용합니다.

첫 번째 opcode는 "apple"이라는 문자열을 $juice:
변수에 할당합니다.

0000 ASSIGN CV0($juice) string("apple")

첫 번째 버전(문자열 보간)은 기본 데이터 구조로 로프를 사용하며, 이는 가능한 한 적은 문자열 복사를 수행하도록 최적화되어 있습니다.

0001 T2 = ROPE_INIT 4 string("juice: ")
0002 T2 = ROPE_ADD 1 T2 CV0($juice)
0003 T2 = ROPE_ADD 2 T2 string(" ")
0004 T1 = ROPE_END 3 T2 CV0($juice)
0005 ECHO T1

두 번째 버전은 중간 문자열 표현을 생성하지 않으므로 메모리 효율성이 가장 높습니다. 대신 I/O 관점에서 차단 호출인 ECHO를 여러 번 호출하므로 사용 사례에 따라 이는 단점이 될 수 있습니다.

0006 ECHO string("juice: ")
0007 ECHO CV0($juice)
0008 ECHO string(" ")
0009 ECHO CV0($juice)

세 ​​번째 버전은 CONCAT/FAST_CONCAT을 사용하여 중간 문자열 표현을 생성하므로 로프 버전보다 더 많은 메모리를 사용할 수 있습니다.

0010 T1 = CONCAT string("juice: ") CV0($juice)
0011 T2 = FAST_CONCAT T1 string(" ")
0012 T1 = CONCAT T2 CV0($juice)
0013 ECHO T1

그럼 ... 여기서 해야 할 올바른 일은 무엇이며 왜 문자열 보간인가요?

문자열 보간은 echo "juice: $juice"의 경우 FAST_CONCAT을 사용합니다. 또는 echo "juice: $juice $juice";의 경우 고도로 최적화된 ROPE_* opcode를 사용하지만 가장 중요한 것은 의도를 명확하게 전달하며 지금까지 작업한 PHP 애플리케이션에서는 병목 현상이 발생하지 않았습니다. 따라서 이 중 어느 것도 실제로 중요하지 않습니다.

TLDR

문자열 보간은 컴파일 타임에 적용됩니다. 물론, OPcache가 없으면 어휘 분석기는 CPU 주기가 없더라도 모든 요청에서 큰따옴표로 묶인 문자열에 사용된 변수를 확인해야 하지만 솔직히 말해서 문제는 큰따옴표로 묶인 문자열이 아니라 OPcache를 사용하는 것이 아닙니다!

그러나 한 가지 주의 사항이 있습니다. PHP 최대 4(5.0, 어쩌면 5.1까지 포함하더라도 모르겠습니다)는 런타임에 문자열 보간을 수행했기 때문에 이러한 버전을 사용하면... 흠, 아마도 누구든지 여전히 PHP 5를 사용하고 있습니다. 위와 동일하게 적용됩니다. 문제는 큰따옴표로 묶인 문자열이 아니라 오래된 PHP 버전을 사용하는 것입니다.

최종 조언

최신 PHP 버전으로 업데이트하고 OPcache를 활성화하여 오래오래 행복하게 살아보세요!

릴리스 선언문 이 글은 https://dev.to/realflowcontrol/too-double-quote-or-not-thats-the-question-78l?1에서 복제됩니다.1 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다. 그것
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3