스마트 따옴표는 일반 곧은 따옴표(' 및 ") 대신 사용되는 인쇄 표시입니다. 보다 세련되고 그러나 소프트웨어 응용 프로그램이 서로 다른 유형의 둥근 인용문을 변환하는 데 어려움을 겪어 불일치가 발생하는 경우가 많습니다.
스마트 인용을 변환하는 데 어려움은 이를 표현하는 데 사용되는 다양한 인코딩과 문자로 인해 발생합니다. 다양한 운영 체제와 소프트웨어 프로그램은 자체 표준을 사용하므로 인용 문자가 단편화됩니다. 예를 들어, 한 시스템은 유니코드를 사용하고 다른 시스템은 Windows 코드 페이지 1252를 사용할 수 있습니다.
이 문제를 해결하기 위해 포괄적인 스마트 인용 변환 기능 PHP에서는 관련된 다양한 인코딩과 문자에 대한 철저한 이해가 필요합니다. 유니코드, Windows 코드 페이지 1252 및 기타 레거시 인코딩에 정의된 것을 포함하여 스마트 따옴표의 모든 변형을 처리할 수 있어야 합니다.
다음 최적화된 PHP 구현은 모든 유형의 둥근 따옴표를 일반 따옴표로 변환합니다.
function convert_smart_quotes($string)
{
// Create a map of smart quote characters to their respective Unicode representations
$smart_quotes = array(
"\xC2\xAB" => '"', // « (U 00AB)
"\xC2\xBB" => '"', // » (U 00BB)
"\xE2\x80\x98" => "'", // ‘ (U 2018)
"\xE2\x80\x99" => "'", // ’ (U 2019)
"\xE2\x80\x9A" => "'", // ‚ (U 201A)
"\xE2\x80\x9B" => "'", // ‛ (U 201B)
"\xE2\x80\x9C" => '"', // “ (U 201C)
"\xE2\x80\x9D" => '"', // ” (U 201D)
"\xE2\x80\x9E" => '"', // „ (U 201E)
"\xE2\x80\x9F" => '"', // ‟ (U 201F)
"\xE2\x80\xB9" => "'", // ‹ (U 2039)
"\xE2\x80\xBA" => "'", // › (U 203A)
);
// Strtr function can directly replace the smart quote characters with their Unicode counterparts
$converted_string = strtr($string, $smart_quotes);
// Return the converted string
return $converted_string;
}
이 함수는 유니코드, Windows 코드 페이지 1252 및 레거시 인코딩에서 발견되는 것을 포함하여 다양한 스마트 따옴표 변형을 포함합니다. strtr을 사용하면 스마트 따옴표의 모든 인스턴스가 해당 유니코드 표현으로 바뀌어 일관되고 표준화된 텍스트가 생성됩니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3