Las comillas tipográficas son marcas tipográficas que se utilizan en lugar de las comillas simples habituales (' y "). Proporcionan una imagen más refinada y aspecto pulido del texto Sin embargo, es común que las aplicaciones de software tengan dificultades para convertir entre diferentes tipos de comillas tipográficas, lo que genera inconsistencias.
La dificultad para convertir comillas tipográficas surge de la variedad de codificaciones y caracteres utilizados para representarlas. Los diferentes sistemas operativos y programas de software emplean sus propios estándares, lo que da como resultado un panorama fragmentado de caracteres de comillas. Un sistema puede usar Unicode, mientras que otro puede usar la página de códigos 1252 de Windows.
Para abordar este desafío, una función integral de conversión de comillas tipográficas en PHP requiere una minuciosa comprensión de las diferentes codificaciones y caracteres involucrados. Debería poder manejar todas las variaciones de comillas tipográficas, incluidas las definidas en Unicode, la página de códigos de Windows 1252 y otras codificaciones heredadas.
La siguiente implementación PHP optimizada convierte todos los tipos de comillas tipográficas en comillas regulares:
function convert_smart_quotes($string)
{
// Create a map of smart quote characters to their respective Unicode representations
$smart_quotes = array(
"\xC2\xAB" => '"', // « (U 00AB)
"\xC2\xBB" => '"', // » (U 00BB)
"\xE2\x80\x98" => "'", // ‘ (U 2018)
"\xE2\x80\x99" => "'", // ’ (U 2019)
"\xE2\x80\x9A" => "'", // ‚ (U 201A)
"\xE2\x80\x9B" => "'", // ‛ (U 201B)
"\xE2\x80\x9C" => '"', // “ (U 201C)
"\xE2\x80\x9D" => '"', // ” (U 201D)
"\xE2\x80\x9E" => '"', // „ (U 201E)
"\xE2\x80\x9F" => '"', // ‟ (U 201F)
"\xE2\x80\xB9" => "'", // ‹ (U 2039)
"\xE2\x80\xBA" => "'", // › (U 203A)
);
// Strtr function can directly replace the smart quote characters with their Unicode counterparts
$converted_string = strtr($string, $smart_quotes);
// Return the converted string
return $converted_string;
}
Esta función cubre una amplia gama de variaciones de comillas tipográficas, incluidas las que se encuentran en Unicode, la página de códigos 1252 de Windows y codificaciones heredadas. Al usar strtr, reemplaza todas las instancias de comillas tipográficas con sus correspondientes representaciones Unicode, lo que da como resultado un texto consistente y estandarizado.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3