Un nuevo estudio ha expuesto el racismo encubierto incrustado en los modelos de lenguaje de IA, particularmente en su tratamiento del inglés afroamericano (AAE). A diferencia de investigaciones anteriores que se centran en el racismo manifiesto (como el estudio CrowS-Pairs para medir los prejuicios sociales en Masked LLM), este estudio pone especial énfasis en cómo los modelos de IA perpetúan sutilmente los estereotipos negativos a través de prejuicios dialectales. Estos sesgos no son visibles de inmediato, pero se manifiestan de manera obvia, como asociar a los hablantes de AAE con trabajos de menor estatus y juicios penales más severos.
El estudio encontró que incluso los modelos entrenados para reducir el sesgo abierto todavía albergan prejuicios profundamente arraigados. Esto podría tener implicaciones de gran alcance, especialmente a medida que los sistemas de IA se integran cada vez más en áreas críticas como el empleo y la justicia penal, donde la justicia y la equidad son fundamentales por encima de todo.
Los investigadores emplearon una técnica llamada “sondeo de apariencia coincidente” para descubrir estos sesgos. Al comparar cómo respondieron los modelos de IA a textos escritos en inglés americano estándar (SAE) versus AAE, pudieron demostrar que los modelos asocian consistentemente AAE con estereotipos negativos, incluso cuando el contenido era idéntico. Este es un claro indicador de un defecto fatal en los métodos actuales de entrenamiento de IA: las mejoras superficiales en la reducción del racismo manifiesto no se traducen necesariamente en la eliminación de formas de prejuicios más profundas e insidiosas.
Sin duda, la IA seguirá evolucionando e integrándose en más aspectos de la sociedad. Sin embargo, eso también aumenta el riesgo de perpetuar e incluso amplificar las desigualdades sociales existentes, en lugar de mitigarlas. Escenarios como estos son la razón por la que estas discrepancias deben abordarse como una prioridad.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3