Ingeniería de funciones
La ingeniería de funciones se describe como un paso de preprocesamiento en el aprendizaje automático que transforma los datos sin procesar en un conjunto más efectivo de entradas que tienen varios atributos conocidos como características.
El éxito de los modelos de aprendizaje automático depende en gran medida de la calidad de las funciones utilizadas para entrenarlos. La ingeniería de características implica un conjunto de técnicas que nos permiten crear nuevas características combinando o transformando las existentes. Estas técnicas ayudan a resaltar los patrones y relaciones más importantes en los datos, lo que a su vez ayuda al modelo de aprendizaje automático a aprender de los datos de manera más efectiva.
Técnicas clave en ingeniería de funciones
La ingeniería de funciones se puede clasificar en dos pasos clave, a saber;
Preprocesamiento de datos
Comprensión empresarial (conocimiento del dominio)
Preprocesamiento de datos
Este suele ser un paso en la ingeniería de funciones e implica preparar y manipular los datos según las necesidades actuales del lenguaje de máquina. Aquí se utilizan varias técnicas entre ellas;
Manejo de valores perdidos donde se pueden emplear técnicas como la imputación (media, mediana, moda) o el uso de algoritmos que manejan valores perdidos de forma nativa.
Codificación de variables categóricas donde los datos categóricos se deben convertir a formato numérico para la mayoría de los algoritmos utilizando métodos comunes como codificación one-hot, codificación de etiquetas y codificación de destino.
Escalado y normalización donde el escalado de características garantiza que contribuyan por igual al modelo. Las técnicas incluyen estandarización (puntuación z)
Interacción de funciones y creación de funciones donde las funciones existentes se combinan para crear nuevas funciones, creando así relaciones complejas con los datos
Reducción de dimensionalidad donde técnicas como PCA (Análisis de componentes principales) o t-SNE reducen la cantidad de funciones conservando la información más importante.
EDA también se puede utilizar en ingeniería de funciones y suele ser un precursor de la ingeniería de funciones.
Conocimiento del dominio
El conocimiento del dominio se refiere a la comprensión y la experiencia en un campo o industria específica. En la ingeniería de funciones, implica aplicar conocimientos y comprender el contexto y las relaciones de los datos para crear funciones significativas que puedan mejorar el rendimiento del modelo.
Ayuda a identificar qué características son relevantes para el problema en cuestión y a comprender las relaciones de los datos.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3