Ingénierie des fonctionnalités
L'ingénierie des fonctionnalités est décrite comme une étape de prétraitement dans l'apprentissage automatique qui transforme les données brutes en un ensemble plus efficace d'entrées possédant plusieurs attributs appelés fonctionnalités.
Le succès des modèles d'apprentissage automatique dépend fortement de la qualité des fonctionnalités utilisées pour les entraîner. L'ingénierie des fonctionnalités implique un ensemble de techniques qui nous permettent de créer de nouvelles fonctionnalités en combinant ou en transformant celles existantes. Ces techniques aident à mettre en évidence les modèles et les relations les plus importants dans les données, ce qui aide le modèle d'apprentissage automatique à apprendre plus efficacement des données.
Techniques clés de l'ingénierie des fonctionnalités
L'ingénierie des fonctionnalités peut être classée en deux étapes clés, à savoir :
Prétraitement des données
Compréhension commerciale (connaissance du domaine)
Prétraitement des données
Il s'agit généralement d'une étape de l'ingénierie des fonctionnalités et implique la préparation et la manipulation des données selon les besoins actuels du langage machine. Diverses techniques sont utilisées ici parmi elles ;
Gestion des valeurs manquantes où des techniques telles que l'imputation (moyenne, médiane, mode) ou l'utilisation d'algorithmes qui gèrent les valeurs manquantes de manière native peuvent être utilisées.
Encodage de variables catégorielles où les données catégorielles doivent être converties sous forme numérique pour la plupart des algorithmes en utilisant des méthodes courantes telles que l'encodage à chaud, l'encodage d'étiquettes et l'encodage cible.
Mise à l'échelle et normalisation où les fonctionnalités de mise à l'échelle garantissent qu'elles contribuent de manière égale au modèle. Les techniques incluent la standardisation (z-score)
Interaction de fonctionnalités et création de fonctionnalités où les fonctionnalités existantes sont combinées pour créer de nouvelles fonctionnalités, créant ainsi des relations complexes avec les données
Réduction de dimensionnalité où des techniques telles que PCA (Principal Component Analysis) ou t-SNE réduisent le nombre de fonctionnalités tout en conservant les informations les plus importantes.
EDA peut également être utilisé dans l'ingénierie de fonctionnalités et est généralement un précurseur de l'ingénierie de fonctionnalités.
Connaissance du domaine
La connaissance du domaine fait référence à la compréhension et à l'expertise dans un domaine ou une industrie spécifique. Dans l'ingénierie des fonctionnalités, cela implique d'appliquer des informations et de comprendre le contexte et les relations des données pour créer des fonctionnalités significatives susceptibles d'améliorer les performances du modèle.
Cela aide à identifier les fonctionnalités pertinentes pour le problème en question et à comprendre les relations entre les données.
Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.
Copyright© 2022 湘ICP备2022001581号-3