"Se um trabalhador quiser fazer bem o seu trabalho, ele deve primeiro afiar suas ferramentas." - Confúcio, "Os Analectos de Confúcio. Lu Linggong"
Primeira página > Programação > Engenharia de recursos: o guia definitivo

Engenharia de recursos: o guia definitivo

Publicado em 19/08/2024
Navegar:745

Feature Engineering: The Ultimate Guide

Engenharia de recursos
A Engenharia de Recursos é descrita como uma etapa de pré-processamento no aprendizado de máquina que transforma dados brutos em um conjunto mais eficaz de entradas que possuem vários atributos conhecidos como recursos.

O sucesso dos modelos de aprendizado de máquina depende muito da qualidade dos recursos usados ​​para treiná-los. A engenharia de recursos envolve um conjunto de técnicas que nos permitem criar novos recursos combinando ou transformando os existentes. Essas técnicas ajudam a destacar os padrões e relacionamentos mais importantes nos dados, o que, por sua vez, ajuda o modelo de aprendizado de máquina a aprender com os dados de maneira mais eficaz.

Técnicas-chave em engenharia de recursos
A Engenharia de Recursos pode ser classificada em duas etapas principais, a saber;

  1. Pré-processamento de dados

  2. Compreensão do negócio (conhecimento do domínio)

Pré-processamento de dados
Geralmente, essa é uma etapa da engenharia de recursos e envolve a preparação e a manipulação dos dados de acordo com as necessidades atuais da linguagem de máquina. Várias técnicas são usadas aqui entre elas;

  • Tratamento de valores ausentes onde técnicas como imputação (média, mediana, modo) ou uso de algoritmos que lidam com valores ausentes nativamente podem ser empregadas.

  • Codificação de variáveis ​​categóricas onde os dados categóricos devem ser convertidos em formato numérico para a maioria dos algoritmos usando métodos comuns como codificação one-hot, codificação de rótulo e codificação de destino.

  • Escalonamento e normalização, onde os recursos de dimensionamento garantem que eles contribuam igualmente para o modelo. As técnicas incluem padronização (pontuação z)

  • Interação e criação de recursos, onde recursos existentes são combinados para criar novos recursos, criando assim relacionamentos complexos com os dados

  • Redução de Dimensionalidade onde técnicas como PCA (Análise de Componentes Principais) ou t-SNE reduzem o número de recursos enquanto retêm as informações mais importantes.

  • EDA também pode ser utilizado na engenharia de recursos e geralmente é um precursor da engenharia de recursos.

Conhecimento do domínio
O conhecimento do domínio refere-se à compreensão e experiência em um campo ou setor específico. Na engenharia de recursos, envolve a aplicação de insights e compreensão do contexto e dos relacionamentos dos dados para criar recursos significativos que podem melhorar o desempenho do modelo.

Ajuda a identificar quais recursos são relevantes para o problema em questão e a entender as relações de dados.

Declaração de lançamento Este artigo foi reproduzido em: https://dev.to/leonmutisya/feature-engineering-the-ultimate-guide-48ip?1 Se houver alguma violação, entre em contato com [email protected] para excluí-la
Tutorial mais recente Mais>

Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.

Copyright© 2022 湘ICP备2022001581号-3