Engenharia de recursos
A Engenharia de Recursos é descrita como uma etapa de pré-processamento no aprendizado de máquina que transforma dados brutos em um conjunto mais eficaz de entradas que possuem vários atributos conhecidos como recursos.
O sucesso dos modelos de aprendizado de máquina depende muito da qualidade dos recursos usados para treiná-los. A engenharia de recursos envolve um conjunto de técnicas que nos permitem criar novos recursos combinando ou transformando os existentes. Essas técnicas ajudam a destacar os padrões e relacionamentos mais importantes nos dados, o que, por sua vez, ajuda o modelo de aprendizado de máquina a aprender com os dados de maneira mais eficaz.
Técnicas-chave em engenharia de recursos
A Engenharia de Recursos pode ser classificada em duas etapas principais, a saber;
Pré-processamento de dados
Compreensão do negócio (conhecimento do domínio)
Pré-processamento de dados
Geralmente, essa é uma etapa da engenharia de recursos e envolve a preparação e a manipulação dos dados de acordo com as necessidades atuais da linguagem de máquina. Várias técnicas são usadas aqui entre elas;
Tratamento de valores ausentes onde técnicas como imputação (média, mediana, modo) ou uso de algoritmos que lidam com valores ausentes nativamente podem ser empregadas.
Codificação de variáveis categóricas onde os dados categóricos devem ser convertidos em formato numérico para a maioria dos algoritmos usando métodos comuns como codificação one-hot, codificação de rótulo e codificação de destino.
Escalonamento e normalização, onde os recursos de dimensionamento garantem que eles contribuam igualmente para o modelo. As técnicas incluem padronização (pontuação z)
Interação e criação de recursos, onde recursos existentes são combinados para criar novos recursos, criando assim relacionamentos complexos com os dados
Redução de Dimensionalidade onde técnicas como PCA (Análise de Componentes Principais) ou t-SNE reduzem o número de recursos enquanto retêm as informações mais importantes.
EDA também pode ser utilizado na engenharia de recursos e geralmente é um precursor da engenharia de recursos.
Conhecimento do domínio
O conhecimento do domínio refere-se à compreensão e experiência em um campo ou setor específico. Na engenharia de recursos, envolve a aplicação de insights e compreensão do contexto e dos relacionamentos dos dados para criar recursos significativos que podem melhorar o desempenho do modelo.
Ajuda a identificar quais recursos são relevantes para o problema em questão e a entender as relações de dados.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3