Exemplo de classificador de árvore de decisão para prever a rotatividade de clientes

Primeira página > Programação > Exemplo de classificador de árvore de decisão para prever a rotatividade de clientes

Exemplo de classificador de árvore de decisão para prever a rotatividade de clientes

Postado em 2025-02-06

Navegar:480

Decision Tree Classifier Example to Predict Customer Churn

Exemplo de classificador de árvore de decisão para prever a rotatividade de clientes

Visão geral

Este projeto demonstra como prever a rotatividade de clientes (se um cliente deixa um serviço) usando um classificador de árvore de decisão. O conjunto de dados inclui recursos como AGE , cobranças mensais e chamadas de atendimento ao cliente , com o objetivo de prever se um cliente agitará ou não.

O modelo é treinado usando o classificador de árvore de decisão do Scikit-Learn, e o código visualiza a árvore de decisão para entender melhor como o modelo está tomando decisões.

Tecnologias usadas

python 3.x : idioma primário usado para criar o modelo.
pandas : para manipulação de dados e manuseio de dados.
matplotlib : para visualização de dados (plotando a árvore de decisão).
scikit-learn : para aprendizado de máquina, incluindo treinamento e avaliação de modelo.

Etapas explicadas

importar bibliotecas necessárias

Importar pandas como PD importar matplotlib.pyplot como pLT alertas de importação de sklearn.model_selection importar trem_test_split De Sklearn.tree importar DecisionAclassifier de Sklearn.Metrics Importar Precuracy_Score da árvore de importação de Sklearn

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

pandas (pd):
matplotlib (plt):
avisos (avisos):
scikit-learn bibliotecas:
- TRAIN_TEST_SPLIT : Esta função divide o conjunto de dados em subconjuntos de treinamento e teste. Os dados de treinamento são usados para ajustar o modelo e os dados de teste são usados para avaliar seu desempenho.
- DecisionTreeClassifier : Este é o modelo que será usado para classificar os dados e prever a rotatividade do cliente. As árvores de decisão funcionam criando um modelo de decisões semelhantes a árvores com base nos recursos.
- precuracy_score : Esta função calcula a precisão do modelo comparando os valores previstos com os valores reais da variável de destino (Churn).
- árvore : Este módulo inclui funções para visualizar a árvore de decisão assim que for treinada.

suprimindo avisos

Warnings.filterwarnings ("ignorar")

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

ignorar todos os avisos . Pode ser útil quando você está executando modelos e não deseja avisos (como os sobre funções depreciados) para desordem a saída.

criando um conjunto de dados sintético

data = { 'CustomerId': Range (1, 101), # ID exclusivo para cada cliente 'Idade': [20, 25, 30, 35, 40, 45, 50, 55, 60, 65]*10, # idade dos clientes 'MonthlyCharge': [50, 60, 70, 80, 90, 100, 110, 120, 130, 140]*10, # Valor mensal da fatura 'CustomerServiceCalls': [1, 2, 3, 4, 0, 1, 2, 3, 4, 0]*10, # Número de chamadas de atendimento ao cliente 'Agitação': ['não', 'não', 'sim', 'não', 'sim', 'não', 'sim', 'sim', 'não', 'sim']*10 # status de rotatividade } df = pd.dataframe (dados) Imprimir (df.head ())

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

aqui, criamos um conjunto de dados sintéticos
para o projeto. Esse conjunto de dados simula as informações do cliente para uma empresa de telecomunicações, com recursos como idade, carcaça mensal, consumidores de serviços e a variável de destino (se o cliente agitou ou não).
- : identificador exclusivo para cada cliente.
- : idade do cliente.
- : fatura mensal do cliente. CustomerViceCalls
- churn
: os dados são estruturados como um dataframe (df), uma estrutura de dados marcada bidimensional, permitindo manipulação e análise fácil de dados.

4.

x = df [['Age', 'MonthlyCharge', 'CustomerViceCalls']] # Recursos y = df ['rotatividade'] # Variável de destino

X = df[['Age', 'MonthlyCharge', 'CustomerServiceCalls']]  # Features
y = df['Churn']  # Target Variable

Recursos (x)

Variável de destino (y)
5.

x_train, x_test, y_train, y_test = trens_test_split (x, y, test_size = 0.3, random_state = 42)

X = df[['Age', 'MonthlyCharge', 'CustomerServiceCalls']]  # Features
y = df['Churn']  # Target Variable

TRANHO_TEST_SPLIT

Conjunto de treinamento (usado para treinar o modelo) e um conjunto de testes test_size = 0.3 : 30% dos dados são reservados para teste e os 70% restantes são usados para treinamento.
- random_state = 42 garante a reprodutibilidade dos resultados corrigindo a semente para o gerador de números aleatórios.
Treinando o modelo da árvore de decisão

clf = DecisionTreeClassifier () clf.fit (x_train, y_train)

clf = DecisionTreeClassifier()
clf.fit(X_train, y_train)

inicializa o modelo da árvore de decisão.

clf.fit (x_train, y_train) treina o modelo usando os dados de treinamento. O modelo aprende padrões dos recursos x_train para prever a variável de destino y_train.
7. fazendo previsões

y_pred = clf.predict (x_test)

y_pred = clf.predict(X_test)

: Depois que o modelo for treinado, ele é usado para fazer previsões no conjunto de testes (x_test). Esses valores previstos são armazenados em y_pred, e nós os compararemos com os valores reais (y_test) para avaliar o modelo.

8. avaliando o modelo

precisão = precisão_score (y_test, y_pred) print (f "Precisão: {precisão}")

accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")

calcula a precisão do modelo comparando os rótulos previstos de rotatividade (y_pred) com os rótulos reais de rotatividade (y_test) do teste.

A precisão é uma medida de quantas previsões estavam corretas. É impresso para avaliação.
9. visualizando a árvore de decisão

plt.figure (figSize = (12, 8)) TREE.PLOT_TREE (CLF, preenchido = true, feste_names = ['Age', 'MonthlyCharge', 'CustomerViceCalls'], Class_Names = ['No Churn', 'Churn']))) plt.show ()

árvore.plot_tree (clf, preenchido = true)

plt.figure(figsize=(12, 8))
tree.plot_tree(clf, filled=True, feature_names=['Age', 'MonthlyCharge', 'CustomerServiceCalls'], class_names=['no churn', 'churn'])
plt.show()

Feecher_Names : Especifica os nomes dos recursos (variáveis independentes) para exibir na árvore.
class_names : especifica os rótulos da classe para a variável de destino (churn).
plt.show () : exibe a visualização da árvore.
Executando o código

clone o repositório ou faça o download do script.

Instale dependências:

Instale os pandas matplotlib scikit-learn

   pip install pandas matplotlib scikit-learn

Declaração de lançamento Este artigo é reproduzido em: https://dev.to/atifwattoo/decision-tree-cassifier-example-to-predict-customer-hurn-51fc?1 Se houver alguma infração, entre em contato com [email protected] para excluir isto.

Tutorial mais recente Mais>

Você pode usar o CSS para colorir a saída do console no Chrome e no Firefox?
exibindo cores no javascript Console é possível usar o console do Chrome para exibir texto colorido, como vermelho para erros, laranja para al...

Programação Postado em 2025-04-07
Qual método é mais eficiente para a detecção de ponto em polígono: rastreamento de raio ou path.contains_points?
detecção de ponto-em-polígono eficiente em python determinar se um ponto está dentro de um polígono é uma tarefa frequente na geometria computac...

Programação Postado em 2025-04-07
Como posso selecionar programaticamente todo o texto dentro de uma div em mouse clique?
selecionando programaticamente o texto div no mouse click question dado um elemento Div com conteúdo de texto, como o usuário pode selecionar ...

Programação Postado em 2025-04-07
$Como corrigir \ "mysql_config não encontrou um erro \" ao instalar o mysql-python no ubuntu/linux?$
Como corrigir \ "mysql_config não encontrou um erro \" ao instalar o mysql-python no ubuntu/linux?
MySQL-Python Erro de instalação: "mysql_config não encontrado" tentando um erro indicador que "sQl-python na caixa ubuntu/linux...

Programação Postado em 2025-04-07
Quais foram as restrições ao usar o current_timestamp com colunas de registro de data e hora em MySQL antes da versão 5.6.5?
restrições em colunas de timestamp com current_timestamp no padrão ou na atualização de cláusulas nas versões MySQL antes de 5.6.5 historicament...

Programação Postado em 2025-04-07
Como implementar uma função de hash genérico para tuplas em coleções não ordenadas?
função de hash genérico para tuplas em coleções não ordenadas o std :: não -ordered_map e std :: uncomered_set contêineres fornecem pesquisa e...

Programação Postado em 2025-04-07
Como redirecionar vários tipos de usuários (alunos, professores e administradores) para suas respectivas atividades em um aplicativo Firebase?
RED: Como redirecionar vários tipos de usuário para as respectivas atividades compreender o problema e um aplicativo de votamento de que é...

Programação Postado em 2025-04-07
Objetos-ajuste: a capa falha no IE e na borda, como consertar?
object-fit: a capa falha no ie e borda, como corrigir? utilizando objeto-fit: cover; No CSS, para manter a altura consistente da imagem funcio...

Programação Postado em 2025-04-07
Como superar as restrições de redefinição da função do PHP?
superando a função do PHP Redefinição limitações em php, definir uma função com o mesmo nome várias vezes é um não-no. Tentar fazê -lo, como v...

Programação Postado em 2025-04-07
Como limitar o intervalo de rolagem de um elemento dentro de um elemento pai de tamanho dinâmico?
implementando limites de altura CSS para elementos de rolagem vertical em uma interface interativa, o controle do comportamento de rolagem dos...

Programação Postado em 2025-04-07
Como você pode definir variáveis nos modelos de lâmina de Laravel elegantemente?
definindo variáveis nos modelos de lâmina de Laravel com elegance entender como atribuir variáveis nos modelos de blade é crucial para arm...

Programação Postado em 2025-04-07
Como posso unindo tabelas de banco de dados com diferentes números de colunas?
tabelas combinadas com diferentes colunas ] pode encontrar desafios ao tentar mesclar tabelas de banco de dados com colunas diferentes. Uma man...

Programação Postado em 2025-04-07
Como exibir corretamente a data e a hora atuais em formato "dd/mm/yyyy hh: mm: ss.ss" em java?
como exibir a data e a hora atuais em "dd/mm/yyyy hh: mm: ss.ss" formato no código java fornecido, o problema com a exibição da data...

Programação Postado em 2025-04-07
Como converter com eficiência fusos horários em PHP?
Conversão eficiente do fuso horário em php No PHP, o manuseio dos fusos horários pode ser uma tarefa direta. Este guia fornecerá um método fácil...

Programação Postado em 2025-04-07
Por que há listras no meu fundo linear de gradiente e como posso consertá -las?
banindo as faixas de fundo do gradiente linear Ao empregar a propriedade linear de gradiente para um plano de fundo, você pode encontrar listr...

Programação Postado em 2025-04-07

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo