의사 결정 트리 분류기 예를 예측하는 고객 이탈을 예측합니다

첫 장 > 프로그램 작성 > 의사 결정 트리 분류기 예를 예측하는 고객 이탈을 예측합니다

의사 결정 트리 분류기 예를 예측하는 고객 이탈을 예측합니다

2025-02-06에 게시되었습니다

검색:848

Decision Tree Classifier Example to Predict Customer Churn

의사 결정 트리 분류기 예를 예측하는 고객 이탈을 예측합니다

개요

이 프로젝트는 의사 결정 트리 분류기를 사용하여 고객이 서비스를 떠나는 지 여부를 예측하는 방법을 보여줍니다. 데이터 세트에는 age , 월별 요금 및 고객 서비스 호출 와 같은 기능이 포함되어 있습니다.

모델은 Scikit-Learn의 의사 결정 트리 분류기를 사용하여 교육을 받고 코드는 의사 결정 트리를 시각화하여 모델이 결정을 내리는 방법을 더 잘 이해합니다.

사용 된 기술

Python 3.x : 모델 구축에 사용되는 기본 언어.
pandas : 데이터 조작 및 처리 데이터 세트 용.
matplotlib : 데이터 시각화 (의사 결정 트리 플로팅).
Scikit-Learn : 모델 교육 및 평가를 포함한 머신 러닝 용.

설명 된 단계

필요한 라이브러리 가져 오기

팬더를 PD로 가져옵니다 matplotlib.pyplot을 plt로 가져옵니다 경고 수입 sklearn.model_selection import train_test_split sklearn.tree 가져 오기 의사 결정 treeclassifier Sklearn.metrics import accuracy_score에서 Sklearn 수입 트리에서

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

pandas (pd) :
matplotlib (plt) :
경고 (경고) :
scikit-learn 라이브러리 :
- train_test_split :이 기능은 데이터 세트를 교육 및 테스트 하위 집합으로 분할합니다. 교육 데이터는 모델에 맞는 데 사용되며 테스트 데이터는 성능을 평가하는 데 사용됩니다.
- DecisionTreeClassifier : 이것은 데이터를 분류하고 고객 이탈을 예측하는 데 사용될 모델입니다. 의사 결정 트리는 기능을 기반으로 나무와 같은 의사 결정 모델을 만들어 작동합니다.
- accuracy_score :이 함수는 예측 된 값을 대상 변수의 실제 값과 비교하여 모델의 정확도를 계산합니다.
- tree :이 모듈은 훈련이 끝나면 의사 결정 트리를 시각화하는 기능이 포함되어 있습니다.

경고 억제

warnings.filterwarnings ( "무시")

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

모든 경고를 무시하도록 지시합니다 . 모델을 실행할 때 도움이 될 수 있으며 (감가 상승 된 기능에 관한 것과 같은) 출력을 혼란스럽게하는 경고를 원하지 않습니다.

합성 데이터 세트 만들기

data = { 'CustomerID': Range (1, 101), # 각 고객에 대한 고유 ID 'Age': [20, 25, 30, 35, 40, 45, 50, 55, 60, 65]*10, # 고객의 연령 '월간 충전': [50, 60, 70, 80, 90, 100, 110, 120, 130, 140]*10, # 월간 청구서 금액 'CustomerserViceCalls': [1, 2, 3, 4, 0, 1, 2, 3, 4, 0]*10, # 고객 서비스 전화 번호 '이탈':

data = {
    'CustomerID': range(1, 101),  # Unique ID for each customer
    'Age': [20, 25, 30, 35, 40, 45, 50, 55, 60, 65]*10,  # Age of customers
    'MonthlyCharge': [50, 60, 70, 80, 90, 100, 110, 120, 130, 140]*10,  # Monthly bill amount
    'CustomerServiceCalls': [1, 2, 3, 4, 0, 1, 2, 3, 4, 0]*10,  # Number of customer service calls
    'Churn': ['No', 'No', 'Yes', 'No', 'Yes', 'No', 'Yes', 'Yes', 'No', 'Yes']*10  # Churn status
}

df = pd.DataFrame(data)
print(df.head())

여기, 우리는 프로젝트를위한 합성 데이터 세트 를 만듭니다. 이 데이터 세트는 AGE, 월별 충전, 고객 서비스 이탈 (고객이 휘젓거나 휘젓는 지)와 같은 기능을 갖춘 통신 회사의 고객 정보를 시뮬레이션합니다.
- customerId : 각 고객에 대한 고유 식별자.
- 나이 : 고객의 나이.
- 월간 충전 : 고객의 월간 청구서.
- customerservicecalls : 고객이 고객 서비스라고 불리는 횟수.
- 이탈 : 고객이 휘젓는 지 (예/아니오)
4. 기능 분할 기능과 대상 변수

# 기능 y = df

# 대상 변수

X = df[['Age', 'MonthlyCharge', 'CustomerServiceCalls']]  # Features
y = df['Churn']  # Target Variable

: 대상을 예측하는 데 사용되는 독립 변수. 이 경우 연령, 월 충전 및 고객 서비스가 포함됩니다.

대상 변수 (y) : 종속 변수는 예측하려는 값입니다. 여기에서는 Churn 열입니다. 이는 고객이 이탈 할 것인지 아닌지를 나타냅니다.
5. 데이터를 교육 및 테스트 세트로 분할

x_train, x_test, y_train, y_test = train_test_split (x, y, test_size = 0.3, random_state = 42)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

데이터 세트를 두 부분으로 나눕니다.

test_size = 0.3 : 데이터의 30%가 테스트를 위해 따로 설정되었고 나머지 70%는 교육에 사용됩니다. random_state = 42 임의의 숫자 생성기의 시드를 고정하여 결과의 재현성을 보장합니다.
- 의사 결정 트리 모델 훈련

DectionTreeClassifier () 의사 결정 트리 모델을 초기화합니다.

clf = DecisionTreeClassifier()
clf.fit(X_train, y_train)

는 교육 데이터를 사용하여 모델을 훈련시킵니다. 이 모델은 y_train target 변수를 예측하기 위해 x_train 기능의 패턴을 학습합니다.

7. 예측 만들기
y_pred = clf.predict (x_test)

clf.predict (x_test) : 모델을 훈련 한 후 테스트 세트 (x_test)를 예측하는 데 사용됩니다. 이 예측 된 값은 y_pred에 저장되며 모델을 평가하기 위해 실제 값 (y_test)과 비교할 것입니다. .

y_pred = clf.predict(X_test)

모델 평가

정확도 = accuracy_score (y_test, y_pred) print (f "정확도 : {정확도}")

accuracy_score (y_test, y_pred) 예측 된 이탈 레이블 (y_pred)을 테스트 세트에서 실제 이탈 레이블 (y_test)과 비교하여 모델의 정확도를 계산합니다.

accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")

는 얼마나 많은 예측이 올바른지 측정합니다. 평가를 위해 인쇄됩니다.

9. 의사 결정 트리 시각화
plt.figure (figsize = (12, 8)) tree.plot_tree (clf, closed = true, feaction_names = , class_names =

tree.plot_tree (clf, closed = true)

: 훈련 된 의사 결정 트리 모델을 시각화합니다. CLASS 라벨 (Churn/No Churn)을 기반으로 한 노드를 채우는 = 진정한 인수.

plt.figure(figsize=(12, 8))
tree.plot_tree(clf, filled=True, feature_names=['Age', 'MonthlyCharge', 'CustomerServiceCalls'], class_names=['no churn', 'churn'])
plt.show()

: 트리에 표시 할 기능 (독립 변수)의 이름을 지정합니다.
: 대상 변수 (Churn)의 클래스 레이블을 지정합니다.
: 트리 시각화를 표시합니다.
코드 실행

종속성 설치 :

Python 스크립트 또는 Jupyter 노트북을 실행하여 모델을 훈련시키고 의사 결정 트리를 시각화하십시오.

   pip install pandas matplotlib scikit-learn

릴리스 선언문 이 기사는 https://dev.to/atifwattoo/decision-tree-classifier-example-topredict-customer-churn-51fc ?1에서 재현됩니다. 그것.

최신 튜토리얼 더>

$Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?$
Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?
Ray Tracing MethodThe ray tracing method intersects a horizontal ray from the point under examination with the polygon's sides. 교차로의 수를 계산하고 지점이 패...

프로그램 작성 2025-04-07에 게시되었습니다
Visual Studio 2012의 DataSource 대화 상자에 MySQL 데이터베이스를 추가하는 방법은 무엇입니까?
MySQL 커넥터 v.6.5.4가 설치되어 있지만 Entity 프레임 워크의 DataSource 대화 상자에 MySQL 데이터베이스를 추가 할 수 없습니다. 이를 해결하기 위해 MySQL 용 공식 Visual Studio 2012 통합은 MySQL 커넥터 v.6....

프로그램 작성 2025-04-07에 게시되었습니다
버전 5.6.5 이전에 MySQL의 Timestamp 열을 사용하여 current_timestamp를 사용하는 데 제한 사항은 무엇입니까?
5.6.5 이전에 mysql 버전의 기본적으로 또는 업데이트 클로즈가있는 타임 스탬프 열의 제한 사항 5.6.5 5.6.5 이전에 mySQL 버전에서 Timestamp Holumn에 전적으로 기본적으로 한 제한 사항이 있었는데, 이는 제한적으로 전혀 ...

프로그램 작성 2025-04-07에 게시되었습니다
Object-Fit : IE 및 Edge에서 표지가 실패, 수정 방법?
이 문제를 해결하기 위해 문제를 해결하는 영리한 CSS 솔루션을 사용합니다. -50%); 높이 : 100%; 너비 : 자동; // 수직 블록의 경우 높이 : 자동; 너비 : 100%; // 수평 블록의 경우 이 조합은 절대 포지셔닝을 사용하여 중앙에서 ...

프로그램 작성 2025-04-07에 게시되었습니다
$PHP \의 기능 재정의 제한을 극복하는 방법은 무엇입니까?$
PHP \의 기능 재정의 제한을 극복하는 방법은 무엇입니까?
return $ a * $ b; } 그러나 PHP 도구 벨트에는 숨겨진 보석이 있습니다. runkit_function_rename () runkit_function_rename ( 'this', 'that'); run...

프로그램 작성 2025-04-07에 게시되었습니다
동적 인 크기의 부모 요소 내에서 요소의 스크롤 범위를 제한하는 방법은 무엇입니까?
문제 : 고정 된 사이드 바로 조정을 유지하면서 사용자의 수직 스크롤과 함께 이동하는 스크롤 가능한 맵 디브가있는 레이아웃을 고려합니다. 그러나 맵의 스크롤은 뷰포트의 높이를 초과하여 사용자가 페이지 바닥 글에 액세스하는 것을 방지합니다. ...

프로그램 작성 2025-04-07에 게시되었습니다
열의 열이 다른 데이터베이스 테이블을 어떻게 통합하려면 어떻게해야합니까?
다른 열이있는 결합 테이블 ] 는 데이터베이스 테이블을 다른 열로 병합하려고 할 때 도전에 직면 할 수 있습니다. 간단한 방법은 열이 적은 테이블의 누락 된 열에 null 값을 추가하는 것입니다. 예를 들어, 표 B보다 더 많은 열이있는 두 개의 테이블,...

프로그램 작성 2025-04-07에 게시되었습니다
선형 구배 배경에 줄무늬가있는 이유는 무엇이며 어떻게 고칠 수 있습니까?
수직 지향적 구배의 경우, 신체 요소의 마진은 HTML 요소로 전파되어 8px 키가 큰 영역을 초래합니다. 그 후, 선형 등급은이 전체 높이에 걸쳐 확장되어 반복 패턴을 생성합니다. 솔루션 : 이 문제를 해결하기 위해 신체 요소에 충분한 높이가 있는지...

프로그램 작성 2025-04-07에 게시되었습니다
$\ "(1) 대 (;;) : 컴파일러 최적화는 성능 차이를 제거합니까? \"$
\ "(1) 대 (;;) : 컴파일러 최적화는 성능 차이를 제거합니까? \"
대답 : 대부분의 최신 컴파일러에는 (1)과 (;;). 컴파일러 : s-> 7 8 v-> 4를 풀립니다 -e syntax ok gcc : GCC에서 두 루프는 다음과 같이 동일한 어셈블리 코드로 컴파일합니다. . t_while : ...

프로그램 작성 2025-04-07에 게시되었습니다
McRypt에서 OpenSSL로 암호화를 마이그레이션하고 OpenSSL을 사용하여 McRypt 암호화 데이터를 해제 할 수 있습니까?
질문 : McRypt에서 OpenSSL로 내 암호화 라이브러리를 업그레이드 할 수 있습니까? 그렇다면 어떻게? 대답 : 대답 : 예, McRypt에서 암호화 라이브러리를 OpenSSL로 업그레이드 할 수 있습니다. OpenSSL을 사용하여 McRyp...

프로그램 작성 2025-04-07에 게시되었습니다
JavaScript 객체에서 키를 동적으로 설정하는 방법은 무엇입니까?
jsobj = 'example'1; jsObj['key' i] = 'example' 1; 배열은 특수한 유형의 객체입니다. 그것들은 숫자 특성 (인치) + 1의 수를 반영하는 길이 속성을 유지합니다. 이 특별한 동작은 표준 객체에...

프로그램 작성 2025-04-07에 게시되었습니다
regex를 사용하여 PHP에서 괄호 안에서 텍스트를 추출하는 방법
$ fullstring = "이 (텍스트)을 제외한 모든 것을 무시하는 것"; $ start = strpos ( ', $ fullstring); $ fullString); $ shortstring = substr ($ fulls...

프로그램 작성 2025-04-07에 게시되었습니다
Java는 여러 반환 유형을 허용합니까 : 일반적인 방법을 자세히 살펴보십시오.
public 목록 getResult (문자열 s); 여기서 foo는 사용자 정의 클래스입니다. 이 방법 선언은 두 가지 반환 유형을 자랑하는 것처럼 보입니다. 목록과 E. 그러나 이것이 사실인가? 일반 방법 : 미스터리 메소드는 단일...

프로그램 작성 2025-04-07에 게시되었습니다
Firefox Back 버튼을 사용할 때 JavaScript 실행이 중단되는 이유는 무엇입니까?
원인 및 솔루션 : 이 동작은 브라우저 캐싱 자바 스크립트 리소스에 의해 발생합니다. 이 문제를 해결하고 후속 페이지 방문에서 스크립트가 실행되도록하기 위해 Firefox 사용자는 Window.onload 이벤트에서 호출되도록 빈 기능을 설정해야합니다. ...

프로그램 작성 2025-04-07에 게시되었습니다
Google API에서 최신 JQuery 라이브러리를 검색하는 방법은 무엇입니까?
https://code.jquery.com/jquery-latest.min.js (jQuery Hosted, Minified) https://code.jquery.com/jquery-latest.js (JQuery Hosted, Hosted, 비 압축) 압축...

프로그램 작성 2025-04-07에 게시되었습니다