مثال على مصنف شجرة القرار للتنبؤ بتشويش العميل

الصفحة الأمامية > برمجة > مثال على مصنف شجرة القرار للتنبؤ بتشويش العميل

مثال على مصنف شجرة القرار للتنبؤ بتشويش العميل

نشر في 2025-02-06

تصفح:520

Decision Tree Classifier Example to Predict Customer Churn

مثال على مصنف شجرة القرار للتنبؤ بتشويش العميل

ملخص

يوضح هذا المشروع كيفية التنبؤ بمضايقة العملاء (سواء كان العميل يترك خدمة) باستخدام مصنف شجرة القرار. تتضمن مجموعة البيانات ميزات مثل و رسوم شهرية و مكالمات العملاء ، بهدف التنبؤ بما إذا كان العميل سيخفق أم لا.

يتم تدريب النموذج باستخدام مصنف شجرة القرار في Scikit-Learn ، ويتصور الكود شجرة القرار لفهم كيفية اتخاذ القرارات بشكل أفضل.

التقنيات المستخدمة

Python 3.x : اللغة الأساسية المستخدمة لبناء النموذج.
pandas : من أجل معالجة البيانات ومعالجة مجموعات البيانات.
matplotlib : من أجل تصور البيانات (رسم شجرة القرار).
Scikit-Learn : للتعلم الآلي ، بما في ذلك التدريب والتقييم النماذج.

أوضح الخطوات

استيراد المكتبات اللازمة

استيراد الباندا كـ PD استيراد matplotlib.pyplot كما plt تحذيرات استيراد من sklearn.model_selection import train_test_split من Sklearn.tree Import DentreEclassifier من Sklearn.Metrics استيراد Accuracy_Score من شجرة استيراد Sklearn

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

pandas (pd):
matplotlib (plt):
تحذيرات (تحذيرات):
Scikit-Learn المكتبات:
- Train_test_split : تقوم هذه الوظيفة بتقسيم مجموعة البيانات إلى مجموعات تدريب واختبار. يتم استخدام بيانات التدريب لتناسب النموذج ، ويتم استخدام بيانات الاختبار لتقييم أدائها.
- قرار reclassifier : هذا هو النموذج الذي سيتم استخدامه لتصنيف البيانات والتنبؤ بتشجيع العميل. تعمل أشجار القرار من خلال إنشاء نموذج يشبه الأشجار للقرارات بناءً على الميزات.
- ACCURACY_SCORE : تحسب هذه الوظيفة دقة النموذج من خلال مقارنة القيم المتوقعة مع القيم الفعلية للمتغير الهدف (churn).
- شجرة : تتضمن هذه الوحدة وظائف لتصور شجرة القرار بمجرد تدريبها.

قمع التحذيرات

تحذيرات. filterwarnings ("تجاهل")

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

تجاهل جميع التحذيرات . يمكن أن يكون مفيدًا عندما تقوم بتشغيل النماذج ولا تريد تحذيرات (مثل تلك المتعلقة بالوظائف المنهكة) لتفكيك الإخراج.

إنشاء مجموعة بيانات صناعية

data = { 'CustomerId': Range (1 ، 101) ، # معرف فريد لكل عميل "العمر": [20 ، 25 ، 30 ، 35 ، 40 ، 45 ، 50 ، 55 ، 60 ، 65]*10 ، # عمر العملاء "الشهرية الشهرية": [50 ، 60 ، 70 ، 80 ، 90 ، 100 ، 110 ، 120 ، 130 ، 140]*10 ، # شهرية الفاتورة "CustomererviceCalls": [1 ، 2 ، 3 ، 4 ، 0 ، 1 ، 2 ، 3 ، 4 ، 0]*10 ، # عدد مكالمات خدمة العملاء "churn": ["لا" ، "لا" ، "نعم" ، "لا" ، "نعم" ، "لا" ، "نعم" ، "نعم" ، "لا" ، "نعم"]*10 # churn status } df = pd.dataframe (البيانات) طباعة (df.head ())

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

هنا ، نقوم بإنشاء
مجموعة بيانات صناعية للمشروع. تحاكي مجموعة البيانات هذه معلومات العميل لشركة اتصالات ، مع ميزات مثل Age و Donylycharge و CustomererviceCalls و churn المتغير المستهدف (سواء كان العميل قد قام بتشويه أم لا).
- customerId : معرف فريد لكل عميل.
- العمر : عصر العميل.
- شهرية : فاتورة شهرية للعميل.
- customererviceCalls : عدد المرات التي اتصل بها العميل خدمة العملاء.
- churn : ما إذا كان العميل قد تم تخفيفه (نعم/لا).
Pandas DataFrame : يتم تنظيم البيانات كبيانات بيانات (df) ، وهيكل بيانات ثنائي الأبعاد ، مما يسمح بمعالجة البيانات وتحليلها بسهولة.

تقسيم البيانات إلى ميزات ومتغير الهدف

x = df [["العمر" ، "الشهرية" ، "CustomererviceCalls"] y = df ['churn'] # متغير الهدف

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

ميزات (x) : المتغيرات المستقلة المستخدمة للتنبؤ بالهدف. في هذه الحالة ، يشمل العمر ، الشهرية ، و CustomererviceCalls.
المتغير الهدف (y) : المتغير التابع ، وهو القيمة التي تحاول التنبؤ بها. هنا ، هو عمود churn ، الذي يشير إلى ما إذا كان العميل سوف يتخلى أم لا.

تقسيم البيانات إلى مجموعات التدريب والاختبار

x_train ، x_test ، y_train ، y_test = train_test_split (x ، y ، test_size = 0.3 ، random_state = 42)

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

Train_test_split يقسم مجموعة البيانات إلى جزأين: A مجموعة التدريب (تستخدم لتدريب النموذج) و A مجموعة الاختبار (تستخدم لتقييم النموذج).
- test_size = 0.3 : يتم تخصيص 30 ٪ من البيانات للاختبار ، ويتم استخدام 70 ٪ المتبقية للتدريب.
- random_state = 42 يضمن استنساخ النتائج عن طريق إصلاح البذور لمولد الأرقام العشوائية.

تدريب نموذج شجرة القرار

clf = decentreeClassifier () clf.fit (x_train ، y_train)

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

decentreeClassifier () تهيئة نموذج شجرة القرار.
clf.fit (x_train ، y_train) يدرب النموذج باستخدام بيانات التدريب. يتعلم النموذج أنماطًا من ميزات X_Train للتنبؤ بمتغير Targe Y_Train.

إجراء تنبؤات

y_pred = clf.predict (x_test)

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

clf.predict (x_test) : بعد تدريب النموذج ، يتم استخدامه لجعل التنبؤات على مجموعة الاختبار (x_test). يتم تخزين هذه القيم المتوقعة في Y_PRED ، وسنقارنها بالقيم الفعلية (Y_Test) لتقييم النموذج.

تقييم النموذج

الدقة = Accuracy_Score (y_test ، y_pred) PRINT (F "دقة: {دقة}")

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

ACCURACY_SCORE (y_test ، y_pred) يحسب دقة النموذج من خلال مقارنة ملصقات churn المتوقعة (y_pred) مع ملصقات churn الفعلية (y_test) من مجموعة الاختبار.
هي مقياس لعدد التنبؤات كانت صحيحة. يتم طباعته للتقييم.

تصور شجرة القرار

plt.figure (Figsize = (12 ، 8)) tree.plot_tree (clf ، exhip = true ، depative_names = ['age' ، 'monterlycharge' ، 'customererviceCalls'] ، class_names = ['no churn' ، 'churn']) plt.show ()

plt.figure(figsize=(12, 8))
tree.plot_tree(clf, filled=True, feature_names=['Age', 'MonthlyCharge', 'CustomerServiceCalls'], class_names=['no churn', 'churn'])
plt.show()

: تصور نموذج شجرة القرار المدربين. ملء = الوسيطة الحقيقية تلوين العقد على أساس تسمية الفئة (churn/no churn).
: يحدد أسماء الميزات (المتغيرات المستقلة) لعرضها في الشجرة.
: يحدد ملصقات الفئة للمتغير الهدف (churn).
: يعرض تصور الشجرة.

تشغيل الرمز

استنساخ المستودع أو قم بتنزيل البرنامج النصي.

تثبيت التبعيات:

plt.figure(figsize=(12, 8))
tree.plot_tree(clf, filled=True, feature_names=['Age', 'MonthlyCharge', 'CustomerServiceCalls'], class_names=['no churn', 'churn'])
plt.show()

قم بتشغيل البرنامج النصي Python أو دفتر Jupyter لتدريب النموذج وتصور شجرة القرار.

بيان الافراج يتم استنساخ هذه المقالة على: https://dev.to/atifwattoo/decision-tree-classifier-example-to-predict-customer-shurn-51fc؟1 إذا كان هناك أي انتهاك ، فيرجى الاتصال بـ [email protected] لحذف هو - هي.

أحدث البرنامج التعليمي أكثر>

هل يمكنك استخدام CSS لإخراج وحدة التحكم في الكروم و Firefox؟
الرسائل؟ لتحقيق ذلك ، استخدم النمط التالي: console.log ('٪ c oh my Heavens!' ، 'الخلفية: #222 ؛ اللون: #bada55') ؛ في هذا المث...

برمجة نشر في 2025-04-06
كيفية إعادة توجيه أنواع متعددة للمستخدمين (الطلاب والمعلمين والمسؤولين) إلى أنشطتهم في تطبيق Firebase؟
تسجيل الدخول. يدير الكود الحالي بنجاح إعادة التوجيه لنوعين للمستخدمين ، ولكنه يواجه تحديات عند محاولة دمج النوع الثالث (المسؤول). يخطط المخطط الأص...

برمجة نشر في 2025-04-06
كيفية تحويل عمود DataFrame Pandas إلى تنسيق DateTime وتصفية حسب التاريخ؟
تحويل عمود DataFrame pandas إلى تنسيق DateTime عند العمل مع البيانات الزمنية ، قد تظهر الطوابع الزمنية في البداية كسلاسل ولكن يجب تحويلها إلى تنس...

برمجة نشر في 2025-04-06
كيف تستخدم بشكل صحيح مثل الاستعلامات مع معلمات PDO؟
استخدام مثل الاستعلامات في pdo عند محاولة تنفيذ الاستفسارات في pdo ، قد تواجه مشكلات مثل تلك الموصوفة في الاستعلام أدناه: $ params = array ($ ...

برمجة نشر في 2025-04-06
كيف يمكنني استرداد قيم السمات بكفاءة من ملفات XML باستخدام PHP؟
عند العمل مع ملف XML يحتوي على سمات مثل المثال المقدم: Stumped. لحل هذا ، يقدم PHP حلًا مباشرًا باستخدام وظيفة SimplexMlelement :: Attribut...

برمجة نشر في 2025-04-06
لماذا تظهر صورة خلفية CSS الخاصة بي؟
توجد ورقة الصورة والأنماط في نفس الدليل ، ومع ذلك ، تظل الخلفية قماشًا أبيض فارغًا. إرفاق اسم ملف الصورة: -صورة الخلفية: url (nickcage.jpg) ؛ إذ...

برمجة نشر في 2025-04-06
كيف يمكنني التعامل مع عمليات تحميل ملفات متعددة باستخدام FormData ()؟
معالجة تحميلات متعددة مع تحميلات مع FormData () عند العمل مع مدخلات الملفات ، فغالبًا ما يكون من الضروري التعامل مع تحميلات الملفات المتعددة. ...

برمجة نشر في 2025-04-06
كيف يمكنني استبدال سلاسل متعددة بكفاءة في سلسلة Java؟
ومع ذلك ، يمكن أن يكون هذا غير فعال بالنسبة للسلاسل الكبيرة أو عند العمل مع العديد من الأوتار. تتيح لك التعبيرات العادية تحديد أنماط البحث المعقدة ...

برمجة نشر في 2025-04-06
كيفية استرداد الصف الأخير بكفاءة لكل معرف فريد في postgresql؟
postgresql: استخراج الصف الأخير لكل معرف فريد في postgresql ، قد تواجه مواقف حيث تحتاج إلى استخراج المعلومات من الصف الأخير المرتبط بكل معرف م...

برمجة نشر في 2025-04-06
هل يمكن تكديس عناصر لزجة متعددة فوق بعضها البعض في CSS النقي؟
هنا: https://webthemez.com/demo/sticky-multi-header-scroll/index.html فقط أفضل استخدام CSS النقي ، بدلاً من تنفيذ JavaScript. لقد جربت قليلاً ...

برمجة نشر في 2025-04-06
صفيف
الأساليب هي fns التي يمكن استدعاؤها على الكائنات المصفوفات هي كائنات ، وبالتالي لديهم أيضًا طرق في JS. شريحة (ابدأ): استخراج جزء من المص...

برمجة نشر في 2025-04-06
$كيفية حل خطأ \ "الاستخدام غير صالح لوظيفة المجموعة \" في MySQL عند العثور على عدد أقصى؟$
كيفية حل خطأ \ "الاستخدام غير صالح لوظيفة المجموعة \" في MySQL عند العثور على عدد أقصى؟
كيفية استرداد الحد الأقصى لعد باستخدام mysql حدد ماكس (العد (*)) من مجموعة EMP1 بالاسم ؛ خطأ 1111 (hy000): الاستخدام غير الصحيح لوظيفة المجموعة...

برمجة نشر في 2025-04-06
لماذا لا `body {margin: 0 ؛ } `دائما إزالة الهامش العلوي في CSS؟
في كثير من الأحيان ، لا يعطي الرمز المقدم ، مثل "body {margin: 0 ؛}" ، النتيجة المطلوبة. يمكن أن يحدث هذا عندما يكون للعنصر الأصل للمحتوى...

برمجة نشر في 2025-04-06
كيفية الجمع بين البيانات من ثلاثة جداول MySQL في جدول جديد؟
الأشخاص والتفاصيل وجداول التصنيف؟ الإجابة: حدد ص.*، د. من الناس ك انضم إلى التفاصيل كـ D على D.Person_id = p.id انضم إلى التصنيف كـ t على t....

برمجة نشر في 2025-04-06
كيف يمكنني التعامل مع أسماء ملفات UTF-8 في وظائف نظام ملفات PHP؟
url تشفير أسماء الملفات لحل هذه المشكلة ، استخدم وظيفة urlencode لتحويل اسم المجلد المطلوب إلى تنسيق آمن لـ url قبل تمريره إلى mkdir: MKDIR (...

برمجة نشر في 2025-04-06