"यदि कोई कर्मचारी अपना काम अच्छी तरह से करना चाहता है, तो उसे पहले अपने औजारों को तेज करना होगा।" - कन्फ्यूशियस, "द एनालेक्ट्स ऑफ कन्फ्यूशियस। लू लिंगगोंग"
मुखपृष्ठ > प्रोग्रामिंग > XGBoost: ग्रैडिएंट बूस्टिंग की महाशक्ति

XGBoost: ग्रैडिएंट बूस्टिंग की महाशक्ति

2024-08-01 को प्रकाशित
ब्राउज़ करें:472

XGBoost: The Superpower of Gradient Boosting

XGBoost (एक्सट्रीम ग्रेडिएंट बूस्टिंग) एक शक्तिशाली और व्यापक रूप से उपयोग किया जाने वाला मशीन लर्निंग एल्गोरिदम है, जो विशेष रूप से संरचित डेटा में अपने प्रदर्शन के लिए जाना जाता है। यह अनिवार्य रूप से ग्रेडिएंट बूस्टिंग का एक अत्यधिक अनुकूलित कार्यान्वयन है, एक ऐसी तकनीक जो एक मजबूत भविष्यवक्ता बनाने के लिए कई कमजोर शिक्षार्थियों (जैसे निर्णय वृक्ष) को जोड़ती है।

आइए XGBoost के पीछे के जादू को तोड़ें:

1. ग्रेडिएंट बूस्टिंग, संक्षेप में:

एक-एक करके छोटे, सरल पेड़ों (निर्णय वृक्षों) को जोड़कर एक मॉडल बनाने की कल्पना करें। प्रत्येक नया वृक्ष पिछले वृक्षों द्वारा की गई त्रुटियों को सुधारने का प्रयास करता है। यह पुनरावृत्तीय प्रक्रिया, जहां प्रत्येक पेड़ अपने पूर्ववर्तियों की गलतियों से सीखता है, ग्रेडिएंट बूस्टिंग कहलाती है।

2. XGBoost: इसे अगले स्तर पर ले जाना:

XGBoost कई महत्वपूर्ण सुधारों को शामिल करके ग्रेडिएंट बूस्टिंग को चरम तक ले जाता है:

  • नियमितीकरण: XGBoost मॉडल की जटिलता में दंड जोड़कर ओवरफिटिंग को रोकता है।
  • पेड़ों की छंटाई: यह तकनीक अलग-अलग पेड़ों के आकार और जटिलता को नियंत्रित करने में मदद करती है, साथ ही ओवरफिटिंग को भी रोकती है।
  • विरल डेटा हैंडलिंग: XGBoost को लापता मान वाले डेटा के साथ कुशलता से काम करने के लिए अनुकूलित किया गया है।
  • समानांतर कंप्यूटिंग: XGBoost प्रशिक्षण प्रक्रिया को तेज करने के लिए समानता का लाभ उठाता है, जिससे यह बड़े डेटासेट के लिए उपयुक्त हो जाता है।

3. गणित अंतर्ज्ञान (सरलीकृत):

XGBoost ग्रेडिएंट डिसेंट नामक तकनीक का उपयोग करके हानि फ़ंक्शन (त्रुटि का एक माप) को कम करता है। यहां एक सरलीकृत स्पष्टीकरण दिया गया है:

  • हानि फ़ंक्शन: पूर्वानुमानित और वास्तविक मूल्यों के बीच त्रुटि का प्रतिनिधित्व करता है।
  • ग्रेडिएंट: हानि फ़ंक्शन में सबसे तेज गिरावट की दिशा को इंगित करता है।
  • ग्रेडिएंट डिसेंट: हम मॉडल मापदंडों को नकारात्मक ग्रेडिएंट की दिशा में ले जाते हैं, जिससे नुकसान कम होता है।

4. XGBoost के साथ आरंभ करना:

आइए पायथन के साथ XGBoost का उपयोग करने का एक सरल उदाहरण देखें:

import xgboost as xgb
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# Load the Iris dataset
iris = load_iris()
X = iris.data
y = iris.target

# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Create an XGBoost model
model = xgb.XGBClassifier()

# Train the model
model.fit(X_train, y_train)

# Make predictions
y_pred = model.predict(X_test)

# Evaluate the model
from sklearn.metrics import accuracy_score
print("Accuracy:", accuracy_score(y_test, y_pred))

सफलता के लिए युक्तियाँ:

  • फाइन-ट्यून पैरामीटर्स: XGBoost में कई पैरामीटर हैं जो इसके व्यवहार को नियंत्रित करते हैं। अपने विशिष्ट डेटासेट के प्रदर्शन को अनुकूलित करने के लिए विभिन्न सेटिंग्स के साथ प्रयोग करें।
  • गुम मूल्यों को संभालें: XGBoost लापता मूल्यों को कुशलता से संभालता है, लेकिन आपको चरम मामलों को संभालने के लिए रणनीतियों का पता लगाने की आवश्यकता हो सकती है।
  • नियमितीकरण: अपने मॉडल की जटिलता को नियंत्रित करने के लिए एल1 और एल2 नियमितीकरण के साथ प्रयोग करें।

निष्कर्ष के तौर पर:

XGBoost एक मजबूत और बहुमुखी मशीन लर्निंग एल्गोरिदम है जो विभिन्न अनुप्रयोगों में प्रभावशाली परिणाम प्राप्त करने में सक्षम है। इसकी शक्ति इसके ग्रेडिएंट बूस्टिंग फ्रेमवर्क में निहित है, जो गति और दक्षता के लिए परिष्कृत अनुकूलन के साथ संयुक्त है। मूलभूत सिद्धांतों को समझकर और विभिन्न सेटिंग्स के साथ प्रयोग करके, आप अपनी डेटा-संचालित चुनौतियों से निपटने के लिए XGBoost की शक्ति का उपयोग कर सकते हैं।

विज्ञप्ति वक्तव्य यह आलेख यहां पुन: प्रस्तुत किया गया है: https://dev.to/aquibpy/xgboost-the-superpower-of-gradient-boosting-519h?1 यदि कोई उल्लंघन है, तो कृपया इसे हटाने के लिए स्टडी_गोलंग@163.com से संपर्क करें।
नवीनतम ट्यूटोरियल अधिक>

चीनी भाषा का अध्ययन करें

अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।

Copyright© 2022 湘ICP备2022001581号-3