फ़ीचर इंजीनियरिंग
फ़ीचर इंजीनियरिंग को मशीन लर्निंग में एक प्रीप्रोसेसिंग चरण के रूप में वर्णित किया गया है जो कच्चे डेटा को इनपुट के अधिक प्रभावी सेट में बदल देता है जिसमें कई विशेषताएं होती हैं जिन्हें फ़ीचर के रूप में जाना जाता है।
मशीन लर्निंग मॉडल की सफलता काफी हद तक उन्हें प्रशिक्षित करने के लिए उपयोग की जाने वाली सुविधाओं की गुणवत्ता पर निर्भर करती है। फ़ीचर इंजीनियरिंग में तकनीकों का एक सेट शामिल होता है जो हमें मौजूदा सुविधाओं को संयोजित या परिवर्तित करके नई सुविधाएँ बनाने में सक्षम बनाता है। ये तकनीकें डेटा में सबसे महत्वपूर्ण पैटर्न और संबंधों को उजागर करने में मदद करती हैं, जो बदले में मशीन लर्निंग मॉडल को डेटा से अधिक प्रभावी ढंग से सीखने में मदद करती हैं।
फ़ीचर इंजीनियरिंग में प्रमुख तकनीकें
फ़ीचर इंजीनियरिंग को दो प्रमुख चरणों में वर्गीकृत किया जा सकता है;
डेटा प्री-प्रोसेसिंग
व्यावसायिक समझ(डोमेन ज्ञान)
डेटा प्री-प्रोसेसिंग
यह आमतौर पर फीचर इंजीनियरिंग में एक कदम है और इसमें वर्तमान मशीन भाषा की जरूरतों के लिए डेटा तैयार करना और हेरफेर करना शामिल है। उनमें से यहां विभिन्न तकनीकों का उपयोग किया जाता है;
मिसिंग वैल्यू को संभालना जहां इंप्यूटेशन (माध्य, माध्य, मोड) जैसी तकनीकें, या एल्गोरिदम का उपयोग करना जो मूल रूप से मिसिंग वैल्यू को संभालते हैं, को नियोजित किया जा सकता है।
श्रेणीबद्ध चर को एन्कोड करना जहां श्रेणीबद्ध डेटा को वन-हॉट एन्कोडिंग, लेबल एन्कोडिंग और लक्ष्य एन्कोडिंग जैसे सामान्य तरीकों का उपयोग करके अधिकांश एल्गोरिदम के लिए संख्यात्मक रूप में परिवर्तित किया जाना चाहिए।
स्केलिंग और सामान्यीकरण जहां स्केलिंग सुविधाएं सुनिश्चित करती हैं कि वे मॉडल में समान रूप से योगदान करते हैं। तकनीकों में मानकीकरण (जेड-स्कोर) शामिल है
फ़ीचर इंटरेक्शन और फ़ीचर निर्माण जहां मौजूदा सुविधाओं को जोड़कर नई सुविधाएँ बनाई जाती हैं और इस प्रकार डेटा के साथ जटिल संबंध बनाए जाते हैं
डायमेंशनलिटी रिडक्शन जहां पीसीए (प्रिंसिपल कंपोनेंट एनालिसिस) या टी-एसएनई जैसी तकनीकें सबसे महत्वपूर्ण जानकारी को बनाए रखते हुए सुविधाओं की संख्या को कम करती हैं।
EDA का उपयोग फीचर इंजीनियरिंग में भी किया जा सकता है और यह आमतौर पर फीचर इंजीनियरिंग का अग्रदूत है।
डोमेन की जानकारी
डोमेन ज्ञान का तात्पर्य किसी विशिष्ट क्षेत्र या उद्योग में समझ और विशेषज्ञता से है। फ़ीचर इंजीनियरिंग में, इसमें सार्थक सुविधाएँ बनाने के लिए डेटा के संदर्भ और संबंधों की अंतर्दृष्टि और समझ को लागू करना शामिल है जो मॉडल के प्रदर्शन को बढ़ा सकते हैं।
यह पहचानने में मदद करता है कि कौन सी विशेषताएं मौजूदा समस्या के लिए प्रासंगिक हैं और डेटा संबंधों को समझती हैं।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3