هندسة الميزات
توصف هندسة الميزات بأنها خطوة معالجة مسبقة في التعلم الآلي والتي تحول البيانات الأولية إلى مجموعة أكثر فعالية من المدخلات التي لها عدة سمات تعرف باسم الميزات.
يعتمد نجاح نماذج التعلم الآلي بشكل كبير على جودة الميزات المستخدمة لتدريبها. تتضمن هندسة الميزات مجموعة من التقنيات التي تمكننا من إنشاء ميزات جديدة من خلال دمج الميزات الموجودة أو تحويلها. تساعد هذه التقنيات في تسليط الضوء على أهم الأنماط والعلاقات في البيانات، مما يساعد بدوره نموذج التعلم الآلي على التعلم من البيانات بشكل أكثر فعالية.
التقنيات الأساسية في هندسة الميزات
يمكن تصنيف هندسة الميزات إلى خطوتين رئيسيتين هما؛
المعالجة المسبقة للبيانات
فهم الأعمال (المعرفة بالمجال)
المعالجة المسبقة للبيانات
عادةً ما تكون هذه خطوة في هندسة الميزات وتتضمن إعداد البيانات ومعالجتها بما يتوافق مع احتياجات لغة الآلة الحالية. يتم استخدام تقنيات مختلفة هنا من بينها؛
التعامل مع القيمة المفقودة حيث يمكن استخدام تقنيات مثل التضمين (المتوسط، الوسيط، الوضع)، أو استخدام الخوارزميات التي تتعامل مع القيم المفقودة محليًا.
تشفير المتغيرات الفئوية حيث يجب تحويل البيانات الفئوية إلى شكل رقمي لمعظم الخوارزميات باستخدام طرق شائعة مثل التشفير السريع، وترميز الملصقات، والتشفير المستهدف.
القياس والتطبيع حيث تضمن ميزات القياس أنها تساهم بشكل متساوٍ في النموذج. تشمل التقنيات التقييس (درجة z)
تفاعل الميزات وإنشاء الميزات حيث يتم دمج الميزات الموجودة لإنشاء ميزات جديدة وبالتالي إنشاء علاقات معقدة مع البيانات
تقليل الأبعاد حيث تعمل تقنيات مثل PCA (تحليل المكونات الرئيسية) أو t-SNE على تقليل عدد الميزات مع الاحتفاظ بالمعلومات الأكثر أهمية.
يمكن أيضًا استخدام EDA في هندسة الميزات وعادة ما يكون مقدمة لهندسة الميزات.
معرفة المجال
تشير معرفة المجال إلى الفهم والخبرة في مجال أو صناعة معينة. في هندسة الميزات، يتضمن ذلك تطبيق الرؤى وفهم سياق البيانات وعلاقاتها لإنشاء ميزات ذات معنى يمكنها تحسين أداء النموذج.
يساعد في تحديد الميزات ذات الصلة بالمشكلة المطروحة وفهم علاقات البيانات.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3