شرح قصير
يهدف مشروع "التعرف على التعبير" إلى التعرف على تعبيرات الوجه البشري باستخدام طريقة الشبكة العصبية التلافيفية (CNN). يتم تطبيق خوارزمية CNN لتحليل البيانات البصرية مثل صور الوجه بتنسيق رمادي ، والتي يتم تصنيفها بعد ذلك إلى سبع فئات من التعبيرات الأساسية: سعيدة ، حزينة ، غاضبة ، صدمة ، الخوف ، الاشمئزاز ، والمحايدة. تم تدريب هذا النموذج باستخدام DataSet FER2013 ووصل بنجاح إلى دقة 91.67 ٪ بعد التدريب على 500 عصر.
أهداف المشروع
مشروع "التعرف على الوجه" هو نهاية دورة الذكاء الاصطناعي حيث يوجد في هذا المشروع إنجازات يجب تحقيقها بما في ذلك:
تطوير نظام لإدخال تعبير الوجه على أساس الذكاء الاصطناعي.
من المتوقع أن يكون هذا النظام قادرًا على تحديد العواطف التي تشع من تعبيرات الوجه تلقائيًا ودقة.
- تجربة خوارزميات التعلم الآلي لزيادة دقة تعبيرات الوجه.
في هذا المشروع ، يتم اختبار خوارزمية CNN لفهم مدى قدرة هذا النموذج على التعرف على الأنماط المعقدة في رسومات الوجه. يتضمن هذا الجهد أيضًا تحسين معلمات النموذج ، وبيانات التدريب الإضافية ، واستخدام طرق تكبير البيانات.
-
مكدس التكنولوجيا المستخدمة
الإطار: يستخدم Python مكتبة مثل TensorFlow/يصعب تنفيذ CNN.
مجموعة البيانات: مجموعة البيانات المستخدمة هي FER2013 (التعرف على تعبير الوجه 2013) ، والتي تحتوي على 35،887 صورة رمادية الوجه مع أبعاد من 48 × 48 بكسل. تم تجهيز هذه الصور بتسمية تتضمن سبع فئات تعبير أساسية.
أدوات: -
-
numpy و pandas لمعالجة البيانات.
- matplotlib للتصور.
شلال هار للكشف عن الوجه للكاميرا.
غاضب
-
حيادي
-
فوجئت
-
خائف
-
مقزز
-
المشكلة وكيف أتعامل معها
-
- مشكلة اختلافات الإضاءة التي تؤثر على مستوى الدقة.
يمكن أن تؤثر اختلافات الإضاءة على دقة النموذج. للتغلب على ذلك ، يتم تنفيذ تطبيع البيانات لضمان الإضاءة في الصورة أكثر موحدة بحيث يمكن التعرف على الأنماط في صورة الوجه بشكل أفضل.
تعقيد تعبيرات مماثلة.
بعض التعبيرات ، مثل "الخوف" و "المفاجأة" ، لها خصائص مماثلة يصعب التمييز بينها بواسطة النماذج. الحل المطبق هو تنفيذ تغييرات البيانات مثل الدوران والتكبير والتقليب والتباين لتحسين قدرة تعميم النماذج على البيانات الجديدة.
مجموعة بيانات محدودة تمامًا
مجموعة البيانات FER2013 ، على الرغم من أنها كبيرة جدًا ، لا تغطي مجموعة متنوعة من اختلافات الوجه على مستوى العالم. لإثراء مجموعة البيانات ، أستخدم تقنية تكبير البيانات وأضف بيانات من مصادر أخرى ذات صلة لإنشاء تمثيل أفضل لتعبيرات الوجه.
-
الدروس المستفادة
يوفر هذا المشروع رؤى متعمقة حول كيفية استخدام الأنظمة القائمة على الذكاء الاصطناعي للتعرف على تعبيرات الوجه. تُظهر عملية التطوير أهميتها:
-
بيانات pra-permessesia للتعامل مع مشاكل الإضاءة وتحسين جودة البيانات.
تجربة معلمات التدريب للحصول على مجموعات مثالية ، مثل تنظيم عدد العصر ومعدل التعلم وحجم الدُفعة.
زيادة تنوع بيانات التدريب من خلال زيادة أداء نموذج بيانات العالم الحقيقي.
- من خلال التغلب على التحديات الحالية ، نجح هذا المشروع في بناء نموذج مقدمة تعبير الوجه يمكن تطبيقه على تطبيقات مختلفة مثل التفاعل بين الإنسان والحاسوب ، والمراقبة النفسية.