짧은 설명
프로젝트 "얼굴 표현 인식"은 CNN (Convolutional Neural Network) 방법을 사용하여 인간의 얼굴 표정을 인식하는 것을 목표로합니다. CNN 알고리즘은 Grayscale 형식의 얼굴 이미지와 같은 시각적 데이터를 분석하기 위해 적용되며, 그 다음에는 회색체 형식의 기본 표현의 7 가지 범주로 분류됩니다. 이 모델은 DataSet FER2013을 사용하여 교육을 받았으며 500 에포크 훈련 후 91.67%의 정확도에 도달했습니다.
프로젝트 목표
프로젝트 "얼굴 표현 인식"은이 프로젝트에서 다음을 포함하여 달성 해야하는 업적이있는 인공 지능 과정의 끝입니다.
인공 지능을 기반으로 얼굴 표정을 도입하는 시스템 개발.
이 시스템은 얼굴 표정에서 자동으로 정확하게 방출되는 감정을 식별 할 수 있습니다.
- 얼굴 표정의 정확성을 높이기 위해 기계 학습 알고리즘을 실험합니다.
이 프로젝트에서 CNN 알고리즘은이 모델이 얼굴 도면에서 복잡한 패턴을 인식 할 수있는 정도를 이해하도록 테스트됩니다. 이 노력에는 모델 매개 변수 최적화, 추가 교육 데이터 및 데이터 증강 방법의 사용이 포함됩니다.
-
기술 스택 사용
프레임 워크 : Python은 TensorFlow/HARD를 구현하기 위해 Library를 사용합니다
DataSet : 사용 된 데이터 세트는 FER2013 (Facial Expression Recognition 2013)이며 48x48 픽셀의 치수를 가진 35,887 개의 얼굴 회색 스케일 이미지가 포함되어 있습니다. 이 이미지에는 7 개의 기본 표현 범주가 포함 된 레이블이 있습니다.
- 도구 :
-
- 데이터 조작을위한 Numpy 및 Pandas.
시각화를위한 matplotlib.
카메라의 얼굴 감지를위한 Haar Cascade.
슬픈
화난
-
중립적
-
놀란
-
두려워하는
-
역겨운
-
-
문제와 내가 그것을 다루는 방법
-
정확도 수준에 영향을 미치는 조명 차이의 문제.
조명 변형은 모델의 정확도에 영향을 줄 수 있습니다. 이를 극복하기 위해 이미지의 조명이 더 균일 해지므로 얼굴 이미지의 패턴을 더 잘 인식 할 수 있습니다.
유사한 표현의 복잡성.
"두려움"및 "놀라운"과 같은 일부 표현은 모델로 구별하기 어려운 비슷한 특성을 가지고 있습니다. 적용된 솔루션은 새로운 데이터의 일반화 능력을 향상시키기 위해 회전, 줌, 뒤집기 및 대비 변경과 같은 데이터 확대를 수행하는 것입니다.
데이터 세트가 상당히 제한되어 있습니다 -
데이터 세트 FER2013은 상당히 크지 만 전 세계적으로 다양한 안면 변형을 다루지 않습니다. 데이터 세트를 풍부하게하기 위해 데이터 증강 기술을 사용하고 다른 관련 소스의 데이터를 추가하여 얼굴 표정을 더 잘 표현합니다.
배운 교훈
이 프로젝트는 인공 지능 기반 시스템을 사용하여 얼굴 표정을 인식하는 방법에 대한 약간의 통찰력을 제공합니다. 개발 프로세스는 중요성을 보여줍니다. -
조명 문제를 처리하고 데이터 품질을 향상시키기위한 데이터.
교육 매개 변수 실험 에포크 수, 학습 속도 및 배치 크기와 같은 최적의 조합.
실제 세계 데이터 모델의 성능을 향상시키기 위해 증강을 통해 다양한 교육 데이터를 증가시킵니다.
-
기존의 과제를 극복함으로써,이 프로젝트는 인간-컴퓨터 상호 작용, 정서적 분석 및 심리적 모니터링과 같은 다양한 응용 프로그램에 적용 할 수있는 얼굴 표현 소개 모델을 구축하는 데 성공했습니다.