簡単な説明
プロジェクト「Face Expression認識」は、畳み込みニューラルネットワーク(CNN)メソッドを使用して人間の表情を認識することを目的としています。 CNNアルゴリズムは、グレースケール形式のフェイシャル画像などの視覚データを分析するために適用されます。これは、幸せ、悲しい、怒り、ショック、恐怖、嫌悪、ニュートラルの7つのカテゴリの基本的な表現に分類されます。このモデルは、データセットFER2013を使用してトレーニングされ、500エポックのトレーニング後に91.67%の精度に成功しました。
プロジェクトの目標
プロジェクト「Face Expression認識」は、このプロジェクトでは次のことを達成する必要がある人工知能コースの終わりです。
人工知能に基づいて表情を導入するシステムを開発する。
このシステムは、表情から自動的かつ正確に放射される感情を特定できると予想されます。
機械学習アルゴリズムを実験して、表情の精度を向上させます。
このプロジェクトでは、CNNアルゴリズムがテストされ、このモデルが対面図面の複雑なパターンを認識できる程度を理解します。この取り組みには、モデルパラメーターの最適化、追加のトレーニングデータ、およびデータ増強方法も含まれます。
-
使用される技術スタック
-
フレームワーク:PythonはTensorflow/Hard To Enformingのようなライブラリを使用します。
データセット:使用されるデータセットは、48x48ピクセルの寸法を持つ35,887のフェイスグレースケール画像を含むFER2013(Fafial Expression Lutedation 2013)です。これらの画像には、7つの基本的な式カテゴリを含むラベルが装備されています。
ツール:
-
- データ操作のためのnumpyとpandas。
視覚化のためのmatplotlib。
- カメラの顔検出のためのHaar Cascade。
結果
怒り
- 中性
- 驚いた
- 恐れている
- おぞましい
-
問題と私がそれにどのように対処するか
-
精度のレベルに影響する照明の違いの問題。 -
照明のバリエーションは、モデルの精度に影響を与える可能性があります。これを克服するために、画像の照明がより均一になるようにデータの正規化が実行され、顔の画像のパターンがよりよく認識されるようにします。
同様の式の複雑さ。
「恐怖」や「驚き」などのいくつかの表現には、モデルによって区別するのが難しい同様の特性があります。適用されるソリューションは、回転、ズーム、フリップ、コントラストなどのデータ増強を実行して、新しいデータの一般化能力を向上させることです。
データセットは非常に限られています
データセットFER2013は、非常に大きいものの、世界中のさまざまな顔の変動をカバーしていません。データセットを豊かにするために、データの増強手法を使用し、他の関連ソースからデータを追加して、顔の表現のより良い表現を作成します。
-
学んだ教訓
このプロジェクトは、人工知能ベースのシステムを使用して表情を認識する方法について、詳細な洞察を提供します。開発プロセスはその重要性を示しています:
- 照明の問題を処理し、データの品質を向上させるデータPRA-Per-Messesia。
エポックの数、学習率、およびバッチサイズの調整など、最適な組み合わせを取得するためのトレーニングパラメーターの実験。
増加により、トレーニングデータの多様性を増やして、現実世界のデータのパフォーマンスを向上させます。
既存の課題を克服することにより、このプロジェクトは、人間の相互作用、感情分析、心理的監視などのさまざまなアプリケーションに適用できる表現導入モデルを構築することに成功しました。
-