ResNet contre EfficientNet contre VGG contre NN

Page de garde > La programmation > ResNet contre EfficientNet contre VGG contre NN

ResNet contre EfficientNet contre VGG contre NN

Publié le 2024-08-31

Parcourir:630

En tant qu'étudiant, j'ai été témoin de la frustration causée par le système inefficace des objets trouvés de notre université. Le processus actuel, qui repose sur des e-mails individuels pour chaque objet trouvé, entraîne souvent des retards et des connexions manquées entre les objets perdus et leurs propriétaires.

Animé par le désir d'améliorer cette expérience pour moi et mes camarades étudiants, je me suis lancé dans un projet visant à explorer le potentiel de l'apprentissage profond pour révolutionner notre système des objets trouvés. Dans cet article de blog, je partagerai mon parcours d'évaluation de modèles pré-entraînés - ResNet, EfficientNet, VGG et NasNet - pour automatiser l'identification et la catégorisation des objets perdus.

Grâce à une analyse comparative, mon objectif est d'identifier le modèle le plus approprié à intégrer dans notre système, créant ainsi une expérience des objets trouvés plus rapide, plus précise et plus conviviale pour tout le monde sur le campus.

ResNet

Inception-ResNet V2 est une puissante architecture de réseau neuronal convolutif disponible dans Keras, combinant les atouts de l'architecture Inception avec les connexions résiduelles de ResNet. Ce modèle hybride vise à atteindre une grande précision dans les tâches de classification d'images tout en maintenant l'efficacité informatique.

Ensemble de données de formation : ImageNet
Format d'image : 299 x 299

Fonction de prétraitement

def readyForResNet(fileName):
    pic = load_img(fileName, target_size=(299, 299))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_resnet(expanded)

Prédire

data1 = readyForResNet(test_file)
prediction = inception_model_resnet.predict(data1)
res1 = decode_predictions_resnet(prediction, top=2)

VGG (Groupe de Géométrie Visuelle)

VGG (Visual Geometry Group) est une famille d'architectures de réseaux neuronaux à convolution profonde connues pour leur simplicité et leur efficacité dans les tâches de classification d'images. Ces modèles, en particulier VGG16 et VGG19, ont gagné en popularité en raison de leurs solides performances lors du ImageNet Large Scale Visual Recognition Challenge (ILSVRC) en 2014.

Ensemble de données de formation : ImageNet
Format d'image : 224 x 224

Fonction de prétraitement

def readyForVGG(fileName):
    pic = load_img(fileName, target_size=(224, 224))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_vgg19(expanded)

Prédire

data2 = readyForVGG(test_file)
prediction = inception_model_vgg19.predict(data2)
res2 = decode_predictions_vgg19(prediction, top=2)

EfficaceNet

EfficientNet est une famille d'architectures de réseaux neuronaux convolutifs qui atteignent une précision de pointe sur les tâches de classification d'images tout en étant nettement plus petites et plus rapides que les modèles précédents. Cette efficacité est obtenue grâce à une nouvelle méthode de mise à l'échelle composée qui équilibre la profondeur, la largeur et la résolution du réseau.

Ensemble de données de formation : ImageNet
Format d'image : 480 x 480

Fonction de prétraitement

def readyForEF(fileName):
    pic = load_img(fileName, target_size=(480, 480))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_EF(expanded)

Prédire

data3 = readyForEF(test_file)
prediction = inception_model_EF.predict(data3)
res3 = decode_predictions_EF(prediction, top=2)

NasNet

NasNet (Neural Architecture Search Network) représente une approche révolutionnaire en matière d'apprentissage en profondeur où l'architecture du réseau neuronal lui-même est découverte grâce à un processus de recherche automatisé. Ce processus de recherche vise à trouver la combinaison optimale de couches et de connexions pour atteindre des performances élevées sur une tâche donnée.

Ensemble de données de formation : ImageNet
Format d'image : 224 x 224

Fonction de prétraitement

def readyForNN(fileName):
    pic = load_img(fileName, target_size=(224, 224))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_NN(expanded)

Prédire

data4 = readyForNN(test_file)
prediction = inception_model_NN.predict(data4)
res4 = decode_predictions_NN(prediction, top=2)

Épreuve de force

Précision

ResNet Vs EfficientNet vs VGG Vs NN

Le tableau résume les scores de précision revendiqués pour les modèles ci-dessus. EfficientNet B7 est en tête avec la plus grande précision, suivi de près par NasNet-Large et Inception-ResNet V2. Les modèles VGG présentent des précisions inférieures. Pour mon application, je souhaite choisir un modèle qui présente un équilibre entre temps de traitement et précision.

Temps

ResNet Vs EfficientNet vs VGG Vs NN

Comme nous pouvons le voir, EfficientNetB0 nous fournit les résultats les plus rapides, mais InceptionResNetV2 est un meilleur package lorsqu'il est pris en compte la précision

Résumé

Pour mon système intelligent des objets trouvés, j'ai décidé d'opter pour InceptionResNetV2. Même si EfficientNet B7 semblait tentant avec sa précision de premier ordre, j'étais préoccupé par ses exigences informatiques. Dans un environnement universitaire, où les ressources peuvent être limitées et où les performances en temps réel sont souvent souhaitables, j'ai pensé qu'il était important de trouver un équilibre entre précision et efficacité. InceptionResNetV2 semblait être la solution idéale : il offre de solides performances sans être trop gourmand en calcul.

De plus, le fait qu'il soit pré-entraîné sur ImageNet me donne l'assurance qu'il peut gérer la diversité des objets que les gens pourraient perdre. Et n'oublions pas à quel point il est facile de travailler avec Keras ! Cela a définitivement facilité ma décision.

Dans l'ensemble, je pense qu'InceptionResNetV2 offre le bon mélange de précision, d'efficacité et de praticité pour mon projet. J'ai hâte de voir comment il aide à réunir les objets perdus avec leurs propriétaires !

Déclaration de sortie Cet article est reproduit sur : https://dev.to/saaransh_gupta_1903/resnet-vs-efficientnet-vs-vgg-vs-nn-2hf5?1 En cas d'infraction, veuillez contacter [email protected] pour le supprimer.

Dernier tutoriel Plus>

Comment réparer « Erreur générale : le serveur MySQL 2006 a disparu » lors de l'insertion de données ?
Comment résoudre « Erreur générale : le serveur MySQL 2006 a disparu » lors de l'insertion d'enregistrementsIntroduction :L'insertion de d...

La programmation Publié le 2024-12-25
Comment combiner deux tableaux associatifs en PHP tout en préservant les identifiants uniques et en gérant les noms en double ?
Combiner des tableaux associatifs en PHPEn PHP, combiner deux tableaux associatifs en un seul tableau est une tâche courante. Considérez la requête su...

La programmation Publié le 2024-12-25
Au-delà des instructions « if » : où d'autre un type avec une conversion « bool » explicite peut-il être utilisé sans conversion ?
Conversion contextuelle en bool autorisée sans conversionVotre classe définit une conversion explicite en bool, vous permettant d'utiliser son ins...

La programmation Publié le 2024-12-25
Utilisation de WebSockets dans Go pour la communication en temps réel
Créer des applications qui nécessitent des mises à jour en temps réel, comme des applications de chat, des notifications en direct ou des outils colla...

La programmation Publié le 2024-12-25
Comment puis-je trouver des utilisateurs dont les anniversaires sont aujourd'hui à l'aide de MySQL ?
Comment identifier les utilisateurs dont l'anniversaire est le jour à l'aide de MySQLDéterminer si aujourd'hui est l'anniversaire d...

La programmation Publié le 2024-12-24
Pourquoi la requête POST ne capture-t-elle pas l'entrée en PHP malgré un code valide ?
Résolution d'un dysfonctionnement de la requête POST en PHPDans l'extrait de code présenté :action=''au lieu de :action="<?php echo $_...

La programmation Publié le 2024-12-24
Qu'est-il arrivé à la compensation des colonnes dans Bootstrap 4 Beta ?
Bootstrap 4 Beta : suppression et restauration de la compensation de colonneBootstrap 4, dans sa version bêta 1, a introduit des changements important...

La programmation Publié le 2024-12-24
Comment réparer « ImproperlyConfigured : erreur de chargement du module MySQLdb » dans Django sur macOS ?
MySQL mal configuré : le problème avec les chemins relatifsLors de l'exécution de python manage.py runserver dans Django, vous pouvez rencontrer l...

La programmation Publié le 2024-12-24
Comment puis-je télécharger efficacement des fichiers à l’aide de Selenium WebDriver en Java ?
Téléchargement de fichiers avec Selenium WebDriver en Java : un guide détailléLe téléchargement de fichiers vers des applications Web est une tâche co...

La programmation Publié le 2024-12-24
Développement C avec GNU Emacs
Emacs is designed with programming in mind, it supports languages like C, Python, and Lisp natively, offering advanced features such as syntax highli...

La programmation Publié le 2024-12-24
Comment puis-je imprimer une variable entre guillemets simples en PHP ?
Impossible d'émettre directement une variable avec des guillemets simplesBesoin d'imprimer une variable dans une chaîne entre guillemets simpl...

La programmation Publié le 2024-12-24
std::vector vs. Plain Arrays : quand les performances sont-elles vraiment importantes ?
std::vector vs. Plain Arrays : évaluation des performancesBien qu'il soit généralement admis que std::vector fonctionne de la même manière que les...

La programmation Publié le 2024-12-24
Pourquoi la double précision semble-t-elle avoir plus de décimales que les 15 annoncées ?
Double précision et précision des décimalesEn programmation informatique, le type de données double précision est souvent supposé avoir une précision ...

La programmation Publié le 2024-12-24
Retours implicites ou explicites dans les fonctions fléchées : quand les accolades sont-elles nécessaires ?
Accolades dans les fonctions fléchées : retours implicites ou explicitesLes fonctions fléchées peuvent être écrites de deux manières : avec ou sans ac...

La programmation Publié le 2024-12-24
Pourquoi mon texte est-il flou dans Chrome après avoir utilisé « transform: scale() » ?
Flou du texte dans Chrome après la transformation : scale()Dans les récentes mises à jour de Chrome, un problème particulier est apparu lorsque le tex...

La programmation Publié le 2024-12-24

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article