ResNet против EfficientNet против VGG против NN

титульная страница > программирование > ResNet против EfficientNet против VGG против NN

ResNet против EfficientNet против VGG против NN

Опубликовано 31 августа 2024 г.

Просматривать:684

Будучи студентом, я воочию стал свидетелем разочарования, вызванного неэффективной системой поиска находок в нашем университете. Текущий процесс, основанный на индивидуальных электронных письмах для каждого найденного предмета, часто приводит к задержкам и потере связи между потерянными вещами и их владельцами.

Желая улучшить этот опыт для себя и своих сокурсников, я приступил к проекту по изучению потенциала глубокого обучения в революционном преобразовании нашей системы потерянных и найденных вещей. В этом сообщении блога я поделюсь своим опытом оценки предварительно обученных моделей — ResNet, EfficientNet, VGG и NasNet — для автоматизации идентификации и категоризации потерянных предметов.

Посредством сравнительного анализа я стремлюсь определить наиболее подходящую модель для интеграции в нашу систему, что в конечном итоге создаст более быстрый, точный и удобный для пользователя опыт поиска и находок для всех в кампусе.

РесНет

Inception-ResNet V2 — это мощная архитектура сверточной нейронной сети, доступная в Keras, сочетающая сильные стороны архитектуры Inception с остаточными соединениями из ResNet. Эта гибридная модель направлена на достижение высокой точности в задачах классификации изображений при сохранении эффективности вычислений.

Набор обучающих данных: ImageNet
Формат изображения: 299 x 299

Функция предварительной обработки

def readyForResNet(fileName):
    pic = load_img(fileName, target_size=(299, 299))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_resnet(expanded)

Прогнозирование

data1 = readyForResNet(test_file)
prediction = inception_model_resnet.predict(data1)
res1 = decode_predictions_resnet(prediction, top=2)

VGG (Группа визуальной геометрии)

VGG (Visual Geometry Group) — это семейство архитектур глубоких сверточных нейронных сетей, известных своей простотой и эффективностью в задачах классификации изображений. Эти модели, особенно VGG16 и VGG19, завоевали популярность благодаря своим высоким результатам в конкурсе ImageNet Large Scale Visual Recognition Challenge (ILSVRC) в 2014 году.

Набор обучающих данных: ImageNet
Формат изображения: 224 x 224

Функция предварительной обработки

def readyForVGG(fileName):
    pic = load_img(fileName, target_size=(224, 224))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_vgg19(expanded)

Прогнозирование

data2 = readyForVGG(test_file)
prediction = inception_model_vgg19.predict(data2)
res2 = decode_predictions_vgg19(prediction, top=2)

Эффективная сеть

EfficientNet — это семейство архитектур сверточных нейронных сетей, которые обеспечивают высочайшую точность задач классификации изображений, при этом значительно меньше и быстрее, чем предыдущие модели. Эта эффективность достигается за счет нового метода составного масштабирования, который балансирует глубину, ширину и разрешение сети.

Набор обучающих данных: ImageNet
Формат изображения: 480 x 480

Функция предварительной обработки

def readyForEF(fileName):
    pic = load_img(fileName, target_size=(480, 480))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_EF(expanded)

Прогнозирование

data3 = readyForEF(test_file)
prediction = inception_model_EF.predict(data3)
res3 = decode_predictions_EF(prediction, top=2)

НасНет

NasNet (Поисковая сеть нейронной архитектуры) представляет собой новаторский подход в глубоком обучении, при котором архитектура самой нейронной сети обнаруживается посредством автоматизированного процесса поиска. Этот процесс поиска направлен на поиск оптимального сочетания слоев и соединений для достижения высокой производительности при выполнении поставленной задачи.

Набор обучающих данных: ImageNet
Формат изображения: 224 x 224

Функция предварительной обработки

def readyForNN(fileName):
    pic = load_img(fileName, target_size=(224, 224))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_NN(expanded)

Прогнозирование

data4 = readyForNN(test_file)
prediction = inception_model_NN.predict(data4)
res4 = decode_predictions_NN(prediction, top=2)

Разборки

Точность

ResNet Vs EfficientNet vs VGG Vs NN

В таблице суммированы заявленные показатели точности приведенных выше моделей. EfficientNet B7 лидирует с высочайшей точностью, за ним следуют NasNet-Large и Inception-ResNet V2. Модели VGG демонстрируют меньшую точность. Для своего приложения я хочу выбрать модель, в которой есть баланс между временем обработки и точностью.

Время

ResNet Vs EfficientNet vs VGG Vs NN

Как мы видим, EfficientNetB0 дает нам самые быстрые результаты, но InceptionResNetV2 является лучшим пакетом с учетом точности

Краткое содержание

Для моей умной системы находок я решил использовать InceptionResNetV2. Хотя EfficientNet B7 выглядел заманчиво своей первоклассной точностью, меня беспокоили его вычислительные требования. В университетских условиях, где ресурсы могут быть ограничены, а производительность в режиме реального времени зачастую желательна, я чувствовал, что важно найти баланс между точностью и эффективностью. InceptionResNetV2 показался мне идеальным — он обеспечивает высокую производительность, но при этом не требует слишком больших вычислительных ресурсов.

Кроме того, тот факт, что он предварительно обучен на ImageNet, дает мне уверенность в том, что он сможет справиться с разнообразным спектром объектов, которые люди могут потерять. И давайте не будем забывать, как легко работать в Керасе! Это определенно облегчило мое решение.

В целом, я считаю, что InceptionResNetV2 обеспечивает правильное сочетание точности, эффективности и практичности для моего проекта. Мне не терпится увидеть, как он поможет вернуть потерянные вещи их владельцам!

Заявление о выпуске Эта статья воспроизведена по адресу: https://dev.to/saaransh_gupta_1903/resnet-vs-efficientnet-vs-vgg-vs-nn-2hf5?1. Если есть какие-либо нарушения, пожалуйста, свяжитесь с [email protected], чтобы удалить ее.

Последний учебник Более>

Как эффективно обнаружить пустые массивы в PHP?
проверка массива в PHP Пустое массив может быть определен в PHP через различные подходы. Если необходимость заключается в проверке наличия люб...

программирование Опубликовано в 2025-07-05
Советы по поиску позиции элемента в массиве Java
Получение позиции элемента в массивах Java в классе массивов Java, не существует прямого «Indexof», чтобы определить позицию определенного эле...

программирование Опубликовано в 2025-07-05
Почему ввод запроса в POST Захват в PHP, несмотря на действительный код?
addressing post запрос неисправность в php в представленном фрагменте кода: action='' intement. Вход из нагламента на нажим. Однако выход ...

программирование Опубликовано в 2025-07-05
Когда веб -приложение Go закроет подключение к базе данных?
управление подключениями к базе данных в веб -приложениях GO в простых веб -приложениях, в которых используются базы данных, такие как PostgreSQ...

программирование Опубликовано в 2025-07-05
Как преобразовать столбец DataFrame Pandas в формат DateTime и фильтр по дате?
Transform Pandas DataFrame в Format DateTime сценарий: данные в данных Pandas DataFrame часто существует в различных форматах, включая строк...

программирование Опубликовано в 2025-07-05
Могут ли параметры шаблона в C ++ 20 постоянной функции зависеть от параметров функции?
постоянные функции и параметры шаблона, зависящие от аргументов функций в C 17, параметр шаблона не может зависеть от аргумента, потому что он...

программирование Опубликовано в 2025-07-05
Как справиться с нарезанной памятью в сборе мусора?
коллекция мусора в срезах Go: подробный анализ В Go Slice - это динамический массив, который ссылается на основной массив. При работе с ломтик...

программирование Опубликовано в 2025-07-05
Как эффективно вставить данные в несколько таблиц MySQL в одну транзакцию?
mysql вставьте в несколько таблиц , пытаясь вставить данные в несколько таблиц с одним запросом MySQL, может дать неожиданные результаты. Хотя ...

программирование Опубликовано в 2025-07-05
Как эффективно повторить строковые символы для вдавления в C#?
повторяя строку для вдавления , когда обрабатывает строку, основанную на глубине элемента, удобно иметь эффективный способ вернуть строку, повт...

программирование Опубликовано в 2025-07-05
Как обрабатывать пользовательский ввод в полноэкранном эксклюзивном режиме Java?
Обработка ввода пользователя в полноэкранном эксклюзивном режиме в Java введение woods режим пассивного рендеринга позволяет использоват...

программирование Опубликовано в 2025-07-05
Как я могу выполнить несколько операторов SQL в одном запросе с помощью Node-Mysql?
Поддержка запросов с несколькими Statement в Node-Mysql в Node.js возникает вопрос, когда выполняется несколько SQL-записей в одном запросе, и...

программирование Опубликовано в 2025-07-05
Почему PHP DateTime :: Modify ('+1 месяц') дает неожиданные результаты?
изменение месяцев с PHP DateTime: раскрыть предполагаемое поведение при работе с классом DateTime PHP, добавление или вычитание месяцев не все...

программирование Опубликовано в 2025-07-05
Как перенаправить несколько типов пользователей (студентов, учителей и администраторов) на их соответствующие действия в приложении Firebase?
] red: Как перенаправить несколько типов пользователей на соответствующие действия понимание проблемы в огненном приложении, основанном авт...

программирование Опубликовано в 2025-07-05
В чем разница между вложенными функциями и закрытием в Python
] вложенные функции против закрытия в Python , в то время как вложенные функции в Python поверхностно напоминают закрытия, они в основном отлича...

программирование Опубликовано в 2025-07-05
Почему HTML не может печатать номера и решения страниц
не может печатать номера страниц на HTML Pages? задача Описание: , несмотря на широкое исследование, номера страниц не появляются при печати h...

программирование Опубликовано в 2025-07-05