ResNet 대 EfficientNet 대 VGG 대 NN

첫 장 > 프로그램 작성 > ResNet 대 EfficientNet 대 VGG 대 NN

ResNet 대 EfficientNet 대 VGG 대 NN

2024-08-31에 게시됨

검색:910

학생 시절 저는 우리 대학의 비효율적인 분실물 보관 시스템으로 인해 발생하는 좌절감을 직접 목격했습니다. 발견된 각 항목에 대한 개별 이메일에 의존하는 현재 프로세스는 종종 분실된 소지품과 소유자 사이의 지연 및 연결 끊김으로 이어집니다.

저와 동료 학생들을 위해 이러한 경험을 향상시키고자 하는 열망에 힘입어 저는 분실물 보관 시스템을 혁신하는 딥 러닝의 잠재력을 탐구하는 프로젝트에 착수했습니다. 이 블로그 게시물에서는 분실물 식별 및 분류를 자동화하기 위해 사전 학습된 모델(ResNet, EfficientNet, VGG 및 NasNet)을 평가하는 여정을 공유하겠습니다.

비교 분석을 통해 우리 시스템에 통합하기에 가장 적합한 모델을 찾아 궁극적으로 캠퍼스 내 모든 사람을 위한 더 빠르고 정확하며 사용자 친화적인 분실물 보관 경험을 제공하는 것이 목표입니다.

레스넷

Inception-ResNet V2는 Keras에서 사용할 수 있는 강력한 컨벌루션 신경망 아키텍처로, Inception 아키텍처의 장점과 ResNet의 잔여 연결을 결합합니다. 이 하이브리드 모델은 계산 효율성을 유지하면서 이미지 분류 작업에서 높은 정확도를 달성하는 것을 목표로 합니다.

교육 데이터 세트: ImageNet
이미지 형식: 299 x 299

전처리 기능

def readyForResNet(fileName):
    pic = load_img(fileName, target_size=(299, 299))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_resnet(expanded)

예측

data1 = readyForResNet(test_file)
prediction = inception_model_resnet.predict(data1)
res1 = decode_predictions_resnet(prediction, top=2)

VGG(시각적 기하학 그룹)

VGG(Visual Geometry Group)는 이미지 분류 작업의 단순성과 효율성으로 잘 알려진 심층 컨벌루션 신경망 아키텍처 제품군입니다. 이러한 모델, 특히 VGG16 및 VGG19는 2014년 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)에서 뛰어난 성능을 발휘하여 인기를 얻었습니다.

교육 데이터 세트: ImageNet
이미지 형식: 224 x 224

전처리 기능

def readyForVGG(fileName):
    pic = load_img(fileName, target_size=(224, 224))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_vgg19(expanded)

예측

data2 = readyForVGG(test_file)
prediction = inception_model_vgg19.predict(data2)
res2 = decode_predictions_vgg19(prediction, top=2)

EfficientNet

EfficientNet은 이전 모델보다 훨씬 작고 빠르면서도 이미지 분류 작업에서 최고 수준의 정확도를 달성하는 컨볼루셔널 신경망 아키텍처 제품군입니다. 이러한 효율성은 네트워크 깊이, 너비 및 해상도의 균형을 맞추는 새로운 복합 확장 방법을 통해 달성됩니다.

교육 데이터 세트: ImageNet
이미지 형식: 480 x 480

전처리 기능

def readyForEF(fileName):
    pic = load_img(fileName, target_size=(480, 480))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_EF(expanded)

예측

data3 = readyForEF(test_file)
prediction = inception_model_EF.predict(data3)
res3 = decode_predictions_EF(prediction, top=2)

나스넷

NasNet(Neural Architecture Search Network)은 자동화된 검색 프로세스를 통해 신경망 자체의 아키텍처를 발견하는 딥 러닝의 획기적인 접근 방식을 나타냅니다. 이 검색 프로세스는 주어진 작업에서 높은 성능을 달성하기 위해 레이어와 연결의 최적 조합을 찾는 것을 목표로 합니다.

교육 데이터 세트: ImageNet
이미지 형식: 224 x 224

전처리 기능

def readyForNN(fileName):
    pic = load_img(fileName, target_size=(224, 224))
    pic_array = img_to_array(pic)
    expanded = np.expand_dims(pic_array, axis=0)
    return preprocess_input_NN(expanded)

예측

data4 = readyForNN(test_file)
prediction = inception_model_NN.predict(data4)
res4 = decode_predictions_NN(prediction, top=2)

발표

정확성

ResNet Vs EfficientNet vs VGG Vs NN

이 표에는 위 모델의 주장된 정확도 점수가 요약되어 있습니다. EfficientNet B7이 가장 높은 정확도를 보였고 NasNet-Large와 Inception-ResNet V2가 그 뒤를 이었습니다. VGG 모델은 정확도가 낮습니다. 내 애플리케이션에는 처리 시간과 정확성 사이의 균형이 잡힌 모델을 선택하고 싶습니다.

시간

ResNet Vs EfficientNet vs VGG Vs NN

보시다시피 EfficientNetB0은 가장 빠른 결과를 제공하지만 정확성을 고려할 때 InceptionResNetV2가 더 나은 패키지입니다.

요약

스마트 분실물 보관 시스템을 위해 InceptionResNetV2를 사용하기로 결정했습니다. EfficientNet B7은 최고 수준의 정확도로 매력적으로 보였지만 계산 요구 사항이 걱정되었습니다. 리소스가 제한되어 있고 실시간 성능이 요구되는 경우가 많은 대학 환경에서는 정확성과 효율성 사이의 균형을 맞추는 것이 중요하다고 느꼈습니다. InceptionResNetV2는 완벽하게 맞는 것처럼 보였습니다. 지나치게 계산 집약적이지 않으면서 강력한 성능을 제공합니다.

게다가 ImageNet에 사전 훈련되어 있다는 사실은 사람들이 잃을 수 있는 다양한 범위의 개체를 처리할 수 있다는 확신을 줍니다. 그리고 Keras에서 작업하는 것이 얼마나 쉬운지 잊지 마세요! 그 덕분에 결정이 더 쉬워졌습니다.

전반적으로 InceptionResNetV2는 내 프로젝트에 정확성, 효율성 및 실용성의 적절한 조합을 제공한다고 믿습니다. 잃어버린 물건을 주인과 다시 합치는 데 이 장치가 어떤 도움을 줄지 기대됩니다!

릴리스 선언문 이 기사는 https://dev.to/saaransh_gupta_1903/resnet-vs-efficientnet-vs-vgg-vs-nn-2hf5?1에서 복제됩니다.1 침해 내용이 있는 경우, [email protected]에 연락하여 삭제하시기 바랍니다.

최신 튜토리얼 더>

UTF-8 vs. Latin-1 : 캐릭터 인코딩의 비밀!
The Critical DistinctionAt the core of the distinction lies their respective approaches to representing non-Latin characters. LATIN1은 라틴 캐릭터에 특히 적합하지...

프로그램 작성 2025-03-12에 게시되었습니다
Part SQL 주입 시리즈 : 고급 SQL 주입 기술에 대한 자세한 설명
WayMap Pentesting 도구 : 여기를 클릭하십시오 trixsec github : 여기를 클릭하십시오 Trixsec Telegram : 여기를 클릭하십시오 고급 SQL 주입 익스플로잇-7 부 : 최첨단 기술 및 예방 SQL 주입 ...

프로그램 작성 2025-03-12에 게시되었습니다
PYTZ가 처음에 예상치 못한 시간대 오프셋을 표시하는 이유는 무엇입니까?
import pytz pytz.timezone ( 'Asia/Hong_kong') std> discrepancy source 역사 전반에 걸쳐 변동합니다. PYTZ가 제공하는 기본 시간대 이름 및 오프...

프로그램 작성 2025-03-12에 게시되었습니다
$\ "일반 오류 : 2006 MySQL Server가 사라졌습니다 \"데이터를 삽입 할 때?$
\ "일반 오류 : 2006 MySQL Server가 사라졌습니다 \"데이터를 삽입 할 때?
를 해결하는 방법 "일반 오류 : 2006 MySQL Server가 사라졌습니다. 이 오류는 일반적으로 MySQL 구성의 두 변수 중 하나로 인해 서버에 대한 연결이 손실 될 때 발생합니다. 솔루션 : 이 오류를 해결하기위한 키는 Wait_Ti...

프로그램 작성 2025-03-12에 게시되었습니다
악성 콘텐츠에 대해 파일 업로드를 어떻게 보호 할 수 있습니까?
파일 업로드 보안 위협 주소 따라서 : filename을 포함하여 업로드 된 파일의 모든 측면을 면밀히 조사하는 것이 필수적입니다. 사용자는 파일 이름을 조작하여 보안 조치를 우회 할 수 있습니다. 중요한 목적으로 사용하거나 원래 이름이있는 파일을 저...

프로그램 작성 2025-03-12에 게시되었습니다
JavaScript의 정규 표현식을 사용하여 문자열에서 라인 브레이크를 제거하는 방법은 무엇입니까?
를 사용하여 다양한 라인 브레이크 변형을 충족시키기 위해 다음과 같은 정규 표현식을 사용할 수 있습니다. sometext.replace (/n \ n | \ n | 이 표현식을 .replace 메소드에 통합하면 운영 체제에 관계없이 모든 라인 브레이크 문자가...

프로그램 작성 2025-03-12에 게시되었습니다
Firefox Back 버튼을 사용할 때 JavaScript 실행이 중단되는 이유는 무엇입니까?
원인 및 솔루션 : 이 동작은 브라우저 캐싱 자바 스크립트 리소스에 의해 발생합니다. 이 문제를 해결하고 후속 페이지 방문에서 스크립트가 실행되도록하기 위해 Firefox 사용자는 Window.onload 이벤트에서 호출되도록 빈 기능을 설정해야합니다. ...

프로그램 작성 2025-03-12에 게시되었습니다
PHP를 사용하여 Blob (이미지)을 MySQL에 올바르게 삽입하는 방법은 무엇입니까?
문제 $ sql = "삽입 ImagesTore (imageId, image) 값 ( '$ this- & gt; image_id', 'file_get_contents ($ tmp_image)'; 결과적으로 실제 이...

프로그램 작성 2025-03-12에 게시되었습니다
McRypt에서 OpenSSL로 암호화를 마이그레이션하고 OpenSSL을 사용하여 McRypt 암호화 데이터를 해제 할 수 있습니까?
질문 : McRypt에서 OpenSSL로 내 암호화 라이브러리를 업그레이드 할 수 있습니까? 그렇다면 어떻게? 대답 : 대답 : 예, McRypt에서 암호화 라이브러리를 OpenSSL로 업그레이드 할 수 있습니다. OpenSSL을 사용하여 McRyp...

프로그램 작성 2025-03-12에 게시되었습니다
Java Hashset/LinkedHashset Random Element 획득 방법에 대한 자세한 설명
Java의 Hashset 및 LinkedHashset 해시 세트는 고유 한 요소 모음을 나타내며 빠른 조회를 위해 해싱을 활용합니다. LinkedHashSet은 요소가 세트에 추가 된 순서를 유지합니다. 임의의 요소를 선택하여 Java에서 세트에서 임의...

프로그램 작성 2025-03-12에 게시되었습니다
CSS는 언제 유닛없이 픽셀 (PX)으로 떨어지는 것은 언제입니까?
질문 : 유닛이 생략 될 때 픽셀 (px)에 대한 일부 속성을 수행 할 때 모든 w3c 권장 사항의 폴백 장치? UAS는 선호하는 단위로의 폴백을해야합니까? 다른 브라우저의 동작에 따라 다음 예에서 올바른 동작은 무엇입니까? ...

프로그램 작성 2025-03-12에 게시되었습니다
Google API에서 최신 JQuery 라이브러리를 검색하는 방법은 무엇입니까?
https://code.jquery.com/jquery-latest.min.js (jQuery Hosted, Minified) https://code.jquery.com/jquery-latest.js (JQuery Hosted, Hosted, 비 압축) 압축...

프로그램 작성 2025-03-12에 게시되었습니다
Homebrew에서 GO를 설정하면 명령 줄 실행 문제가 발생하는 이유는 무엇입니까?
발생하는 문제를 해결하려면 다음을 수행하십시오. 1. 필요한 디렉토리 만들기 mkdir $ home/go mkdir -p $ home/go/src/github.com/user 2. 환경 변수 구성

프로그램 작성 2025-03-12에 게시되었습니다
버전 5.6.5 이전에 MySQL의 Timestamp 열을 사용하여 current_timestamp를 사용하는 데 제한 사항은 무엇입니까?
5.6.5 이전에 mysql 버전의 기본적으로 또는 업데이트 클로즈가있는 타임 스탬프 열의 제한 사항 5.6.5 5.6.5 이전에 mySQL 버전에서 Timestamp Holumn에 전적으로 기본적으로 한 제한 사항이 있었는데, 이는 제한적으로 전혀 ...

프로그램 작성 2025-03-12에 게시되었습니다
$Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?$
Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?
Ray Tracing MethodThe ray tracing method intersects a horizontal ray from the point under examination with the polygon's sides. 교차로의 수를 계산하고 지점이 패...

프로그램 작성 2025-03-12에 게시되었습니다