Python의 객체 감지에 대한 초보자 가이드

첫 장 > 프로그램 작성 > Python의 객체 감지에 대한 초보자 가이드

Python의 객체 감지에 대한 초보자 가이드

2024-11-02에 게시됨

검색:256

A Beginner’s Guide to Object Detection in Python

객체 감지는 컴퓨터 비전에서 가장 흥미로운 영역 중 하나이며, 이를 통해 기계는 이미지나 비디오에서 객체를 인식하고 찾을 수 있습니다. 이 가이드에서는 Python을 사용한 객체 감지 방법을 소개하여 널리 사용되는 라이브러리를 사용하여 기본 감지 파이프라인을 구현하는 데 도움을 줍니다. 초보자이거나 기존 기술을 기반으로 구축하려는 경우 이 튜토리얼은 시작하는 데 필수적인 통찰력을 제공합니다.

객체 감지란 무엇입니까? ?

객체 감지에는 두 가지 주요 작업이 포함됩니다.

이미지 분류: 이미지에 어떤 객체가 있는지 확인합니다.
객체 현지화: 경계 상자를 사용하여 객체의 위치를 찾습니다.

이는 모델이 클래스 레이블만 예측하는 단순한 이미지 분류보다 더 복잡합니다. 객체 감지를 위해서는 이미지 내 객체의 클래스와 위치를 모두 예측해야 합니다.

널리 사용되는 객체 감지 알고리즘?

1. YOLO (You Only Look Once)

속도로 유명한 YOLO는 경계 상자와 클래스 확률을 동시에 예측하는 실시간 객체 감지 시스템입니다.

2. SSD(단일 샷 멀티박스 감지기)

SSD는 단일 패스로 객체를 감지하고 기능 맵을 사용하여 다양한 규모의 객체를 감지하는 데 탁월합니다.

3. 더 빠른 R-CNN

지역 제안을 먼저 생성한 후 분류하는 2단계 모델입니다. YOLO 및 SSD보다 정확하지만 속도가 느립니다.

Python 환경 설정 ?️

Python에서 객체 감지를 시작하려면 몇 가지 라이브러리가 필요합니다.

1단계: Python 설치

python.org로 이동하여 최신 버전의 Python(3.8)을 다운로드하세요.

2단계: 필수 라이브러리 설치

이미지 처리에는 OpenCV를 사용하고 객체 감지에는 TensorFlow를 사용합니다.

pip install opencv-python tensorflow

선택적으로 Matplotlib를 설치하여 탐지 결과를 시각화합니다.

pip install matplotlib

객체 감지를 위한 사전 훈련된 모델?

처음부터 학습하는 대신 TensorFlow의 객체 감지 API 또는 PyTorch에서 사전 학습된 모델을 사용하세요. 사전 학습된 모델은 COCO(Common Objects in Context)와 같은 데이터 세트를 활용하여 리소스를 절약합니다.

이 튜토리얼에서는 빠르고 정확한 사전 학습된 모델인 TensorFlow의 ssd_mobilenet_v2를 사용합니다.

TensorFlow 및 OpenCV를 사용한 객체 감지 ?‍?

간단한 객체 감지 파이프라인을 구현하는 방법은 다음과 같습니다.

1단계: 사전 학습된 모델 로드

import tensorflow as tf

# Load the pre-trained model
model = tf.saved_model.load("ssd_mobilenet_v2_fpnlite_320x320/saved_model")

TensorFlow의 모델 동물원에서 모델을 다운로드할 수 있습니다.

2단계: 이미지 로드 및 처리

import cv2
import numpy as np

# Load an image using OpenCV
image_path = 'image.jpg'
image = cv2.imread(image_path)

# Convert the image to a tensor
input_tensor = tf.convert_to_tensor(image)
input_tensor = input_tensor[tf.newaxis, ...]

3단계: 객체 감지 수행

# Run inference on the image
detections = model(input_tensor)

# Extract relevant information like bounding boxes, classes, and scores
num_detections = int(detections.pop('num_detections'))
detections = {key: value[0, :num_detections].numpy() for key, value in detections.items()}
boxes = detections['detection_boxes']
scores = detections['detection_scores']
classes = detections['detection_classes'].astype(np.int64)

4단계: 결과 시각화

# Draw bounding boxes on the image
for i in range(num_detections):
    if scores[i] > 0.5:  # Confidence threshold
        box = boxes[i]
        h, w, _ = image.shape
        y_min, x_min, y_max, x_max = box

        start_point = (int(x_min * w), int(y_min * h))
        end_point = (int(x_max * w), int(y_max * h))

        # Draw rectangle
        cv2.rectangle(image, start_point, end_point, (0, 255, 0), 2)

# Display the image
cv2.imshow("Detections", image)
cv2.waitKey(0)
cv2.destroyAllWindows()

이 코드는 이미지를 로드하고 객체를 감지한 후 경계 상자로 시각화합니다. 신뢰도 임계값은 50%로 설정되어 신뢰도가 낮은 탐지를 필터링합니다.

고급 주제?

객체 감지 기술을 한 단계 더 발전시킬 준비가 되셨나요?

사용자 정의 개체 감지: TensorFlow 또는 PyTorch를 사용하여 자체 데이터세트에서 사용자 정의 모델을 교육합니다.
실시간 감지: 보안이나 자율 주행과 같은 애플리케이션을 위해 라이브 비디오 스트림에 객체 감지를 적용합니다.
엣지 장치 배포: 모바일 및 IoT 장치에 대한 객체 감지 모델을 최적화합니다.

결론 ?

Python의 객체 감지는 의료, 보안, 자율 주행과 같은 산업에서 가능성의 세계를 열어줍니다. TensorFlow 및 OpenCV와 같은 도구를 사용하면 YOLO 또는 SSD와 같은 사전 학습된 모델을 사용하여 감지 파이프라인을 빠르게 구현할 수 있습니다. 기본 사항에 익숙해지면 실시간 감지 및 커스텀 모델 학습과 같은 고급 주제를 탐색할 수 있습니다.

다음에는 객체 감지를 어디에 적용하시겠습니까? 아래 댓글에서 토론해 보세요!

키워드: 객체 감지, Python, 컴퓨터 비전, OpenCV, TensorFlow, YOLO, SSD, Faster R-CNN

릴리스 선언문 이 글은 https://dev.to/abhinowww/a-beginners-guide-to-object-Detection-in-python-5ahp?1에서 복제됩니다. 침해 내용이 있는 경우, [email protected]에 연락하여 삭제하시기 바랍니다. 그것

최신 튜토리얼 더>

MySQL 오류 #1089 : 잘못된 접두사 키를 얻는 이유는 무엇입니까?
오류 설명 [#1089- 잘못된 접두사 키 "는 테이블에서 열에 프리픽스 키를 만들려고 시도 할 때 나타날 수 있습니다. 접두사 키는 특정 접두사 길이의 문자열 열 길이를 색인화하도록 설계되었으며, 접두사를 더 빠르게 검색 할 수 있습니...

프로그램 작성 2025-07-04에 게시되었습니다
동적 인 크기의 부모 요소 내에서 요소의 스크롤 범위를 제한하는 방법은 무엇입니까?
문제 : 고정 된 사이드 바로 조정을 유지하면서 사용자의 수직 스크롤과 함께 이동하는 스크롤 가능한 맵 디브가있는 레이아웃을 고려합니다. 그러나 맵의 스크롤은 뷰포트의 높이를 초과하여 사용자가 페이지 바닥 글에 액세스하는 것을 방지합니다. ...

프로그램 작성 2025-07-04에 게시되었습니다
크롬에서 상자 텍스트를 선택하는 방법은 무엇입니까?
초기 시도 한 가지 일반적인 접근 방식은 다음과 같습니다. 주) & lt;/옵션 & gt; & lt; 옵션> select .lt {text-align : center; } <option value=""&a...

프로그램 작성 2025-07-04에 게시되었습니다
교체 지시문을 사용하여 GO MOD에서 모듈 경로 불일치를 해결하는 방법은 무엇입니까?
[ github.com/coreos/coreos/client github.com/coreos/etcd/client.test imports github.com/coreos/etcd/integration에 의해 테스트 된 Echoed 메시지에 의해 입증 된 바와...

프로그램 작성 2025-07-04에 게시되었습니다
PYTZ가 처음에 예상치 못한 시간대 오프셋을 표시하는 이유는 무엇입니까?
import pytz pytz.timezone ( 'Asia/Hong_kong') std> discrepancy source 역사 전반에 걸쳐 변동합니다. PYTZ가 제공하는 기본 시간대 이름 및 오프...

프로그램 작성 2025-07-04에 게시되었습니다
FormData ()로 여러 파일 업로드를 처리하려면 어떻게해야합니까?
); 그러나이 코드는 첫 번째 선택된 파일 만 처리합니다. 파일 : var files = document.getElementById ( 'filetOUpload'). 파일; for (var x = 0; x

프로그램 작성 2025-07-04에 게시되었습니다
$\ "(1) 대 (;;) : 컴파일러 최적화는 성능 차이를 제거합니까? \"$
\ "(1) 대 (;;) : 컴파일러 최적화는 성능 차이를 제거합니까? \"
대답 : 대부분의 최신 컴파일러에는 (1)과 (;;). 컴파일러 : s-> 7 8 v-> 4를 풀립니다 -e syntax ok gcc : GCC에서 두 루프는 다음과 같이 동일한 어셈블리 코드로 컴파일합니다. . t_while : ...

프로그램 작성 2025-07-04에 게시되었습니다
$Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?$
Point-In-Polygon 감지에 더 효율적인 방법 : Ray Tracing 또는 Matplotlib \ 's Path.contains_points?
Ray Tracing MethodThe ray tracing method intersects a horizontal ray from the point under examination with the polygon's sides. 교차로의 수를 계산하고 지점이 패...

프로그램 작성 2025-07-04에 게시되었습니다
Java는 여러 반환 유형을 허용합니까 : 일반적인 방법을 자세히 살펴보십시오.
public 목록 getResult (문자열 s); 여기서 foo는 사용자 정의 클래스입니다. 이 방법 선언은 두 가지 반환 유형을 자랑하는 것처럼 보입니다. 목록과 E. 그러나 이것이 사실인가? 일반 방법 : 미스터리 메소드는 단일...

프로그램 작성 2025-07-04에 게시되었습니다
순수한 CS로 여러 끈적 끈적한 요소를 서로 쌓을 수 있습니까?
순수한 CSS에서 서로 위에 여러 개의 끈적 끈적 요소가 쌓일 수 있습니까? 원하는 동작을 볼 수 있습니다. 여기 : https://webthemez.com/demo/sticky-multi-header-scroll/index.html Java...

프로그램 작성 2025-07-04에 게시되었습니다
오른쪽 테이블의 where 조항에서 필터링 할 때 왼쪽 결합이 연결된 이유는 무엇입니까?
다음 쿼리를 상상해보십시오 : select A.Foo, B. 바, c.foobar a로 테이블온에서 내부는 a.pk = b.fk에서 b로 tabletwo를 결합합니다 b.pk = c.fk에서 c as c로 왼쪽으로 결합하십시오 여기서 a.foo = '...

프로그램 작성 2025-07-04에 게시되었습니다
MySQLI로 전환 한 후 Codeigniter가 MySQL 데이터베이스에 연결 해야하는 이유
문제를 디버깅하려면 파일 끝에 다음 코드를 추가하고 출력을 검토하는 것이 좋습니다. echo ''; print_r ($ db ); echo ''; echo '데이터베이스에 연결 :'. $ db ; $ dbh = mysq...

프로그램 작성 2025-07-04에 게시되었습니다
자바 스크립트 객체의 키를 알파벳순으로 정렬하는 방법은 무엇입니까?
object.keys (...) . .sort () . 정렬 된 속성을 보유 할 새 개체를 만듭니다. 정렬 된 키 어레이를 반복하고 리소셔 함수를 사용하여 원래 객체에서 새 객체에 해당 값과 함께 각 키를 추가합니다. 다음 코드는 프로세...

프로그램 작성 2025-07-04에 게시되었습니다
Visual Studio 2012의 DataSource 대화 상자에 MySQL 데이터베이스를 추가하는 방법은 무엇입니까?
MySQL 커넥터 v.6.5.4가 설치되어 있지만 Entity 프레임 워크의 DataSource 대화 상자에 MySQL 데이터베이스를 추가 할 수 없습니다. 이를 해결하기 위해 MySQL 용 공식 Visual Studio 2012 통합은 MySQL 커넥터 v.6....

프로그램 작성 2025-07-04에 게시되었습니다
Spring Security 4.1 이상에서 CORS 문제를 해결하기위한 안내서
Spring Security 4.1 이후 Cors 지원을 활성화하기위한보다 간단한 접근 방식이 있습니다. webmvcconfigureradapter { @override public void addcorsmappings (corsregistry Registry) {...

프로그램 작성 2025-07-04에 게시되었습니다