Руководство для начинающих по обнаружению объектов в Python

титульная страница > программирование > Руководство для начинающих по обнаружению объектов в Python

Руководство для начинающих по обнаружению объектов в Python

Опубликовано 2 ноября 2024 г.

Просматривать:128

A Beginner’s Guide to Object Detection in Python

Обнаружение объектов — одна из самых интересных областей компьютерного зрения, позволяющая машинам распознавать и определять местонахождение объектов на изображениях или видео. Это руководство познакомит вас с обнаружением объектов с помощью Python и поможет вам реализовать базовый конвейер обнаружения с помощью популярных библиотек. Независимо от того, являетесь ли вы новичком или хотите развить имеющиеся навыки, это руководство предоставит вам необходимую информацию для начала работы.

Что такое обнаружение объектов? ?

Обнаружение объектов включает в себя две основные задачи:

Классификация изображения: определение объекта, присутствующего на изображении.
Локализация объекта: определение положения объекта с помощью ограничивающих рамок.

Это делает ее более сложной, чем простая классификация изображений, где модель просто прогнозирует метки классов. Обнаружение объекта требует прогнозирования как класса, так и местоположения объекта на изображении.

Настройка среды Python ?️

Чтобы начать обнаружение объектов в Python, вам понадобится несколько библиотек.

Шаг 1. Установите Python

Зайдите на сайт python.org и загрузите последнюю версию Python (3.8 ).

Шаг 2. Установите необходимые библиотеки

Мы будем использовать OpenCV для обработки изображений и TensorFlow для обнаружения объектов.

pip install opencv-python tensorflow

При желании установите Matplotlib для визуализации результатов обнаружения.

pip install matplotlib

Предварительно обученные модели для обнаружения объектов?

Вместо обучения с нуля используйте предварительно обученные модели из TensorFlow's Object Detection API или PyTorch. Предварительно обученные модели экономят ресурсы за счет использования таких наборов данных, как COCO (общие объекты в контексте).

В этом уроке мы будем использовать ssd_mobilenet_v2 от TensorFlow, быструю и точную предварительно обученную модель.

Обнаружение объектов с помощью TensorFlow и OpenCV ?‍?

Вот как реализовать простой конвейер обнаружения объектов.

Шаг 1. Загрузите предварительно обученную модель

import tensorflow as tf

# Load the pre-trained model
model = tf.saved_model.load("ssd_mobilenet_v2_fpnlite_320x320/saved_model")

Вы можете скачать модель из зоопарка моделей TensorFlow.

Шаг 2. Загрузите и обработайте изображение

import cv2
import numpy as np

# Load an image using OpenCV
image_path = 'image.jpg'
image = cv2.imread(image_path)

# Convert the image to a tensor
input_tensor = tf.convert_to_tensor(image)
input_tensor = input_tensor[tf.newaxis, ...]

Шаг 3. Выполните обнаружение объектов

# Run inference on the image
detections = model(input_tensor)

# Extract relevant information like bounding boxes, classes, and scores
num_detections = int(detections.pop('num_detections'))
detections = {key: value[0, :num_detections].numpy() for key, value in detections.items()}
boxes = detections['detection_boxes']
scores = detections['detection_scores']
classes = detections['detection_classes'].astype(np.int64)

Шаг 4: Визуализируйте результаты

# Draw bounding boxes on the image
for i in range(num_detections):
    if scores[i] > 0.5:  # Confidence threshold
        box = boxes[i]
        h, w, _ = image.shape
        y_min, x_min, y_max, x_max = box

        start_point = (int(x_min * w), int(y_min * h))
        end_point = (int(x_max * w), int(y_max * h))

        # Draw rectangle
        cv2.rectangle(image, start_point, end_point, (0, 255, 0), 2)

# Display the image
cv2.imshow("Detections", image)
cv2.waitKey(0)
cv2.destroyAllWindows()

Этот код загружает изображение, обнаруживает объекты и визуализирует их с помощью ограничивающих рамок. Порог достоверности установлен на 50 %, отфильтровывая обнаружения с низкой достоверностью.

Продвинутые темы?

Готовы поднять свои навыки обнаружения объектов на новый уровень?

Обнаружение пользовательских объектов: обучите пользовательскую модель на собственном наборе данных с помощью TensorFlow или PyTorch.
Обнаружение в реальном времени: применяйте обнаружение объектов к видеопотокам в реальном времени для таких приложений, как безопасность или автономное вождение.
Развертывание периферийных устройств: оптимизируйте модели обнаружения объектов для мобильных устройств и устройств Интернета вещей.

Заключение ?

Обнаружение объектов в Python открывает мир возможностей в таких отраслях, как здравоохранение, безопасность и автономное вождение. С помощью таких инструментов, как TensorFlow и OpenCV, вы можете быстро реализовать конвейеры обнаружения, используя предварительно обученные модели, такие как YOLO или SSD. Освоив основы, вы сможете изучить более сложные темы, такие как обнаружение в реальном времени и обучение пользовательской модели.

Где вы будете применять обнаружение объектов в следующий раз? Давайте обсудим в комментариях ниже!

Ключевые слова: обнаружение объектов, Python, компьютерное зрение, OpenCV, TensorFlow, YOLO, SSD, Faster R-CNN.

Заявление о выпуске Эта статья воспроизведена по адресу: https://dev.to/abhinowww/a-beginners-guide-to-object-detection-in-python-5ahp?1 Если есть какие-либо нарушения, свяжитесь с [email protected], чтобы удалить это

Последний учебник Более>

$Как разрешить \ "Отказалось загрузить сценарий ... \" Ошибки из -за политики безопасности контента Android?$
Как разрешить \ "Отказалось загрузить сценарий ... \" Ошибки из -за политики безопасности контента Android?
Представление Mystery: Directive Policive Policive Content Security столкновение с загадочной ошибкой »отказалась загрузить скрипт ...» при ра...

программирование Опубликовано в 2025-04-19
Как эффективно изменить атрибут CSS «: после» псевдоэлемента с использованием jQuery?
понимание ограничений псевдо-элементов в jQuery: доступ к ": после" selector в веб-разработке, псевдо-элементы, такие как ": по...

программирование Опубликовано в 2025-04-19
Удивление и равель: руководство по выбору функций Numpy
понимание разницы между функциями сглаживания и равель Numpy библиотека Numpy предоставляет два метода: сгладить и равель, чтобы преобразовать...

программирование Опубликовано в 2025-04-19
Как объединить данные из трех таблиц MySQL в новую таблицу?
mySQL: Creating a New Table from Data and Columns of Three TablesQuestion:How can I create a new table that combines selected data from three existing...

программирование Опубликовано в 2025-04-19
Советы для привязки слушателей событий для динамически добавленных элементов HTML с использованием jQuery
Прикрепление событий к динамическим элементам HTML в jQuery При работе с динамически загруженным контентом в веб -приложениях прикрепляют слуш...

программирование Опубликовано в 2025-04-19
Ошибка компилятора "usr/bin/ld: не может найти -l" Решение
isrysed: "usr/bin/ld: нельзя найти -l " Эта ошибка указывает, что линкера не может найти указанную библиотеку при связывании вашего...

программирование Опубликовано в 2025-04-19
$Почему я получаю ошибку \ "class \ 'Ziparchive \' не найдена \" после установки archive_zip на моем сервере Linux?$
Почему я получаю ошибку \ "class \ 'Ziparchive \' не найдена \" после установки archive_zip на моем сервере Linux?
class 'Ziparchive' не найдена ошибка при установке Archive_zip на Linux Server симптома: при попытке запустить сценарий, который исп...

программирование Опубликовано в 2025-04-19
Как центрировать выровненные кнопки в Div?
сосредоточить кнопку в Div В веб -разработке часто желательно центрировать кнопку в пределах содержащегося div. Давайте рассмотрим два решения...

программирование Опубликовано в 2025-04-19
Как эффективно повторить строковые символы для вдавления в C#?
повторяя строку для вдавления , когда обрабатывает строку, основанную на глубине элемента, удобно иметь эффективный способ вернуть строку, повт...

программирование Опубликовано в 2025-04-19
Когда использовать «попробуйте» вместо «если», чтобы обнаружить значения переменных в Python?
, используя «try» vs. «if», чтобы проверить значение переменной в Python в Python, существуют ситуации, когда вам может потребоваться проверить, ...

программирование Опубликовано в 2025-04-19
Как я могу выполнить несколько операторов SQL в одном запросе с помощью Node-Mysql?
Поддержка запросов с несколькими Statement в Node-Mysql в Node.js возникает вопрос, когда выполняется несколько SQL-записей в одном запросе, и...

программирование Опубликовано в 2025-04-19
Как установить BOOST_1_60_0.zip в Windows
boost_1_60_0 .zip Установка в Windows Чтобы продолжить установку Boost_1_60_0 в Windows, вам нужно будет перемещаться в каталог, где находится ф...

программирование Опубликовано в 2025-04-19
Нужно ли мне явно удалить распределения кучи в C ++ до выхода программы?
явное удаление в C, несмотря на exit программы При работе с распределением динамической памятью в C разработчики часто задаются вопросом, необ...

программирование Опубликовано в 2025-04-19
Как динамически получить доступ к глобальным переменным в JavaScript?
доступ к глобальным переменным динамически по имени в JavaScript Получение доступа к глобальным переменным во время выполнения может быть общим ...

программирование Опубликовано в 2025-04-19
`console.log` показывает причину исключения измененного значения объекта
objects and console.log: нечетность раскрыта При работе с объектами и console.log вы можете встретить своеобразное поведение. Давайте разгадым...

программирование Опубликовано в 2025-04-19