Руководство по неконтролируемой сегментации изображений с использованием нормализованных разрезов (NCut) в Python

титульная страница > программирование > Руководство по неконтролируемой сегментации изображений с использованием нормализованных разрезов (NCut) в Python

Руководство по неконтролируемой сегментации изображений с использованием нормализованных разрезов (NCut) в Python

Опубликовано 8 ноября 2024 г.

Просматривать:968

A Guide to Unsupervised Image Segmentation using Normalized Cuts (NCut) in Python

Введение

Сегментация изображений играет жизненно важную роль в понимании и анализе визуальных данных, а нормализованные разрезы (NCut) — широко используемый метод сегментации на основе графов. В этой статье мы рассмотрим, как применить NCut для неконтролируемой сегментации изображений в Python, используя набор данных от Microsoft Research, уделяя особое внимание улучшению качества сегментации с помощью суперпикселей.
Обзор набора данных
Набор данных, используемый для этой задачи, можно загрузить по следующей ссылке: База данных изображений категорий объектов MSRC. Этот набор данных содержит исходные изображения, а также их семантическую сегментацию на девять классов объектов (обозначенных файлами изображений, заканчивающимися на «_GT»). Эти изображения сгруппированы в тематические подмножества, где первая цифра в имени файла относится к подмножеству класса. Этот набор данных идеально подходит для экспериментов с задачами сегментации.

Постановка задачи

Мы выполняем сегментацию изображения в наборе данных с использованием алгоритма NCut. Сегментация на уровне пикселей требует больших вычислительных затрат и часто зашумлена. Чтобы преодолеть эту проблему, мы используем SLIC (простую линейную итеративную кластеризацию) для генерации суперпикселей, которая группирует похожие пиксели и уменьшает размер проблемы. Для оценки точности сегментации можно использовать различные метрики (например, Intersection over Union, SSIM, Rand Index).

Выполнение

1. Установите необходимые библиотеки
Мы используем Skimage для обработки изображений, numpy для численных вычислений и matplotlib для визуализации.

pip install numpy matplotlib
pip install scikit-image==0.24.0
**2. Load and Preprocess the Dataset**

После загрузки и извлечения набора данных загрузите изображения и основную сегментацию:

wget http://download.microsoft.com/download/A/1/1/A116CD80-5B79-407E-B5CE-3D5C6ED8B0D5/msrc_objcategimagedatabase_v1.zip -O msrc_objcategimagedatabase_v1.zip
unzip msrc_objcategimagedatabase_v1.zip
rm msrc_objcategimagedatabase_v1.zip

Теперь мы готовы приступить к кодированию.

from skimage import io, segmentation, color, measure
from skimage import graph
import numpy as np
import matplotlib.pyplot as plt

# Load the image and its ground truth
image = io.imread('/content/MSRC_ObjCategImageDatabase_v1/1_16_s.bmp')
ground_truth = io.imread('/content/MSRC_ObjCategImageDatabase_v1/1_16_s_GT.bmp')

# show images side by side
fig, ax = plt.subplots(1, 2, figsize=(10, 5))
ax[0].imshow(image)
ax[0].set_title('Image')
ax[1].imshow(ground_truth)
ax[1].set_title('Ground Truth')
plt.show()

3. Сгенерируйте суперпиксели с помощью SLIC и создайте график смежности регионов

Мы используем алгоритм SLIC для вычисления суперпикселей перед применением NCut. Используя сгенерированные суперпиксели, мы строим граф смежности регионов (RAG) на основе среднего сходства цветов:

from skimage.util import img_as_ubyte, img_as_float, img_as_uint, img_as_float64

compactness=30 
n_segments=100 
labels = segmentation.slic(image, compactness=compactness, n_segments=n_segments, enforce_connectivity=True)
image_with_boundaries = segmentation.mark_boundaries(image, labels, color=(0, 0, 0))
image_with_boundaries = img_as_ubyte(image_with_boundaries)
pixel_labels = color.label2rgb(labels, image_with_boundaries, kind='avg', bg_label=0

компактность контролирует баланс между цветовым сходством и пространственной близостью пикселей при формировании суперпикселей. Он определяет, насколько большое внимание уделяется сохранению компактности суперпикселей (ближе в пространственном отношении) по сравнению с обеспечением их более однородной группировки по цвету.
Более высокие значения: более высокое значение компактности заставляет алгоритм отдавать приоритет созданию суперпикселей, пространственно плотных и однородных по размеру, с меньшим вниманием к цветовому сходству. Это может привести к тому, что суперпиксели будут менее чувствительны к краям или цветовым градиентам.
Меньшие значения: более низкое значение компактности позволяет суперпикселям больше различаться по пространственному размеру, чтобы более точно учитывать различия в цвете. Обычно это приводит к тому, что суперпиксели более точно повторяют границы объектов на изображении.

n_segments управляет количеством суперпикселей (или сегментов), которые алгоритм SLIC пытается создать в изображении. По сути, он устанавливает разрешение сегментации.
Более высокие значения: более высокое значение n_segments создает больше суперпикселей, что означает, что каждый суперпиксель будет меньше, а сегментация будет более мелкозернистой. Это может быть полезно, если изображение имеет сложные текстуры или мелкие объекты.
Меньшие значения: меньшее значение n_segments дает меньше суперпикселей большего размера. Это полезно, если вам нужно грубо сегментировать изображение, группируя большие области в отдельные суперпиксели.

4. Примените нормализованные вырезы (NCut) и визуализируйте результат

# using the labels found with the superpixeled image
# compute the Region Adjacency Graph using mean colors
g = graph.rag_mean_color(image, labels, mode='similarity')

# perform Normalized Graph cut on the Region Adjacency Graph
labels2 = graph.cut_normalized(labels, g)
segmented_image = color.label2rgb(labels2, image, kind='avg')
f, axarr = plt.subplots(nrows=1, ncols=4, figsize=(25, 20))

axarr[0].imshow(image)
axarr[0].set_title("Original")

#plot boundaries
axarr[1].imshow(image_with_boundaries)
axarr[1].set_title("Superpixels Boundaries")

#plot labels
axarr[2].imshow(pixel_labels)
axarr[2].set_title('Superpixel Labels')

#compute segmentation
axarr[3].imshow(segmented_image)
axarr[3].set_title('Segmented image (normalized cut)')

5. Показатели оценки
Основная проблема неконтролируемой сегментации заключается в том, что NCut не знает точного количества классов в изображении. Количество сегментов, найденных NCut, может превышать фактическое количество наземных регионов. В результате нам нужны надежные показатели для оценки качества сегментации.

Пересечение через объединение (IoU) — широко используемый показатель для оценки задач сегментации, особенно в компьютерном зрении. Он измеряет перекрытие между предсказанными сегментированными регионами и регионами основной истины. В частности, IoU вычисляет отношение области перекрытия между предсказанной сегментацией и основной истиной к области их объединения.

Индекс структурного сходства (SSIM) — это показатель, используемый для оценки воспринимаемого качества изображения путем сравнения двух изображений с точки зрения яркости, контрастности и структуры.

Чтобы применить эти метрики, нам нужно, чтобы прогноз и истинное изображение имели одинаковые метки. Чтобы вычислить метки, мы вычисляем маску на земле, а в прогнозе присваиваем идентификатор каждому цвету, найденному на изображении
Однако сегментация с использованием NCut может обнаружить больше регионов, чем наземная истина, это снизит точность.

def compute_mask(image):
  color_dict = {}

  # Get the shape of the image
  height,width,_ = image.shape

  # Create an empty array for labels
  labels = np.zeros((height,width),dtype=int)
  id=0
  # Loop over each pixel
  for i in range(height):
      for j in range(width):
          # Get the color of the pixel
          color = tuple(image[i,j])
          # Check if it is in the dictionary
          if color in color_dict:
              # Assign the label from the dictionary
              labels[i,j] = color_dict[color]
          else:
              color_dict[color]=id
              labels[i,j] = id
              id =1

  return(labels)
def show_img(prediction, groundtruth):
  f, axarr = plt.subplots(nrows=1, ncols=2, figsize=(15, 10))

  axarr[0].imshow(groundtruth)
  axarr[0].set_title("groundtruth")
  axarr[1].imshow(prediction)
  axarr[1].set_title(f"prediction")
prediction_mask = compute_mask(segmented_image)
groundtruth_mask = compute_mask(ground_truth)

#usign the original image as baseline to convert from labels to color
prediction_img = color.label2rgb(prediction_mask, image, kind='avg', bg_label=0)
groundtruth_img = color.label2rgb(groundtruth_mask, image, kind='avg', bg_label=0)

show_img(prediction_img, groundtruth_img)

Теперь мы вычисляем показатели точности

from sklearn.metrics import jaccard_score
from skimage.metrics import structural_similarity as ssim

ssim_score = ssim(prediction_img, groundtruth_img, channel_axis=2)
print(f"SSIM SCORE: {ssim_score}")

jac = jaccard_score(y_true=np.asarray(groundtruth_mask).flatten(),
                        y_pred=np.asarray(prediction_mask).flatten(),
                        average = None)

# compute mean IoU score across all classes
mean_iou = np.mean(jac)
print(f"Mean IoU: {mean_iou}")

Заключение

Нормализованные вырезы — это мощный метод неконтролируемой сегментации изображений, но он сопряжен с такими проблемами, как чрезмерная сегментация и настройка параметров. Включая суперпиксели и оценивая производительность с использованием соответствующих показателей, NCut может эффективно сегментировать сложные изображения. Метрики IoU и Rand Index дают содержательную информацию о качестве сегментации, хотя для эффективной обработки сценариев с несколькими классами необходимы дальнейшие уточнения.
Наконец, полный пример доступен в моем блокноте здесь.

Заявление о выпуске Эта статья воспроизведена по адресу: https://dev.to/sopralapanca/a-guide-to-unsupervised-image-segmentation-using-normalized-cuts-ncut-in-python-13pk?1 Если есть какие-либо нарушения, пожалуйста, свяжитесь с Study_golang@163 .comdelete

Последний учебник Более>

Как я могу объединить таблицы базы данных с различным числом столбцов?
объединенные таблицы с разными столбцами ] может столкнуться с проблемами при попытке объединить таблицы баз данных с разными столбцами. Просто...

программирование Опубликовано в 2025-07-08
В чем разница между вложенными функциями и закрытием в Python
] вложенные функции против закрытия в Python , в то время как вложенные функции в Python поверхностно напоминают закрытия, они в основном отлича...

программирование Опубликовано в 2025-07-08
Как я могу эффективно создавать словаря, используя понимание Python?
Python Dictionary понимание в Python, словарь понимает, предлагает краткий способ создания новых словарей. Хотя они похожи на понимание списков,...

программирование Опубликовано в 2025-07-08
Как избежать утечек памяти при наречном языке?
утечка памяти в срезах Go Понимание утечек памяти в ломтиках Go может быть вызовом. Эта статья направлена на то, чтобы дать разъяснение, изу...

программирование Опубликовано в 2025-07-08
$Как исправить \ "mysql_config не найдена \" Ошибка при установке MySQL-Python на Ubuntu/Linux?$
Как исправить \ "mysql_config не найдена \" Ошибка при установке MySQL-Python на Ubuntu/Linux?
mysql-python error: "mysql_config не найдено" попытка установить Mysql-python на Ubuntu/linux box может столкнуться с сообщением об ...

программирование Опубликовано в 2025-07-08
Причины и решения для сбоя обнаружения лица: ошибка -215
обработка ошибок: разрешение «ошибка: (-215)! Empty () в функции DetectMultiscale" в OpenCV при попытке использовать метод DeTectMultisca...

программирование Опубликовано в 2025-07-08
FOSTAPI CUSTEM 404 Руководство по созданию страниц
Custom 404 не найдена страницей с FastApi , чтобы создать пользовательскую страницу 404, не найденная, FastApi предлагает несколько подходов. С...

программирование Опубликовано в 2025-07-08
Почему мое фоновое изображение CSS появляется?
Устранение неисправностей: CSS Фоновое изображение не отображается Вы столкнулись с проблемой, где ваше фоновое изображение не загружается, не...

программирование Опубликовано в 2025-07-08
$\ "В то время как (1) против (;;): Оптимизация компилятора исключает различия в производительности? \"$
\ "В то время как (1) против (;;): Оптимизация компилятора исключает различия в производительности? \"
while (1) vs. for (;;;): существует ли разница в скорости? ] Вопрос: . Использование (1) вместо (;) петли? Компиляторы: ] perl: как (1)...

программирование Опубликовано в 2025-07-08
Как эффективно преобразовать часовые пояса в PHP?
эффективное преобразование часового пояса в php В PHP, обработка часовых поясов может быть простой задачей. Это руководство предоставит метод пр...

программирование Опубликовано в 2025-07-08
Когда веб -приложение Go закроет подключение к базе данных?
управление подключениями к базе данных в веб -приложениях GO в простых веб -приложениях, в которых используются базы данных, такие как PostgreSQ...

программирование Опубликовано в 2025-07-08
`console.log` показывает причину исключения измененного значения объекта
objects and console.log: нечетность раскрыта При работе с объектами и console.log вы можете встретить своеобразное поведение. Давайте разгадым...

программирование Опубликовано в 2025-07-08
Пользовательский локальный формат времени и руководство по смещению часового пояса
отображение даты/времени в формате локации пользователя с смещением времени При представлении дат и времени конечным пользователям нужно отобр...

программирование Опубликовано в 2025-07-08
Советы по поиску позиции элемента в массиве Java
Получение позиции элемента в массивах Java в классе массивов Java, не существует прямого «Indexof», чтобы определить позицию определенного эле...

программирование Опубликовано в 2025-07-08
Как проанализировать числа в экспоненциальной нотации с помощью Decimal.parse ()?
анализирует число из экспоненциальной нотации При попытке проанализировать строку, выраженную в экспоненциальной нотации, используя Tecimal.pa...

программирование Опубликовано в 2025-07-08