Um guia para segmentação de imagens não supervisionadas usando cortes normalizados (NCut) em Python

Primeira página > Programação > Um guia para segmentação de imagens não supervisionadas usando cortes normalizados (NCut) em Python

Um guia para segmentação de imagens não supervisionadas usando cortes normalizados (NCut) em Python

Publicado em 2024-11-08

Navegar:614

A Guide to Unsupervised Image Segmentation using Normalized Cuts (NCut) in Python

Introdução

A segmentação de imagens desempenha um papel vital na compreensão e análise de dados visuais, e Cortes Normalizados (NCut) é um método amplamente utilizado para segmentação baseada em gráficos. Neste artigo, exploraremos como aplicar NCut para segmentação de imagens não supervisionadas em Python usando um conjunto de dados da Microsoft Research, com foco em melhorar a qualidade da segmentação usando superpixels.
Visão geral do conjunto de dados
O conjunto de dados usado para esta tarefa pode ser baixado no seguinte link: Banco de dados de imagens de categoria de objeto MSRC. Este conjunto de dados contém imagens originais, bem como sua segmentação semântica em nove classes de objetos (indicadas por arquivos de imagem terminados em “_GT”). Essas imagens são agrupadas em subconjuntos temáticos, onde o primeiro número no nome do arquivo refere-se a um subconjunto de classe. Este conjunto de dados é perfeito para experimentar tarefas de segmentação.

Declaração do problema

Realizamos segmentação de imagem em uma imagem no conjunto de dados usando o algoritmo NCut. A segmentação no nível do pixel é computacionalmente cara e muitas vezes barulhenta. Para superar isso, usamos SLIC (Simple Linear Iterative Clustering) para gerar superpixels, que agrupa pixels semelhantes e reduz o tamanho do problema. Para avaliar a precisão da segmentação, diferentes métricas (por exemplo, Intersecção sobre União, SSIM, Índice Rand) podem ser usadas.

Implementação

1. Instale as bibliotecas necessárias
Usamos skimage para processamento de imagem, numpy para cálculos numéricos e matplotlib para visualização.

pip install numpy matplotlib
pip install scikit-image==0.24.0
**2. Load and Preprocess the Dataset**

Depois de baixar e extrair o conjunto de dados, carregue as imagens e a segmentação da verdade:

wget http://download.microsoft.com/download/A/1/1/A116CD80-5B79-407E-B5CE-3D5C6ED8B0D5/msrc_objcategimagedatabase_v1.zip -O msrc_objcategimagedatabase_v1.zip
unzip msrc_objcategimagedatabase_v1.zip
rm msrc_objcategimagedatabase_v1.zip

Agora estamos prontos para começar a codificar.

from skimage import io, segmentation, color, measure
from skimage import graph
import numpy as np
import matplotlib.pyplot as plt

# Load the image and its ground truth
image = io.imread('/content/MSRC_ObjCategImageDatabase_v1/1_16_s.bmp')
ground_truth = io.imread('/content/MSRC_ObjCategImageDatabase_v1/1_16_s_GT.bmp')

# show images side by side
fig, ax = plt.subplots(1, 2, figsize=(10, 5))
ax[0].imshow(image)
ax[0].set_title('Image')
ax[1].imshow(ground_truth)
ax[1].set_title('Ground Truth')
plt.show()

3. Gere superpixels usando SLIC e crie um gráfico de adjacência de região

Usamos o algoritmo SLIC para calcular superpixels antes de aplicar o NCut. Usando os superpixels gerados, construímos um Gráfico de Adjacência de Região (RAG) com base na similaridade média de cores:

from skimage.util import img_as_ubyte, img_as_float, img_as_uint, img_as_float64

compactness=30 
n_segments=100 
labels = segmentation.slic(image, compactness=compactness, n_segments=n_segments, enforce_connectivity=True)
image_with_boundaries = segmentation.mark_boundaries(image, labels, color=(0, 0, 0))
image_with_boundaries = img_as_ubyte(image_with_boundaries)
pixel_labels = color.label2rgb(labels, image_with_boundaries, kind='avg', bg_label=0

compactação controla o equilíbrio entre a similaridade de cores e a proximidade espacial dos pixels ao formar superpixels. Ele determina quanta ênfase é colocada em manter os superpixels compactos (mais próximos em termos espaciais) em vez de garantir que eles sejam agrupados de forma mais homogênea por cor.
Valores mais altos: Um valor de compactação mais alto faz com que o algoritmo priorize a criação de superpixels que sejam espacialmente compactos e de tamanho uniforme, com menos atenção à semelhança de cores. Isso pode resultar em superpixels menos sensíveis a bordas ou gradientes de cores.
Valores mais baixos: Um valor de compacidade mais baixo permite que os superpixels variem mais no tamanho espacial para respeitar as diferenças de cores com mais precisão. Isso normalmente resulta em superpixels que seguem mais de perto os limites dos objetos na imagem.

n_segments controla o número de superpixels (ou segmentos) que o algoritmo SLIC tenta gerar na imagem. Essencialmente, ele define a resolução da segmentação.
Valores mais altos: um valor mais alto de n_segments cria mais superpixels, o que significa que cada superpixel será menor e a segmentação será mais refinada. Isso pode ser útil quando a imagem tem texturas complexas ou objetos pequenos.
Valores mais baixos: um valor mais baixo de n_segments produz menos superpixels maiores. Isso é útil quando você deseja uma segmentação grosseira da imagem, agrupando áreas maiores em superpixels únicos.

4. Aplique cortes normalizados (NCut) e visualize o resultado

# using the labels found with the superpixeled image
# compute the Region Adjacency Graph using mean colors
g = graph.rag_mean_color(image, labels, mode='similarity')

# perform Normalized Graph cut on the Region Adjacency Graph
labels2 = graph.cut_normalized(labels, g)
segmented_image = color.label2rgb(labels2, image, kind='avg')
f, axarr = plt.subplots(nrows=1, ncols=4, figsize=(25, 20))

axarr[0].imshow(image)
axarr[0].set_title("Original")

#plot boundaries
axarr[1].imshow(image_with_boundaries)
axarr[1].set_title("Superpixels Boundaries")

#plot labels
axarr[2].imshow(pixel_labels)
axarr[2].set_title('Superpixel Labels')

#compute segmentation
axarr[3].imshow(segmented_image)
axarr[3].set_title('Segmented image (normalized cut)')

5. Métricas de avaliação
O principal desafio na segmentação não supervisionada é que o NCut não sabe o número exato de classes na imagem. O número de segmentos encontrados pelo NCut pode exceder o número real de regiões de verdade. Como resultado, precisamos de métricas robustas para avaliar a qualidade da segmentação.

Intersection over Union (IoU) é uma métrica amplamente utilizada para avaliar tarefas de segmentação, particularmente em visão computacional. Ele mede a sobreposição entre as regiões segmentadas previstas e as regiões de verdade. Especificamente, IoU calcula a proporção da área de sobreposição entre a segmentação prevista e a verdade básica para a área de sua união.

Índice de Similaridade Estrutural (SSIM) é uma métrica usada para avaliar a qualidade percebida de uma imagem comparando duas imagens em termos de luminância, contraste e estrutura.

Para aplicar essas métricas, precisamos que a previsão e a imagem da verdade tenham os mesmos rótulos. Para calcular os rótulos calculamos uma máscara no solo e na previsão atribuímos um ID para cada cor encontrada na imagem
A segmentação usando NCut, no entanto, pode encontrar mais regiões do que a verdade básica, o que diminuirá a precisão.

def compute_mask(image):
  color_dict = {}

  # Get the shape of the image
  height,width,_ = image.shape

  # Create an empty array for labels
  labels = np.zeros((height,width),dtype=int)
  id=0
  # Loop over each pixel
  for i in range(height):
      for j in range(width):
          # Get the color of the pixel
          color = tuple(image[i,j])
          # Check if it is in the dictionary
          if color in color_dict:
              # Assign the label from the dictionary
              labels[i,j] = color_dict[color]
          else:
              color_dict[color]=id
              labels[i,j] = id
              id =1

  return(labels)
def show_img(prediction, groundtruth):
  f, axarr = plt.subplots(nrows=1, ncols=2, figsize=(15, 10))

  axarr[0].imshow(groundtruth)
  axarr[0].set_title("groundtruth")
  axarr[1].imshow(prediction)
  axarr[1].set_title(f"prediction")
prediction_mask = compute_mask(segmented_image)
groundtruth_mask = compute_mask(ground_truth)

#usign the original image as baseline to convert from labels to color
prediction_img = color.label2rgb(prediction_mask, image, kind='avg', bg_label=0)
groundtruth_img = color.label2rgb(groundtruth_mask, image, kind='avg', bg_label=0)

show_img(prediction_img, groundtruth_img)

Agora calculamos as pontuações de precisão

from sklearn.metrics import jaccard_score
from skimage.metrics import structural_similarity as ssim

ssim_score = ssim(prediction_img, groundtruth_img, channel_axis=2)
print(f"SSIM SCORE: {ssim_score}")

jac = jaccard_score(y_true=np.asarray(groundtruth_mask).flatten(),
                        y_pred=np.asarray(prediction_mask).flatten(),
                        average = None)

# compute mean IoU score across all classes
mean_iou = np.mean(jac)
print(f"Mean IoU: {mean_iou}")

Conclusão

Cortes normalizados é um método poderoso para segmentação de imagem não supervisionada, mas apresenta desafios como segmentação excessiva e parâmetros de ajuste. Ao incorporar superpixels e avaliar o desempenho usando métricas apropriadas, o NCut pode segmentar imagens complexas com eficácia. As métricas IoU e Rand Index fornecem insights significativos sobre a qualidade da segmentação, embora seja necessário refinamento adicional para lidar com cenários multiclasse de forma eficaz.
Por fim, um exemplo completo está disponível em meu notebook aqui.

Declaração de lançamento Este artigo está reproduzido em: https://dev.to/sopralapanca/a-guide-to-unsupervised-image-segmentation-using-normalized-cuts-ncut-in-python-13pk?1 Se houver alguma violação, por favor entre em contato com study_golang@163 .comdelete

Tutorial mais recente Mais>

Razões para o Codeigniter se conectar ao banco de dados MySQL depois de mudar para MySqli
Unable to Connect to MySQL Database: Troubleshooting Error MessageWhen attempting to switch from the MySQL driver to the MySQLi driver in CodeIgniter,...

Programação Postado em 2025-07-15
Por que as expressões lambda exigem variáveis "final" ou "final válida" em Java?
expressões lambda requerem "final" ou "efetivamente" variáveis a mensagem de erro "BEATILE Utilizada na expressão lam...

Programação Postado em 2025-07-15
Como resolver o erro "Não é possível adivinhar o tipo de arquivo, usar aplicativo/stream de octeto ..." no AppEngine?
AppEngine Arquivo estático MIME TIPO SUBSENTIDE No AppEngine, os manipuladores de arquivos estáticos podem ocasionalmente substituir o tipo de...

Programação Postado em 2025-07-15
Como ignorar os blocos de sites com os pedidos da Python e os agentes de usuários falsos?
como simular o comportamento do navegador com as solicitações de Python e os agentes de usuário falsos Python's Solicts Library é uma ferr...

Programação Postado em 2025-07-15
Como recuperar com eficiência a última linha para cada identificador exclusivo no PostGresql?
postGresql: Extraindo a última linha para cada identificador exclusivo em postgresql, você pode encontrar situações em que você precisa extrai...

Programação Postado em 2025-07-15
CSS fortemente a análise de linguagem digitada
Uma das maneiras pelas quais você pode classificar uma linguagem de programação é o quão fortemente ou fracamente é digitado. Aqui, “digitado” signif...

Programação Postado em 2025-07-15
Como fazer upload de arquivos com parâmetros adicionais usando java.net.urlConnection e codificação multipartida/formulário?
carregando arquivos com http requests para fazer upload de arquivos para um servidor http e também enviando parâmetros adicionais, java.net.ur...

Programação Postado em 2025-07-15
Por que estou recebendo um erro "não consegui encontrar uma implementação do padrão de consulta" na minha consulta Silverlight Linq?
ausência de implementação do padrão de consulta: resolvendo "não conseguiu encontrar" erros em um aplicativo Silverlight, uma tentat...

Programação Postado em 2025-07-15
Como posso manter a renderização de células JTable personalizada após a edição de células?
MANAZENDO JTABLE CELUMENTE renderização após a célula edit em uma jtable, implementar capacidades de renderização e edição de células personal...

Programação Postado em 2025-07-15
Quando usar "tente" em vez de "se" para detectar valores variáveis no python?
usando "Try" vs. "se" para testar o valor da variável no python no python, há situações em que você pode precisar verificar ...

Programação Postado em 2025-07-15
Variedade
Os métodos são FNs que podem ser chamados em objetos Matrizes são objetos, portanto, eles também têm métodos no JS. Flice (Begin): Extra...

Programação Postado em 2025-07-15
Como inserir ou atualizar com eficiência linhas com base em duas condições no MySQL?
inserir ou atualizar com duas condições Problema Descrição: O usuário encontra um tempo de tempo que não está sendo inserido e de uma tabe...

Programação Postado em 2025-07-15
Guia de criação de páginas de 404 de 404 da FASTAPI
Página 404 personalizada não encontrada com fastapi para criar uma página 404 personalizada não encontrada, o FASTAPI oferece várias abordagen...

Programação Postado em 2025-07-15
O CSS pode localizar elementos HTML com base em qualquer valor de atributo?
direcionando elementos html com qualquer valor de atributo no css em css, é possível alvo elementos baseados em atributos específicos, conform...

Programação Postado em 2025-07-15
Como posso recuperar com eficiência valores de atributo de arquivos XML usando PHP?
recuperando valores do atributo dos arquivos xml em php todo desenvolvedor encontra a necessidade de analisar arquivos xml e extrair valores e...

Programação Postado em 2025-07-15

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo