"Se um trabalhador quiser fazer bem o seu trabalho, ele deve primeiro afiar suas ferramentas." - Confúcio, "Os Analectos de Confúcio. Lu Linggong"
Primeira página > Programação > Como agrupamos identificadores relacionados em um gráfico não direcionado representado por duas colunas, \'Identifier1\' e \'Identifier2\', e atribuímos a eles IDs de grupo exclusivos?

Como agrupamos identificadores relacionados em um gráfico não direcionado representado por duas colunas, \'Identifier1\' e \'Identifier2\', e atribuímos a eles IDs de grupo exclusivos?

Publicado em 31/10/2024
Navegar:100

How do we group related identifiers in an undirected graph represented by two columns, \'Identifier1\' and \'Identifier2\', and assign them unique group IDs?

Encontrando subgrafos conectados em um gráfico não direcionado

Problema:

Dado um gráfico não direcionado representado por duas colunas, 'Identifier1' e 'Identifier2', como agrupamos identificadores relacionados entre si e atribuímos a eles um grupo exclusivo IDs?

Solução:

Este problema pode ser resolvido tratando os dados como arestas em um gráfico e percorrendo todas as arestas recursivamente.

Algoritmo recursivo:

  1. Crie uma tabela contendo todos os identificadores exclusivos de ambas as colunas.
  2. Crie uma tabela contendo todas as arestas (pares de identificadores) em ambas as direções.
  3. Defina uma consulta recursiva que percorra o gráfico começando em cada identificador e construa um caminho de identificadores percorridos.
  4. Agrupe os resultados pelo identificador inicial (identificador de âncora) para identificar componentes conectados .
  5. Atribua um ID de grupo exclusivo a cada componente conectado com base no identificador de âncora.

Exemplo de consulta (SQL):

WITH
CTE_Idents AS (
    SELECT Ident1 AS Ident
    FROM @T

    UNION

    SELECT Ident2 AS Ident
    FROM @T
),
CTE_Pairs AS (
    SELECT Ident1, Ident2
    FROM @T
    WHERE Ident1 <> Ident2

    UNION

    SELECT Ident2 AS Ident1, Ident1 AS Ident2
    FROM @T
    WHERE Ident1 <> Ident2
),
CTE_Recursive AS (
    SELECT
        CAST(CTE_Idents.Ident AS varchar(8000)) AS AnchorIdent 
        , Ident1
        , Ident2
        , CAST(','   Ident1   ','   Ident2   ',' AS varchar(8000)) AS IdentPath
        , 1 AS Lvl
    FROM 
        CTE_Pairs
        INNER JOIN CTE_Idents ON CTE_Idents.Ident = CTE_Pairs.Ident1

    UNION ALL

    SELECT 
        CTE_Recursive.AnchorIdent 
        , CTE_Pairs.Ident1
        , CTE_Pairs.Ident2
        , CAST(CTE_Recursive.IdentPath   CTE_Pairs.Ident2   ',' AS varchar(8000)) AS IdentPath
        , CTE_Recursive.Lvl   1 AS Lvl
    FROM
        CTE_Pairs
        INNER JOIN CTE_Recursive ON CTE_Recursive.Ident2 = CTE_Pairs.Ident1
    WHERE
        CTE_Recursive.IdentPath NOT LIKE CAST('%,'   CTE_Pairs.Ident2   ',%' AS varchar(8000))
),
CTE_RecursionResult AS (
    SELECT AnchorIdent, Ident1, Ident2
    FROM CTE_Recursive
),
CTE_CleanResult AS (
    SELECT AnchorIdent, Ident1 AS Ident
    FROM CTE_RecursionResult

    UNION

    SELECT AnchorIdent, Ident2 AS Ident
    FROM CTE_RecursionResult
)
SELECT
    CTE_Idents.Ident
    ,CASE WHEN CA_Data.XML_Value IS NULL 
    THEN CTE_Idents.Ident ELSE CA_Data.XML_Value END AS GroupMembers
    ,DENSE_RANK() OVER(ORDER BY 
        CASE WHEN CA_Data.XML_Value IS NULL 
        THEN CTE_Idents.Ident ELSE CA_Data.XML_Value END
    ) AS GroupID
FROM
    CTE_Idents
    CROSS APPLY
    (
        SELECT CTE_CleanResult.Ident ','
        FROM CTE_CleanResult
        WHERE CTE_CleanResult.AnchorIdent = CTE_Idents.Ident
        ORDER BY CTE_CleanResult.Ident FOR XML PATH(''), TYPE
    ) AS CA_XML(XML_Value)
    CROSS APPLY
    (
        SELECT CA_XML.XML_Value.value('.', 'NVARCHAR(MAX)')
    ) AS CA_Data(XML_Value)
WHERE
    CTE_Idents.Ident IS NOT NULL
ORDER BY Ident;

Pontos principais:

  • O CTE (Expressão de tabela comum) recursivo percorre o gráfico e cria componentes conectados.
  • A instrução SELECT final atribui o grupo Identifica e gera resultados no formato desejado.
  • Esta solução é otimizada para evitar cálculos redundantes e fornecer resultados eficientes.
Tutorial mais recente Mais>

Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.

Copyright© 2022 湘ICP备2022001581号-3