"Si un ouvrier veut bien faire son travail, il doit d'abord affûter ses outils." - Confucius, "Les Entretiens de Confucius. Lu Linggong"
Page de garde > La programmation > Comment pouvons-nous regrouper les identifiants associés dans un graphe non orienté représenté par deux colonnes, \'Identifier1\' et \'Identifier2\', et leur attribuer des ID de groupe uniques ?

Comment pouvons-nous regrouper les identifiants associés dans un graphe non orienté représenté par deux colonnes, \'Identifier1\' et \'Identifier2\', et leur attribuer des ID de groupe uniques ?

Publié le 2024-10-31
Parcourir:912

How do we group related identifiers in an undirected graph represented by two columns, \'Identifier1\' and \'Identifier2\', and assign them unique group IDs?

Recherche de sous-graphes connectés dans un graphe non orienté

Problème :

Étant donné un graphe non orienté représenté par deux colonnes, « Identifiant 1 » et « Identifiant 2 », comment regrouper les identifiants liés les uns aux autres et leur attribuer des ID de groupe uniques ?

Solution :

Ce problème peut être résolu en traitant les données comme des arêtes dans un graphique et en parcourant toutes les arêtes récursivement.

Algorithme récursif :

  1. Créez un tableau contenant tous les identifiants uniques des deux colonnes.
  2. Créez un tableau contenant tous les bords (paires d'identifiants) dans les deux colonnes. directions.
  3. Définissez une requête récursive qui parcourt le graphique à partir de chaque identifiant et construit un chemin d'identifiants parcourus.
  4. Regroupez les résultats par l'identifiant de départ (identifiant d'ancrage) pour identifier les composants connectés.
  5. Attribuez un ID de groupe unique à chaque composant connecté en fonction de l'identifiant d'ancrage.

Exemple de requête (SQL) :

WITH
CTE_Idents AS (
    SELECT Ident1 AS Ident
    FROM @T

    UNION

    SELECT Ident2 AS Ident
    FROM @T
),
CTE_Pairs AS (
    SELECT Ident1, Ident2
    FROM @T
    WHERE Ident1 <> Ident2

    UNION

    SELECT Ident2 AS Ident1, Ident1 AS Ident2
    FROM @T
    WHERE Ident1 <> Ident2
),
CTE_Recursive AS (
    SELECT
        CAST(CTE_Idents.Ident AS varchar(8000)) AS AnchorIdent 
        , Ident1
        , Ident2
        , CAST(','   Ident1   ','   Ident2   ',' AS varchar(8000)) AS IdentPath
        , 1 AS Lvl
    FROM 
        CTE_Pairs
        INNER JOIN CTE_Idents ON CTE_Idents.Ident = CTE_Pairs.Ident1

    UNION ALL

    SELECT 
        CTE_Recursive.AnchorIdent 
        , CTE_Pairs.Ident1
        , CTE_Pairs.Ident2
        , CAST(CTE_Recursive.IdentPath   CTE_Pairs.Ident2   ',' AS varchar(8000)) AS IdentPath
        , CTE_Recursive.Lvl   1 AS Lvl
    FROM
        CTE_Pairs
        INNER JOIN CTE_Recursive ON CTE_Recursive.Ident2 = CTE_Pairs.Ident1
    WHERE
        CTE_Recursive.IdentPath NOT LIKE CAST('%,'   CTE_Pairs.Ident2   ',%' AS varchar(8000))
),
CTE_RecursionResult AS (
    SELECT AnchorIdent, Ident1, Ident2
    FROM CTE_Recursive
),
CTE_CleanResult AS (
    SELECT AnchorIdent, Ident1 AS Ident
    FROM CTE_RecursionResult

    UNION

    SELECT AnchorIdent, Ident2 AS Ident
    FROM CTE_RecursionResult
)
SELECT
    CTE_Idents.Ident
    ,CASE WHEN CA_Data.XML_Value IS NULL 
    THEN CTE_Idents.Ident ELSE CA_Data.XML_Value END AS GroupMembers
    ,DENSE_RANK() OVER(ORDER BY 
        CASE WHEN CA_Data.XML_Value IS NULL 
        THEN CTE_Idents.Ident ELSE CA_Data.XML_Value END
    ) AS GroupID
FROM
    CTE_Idents
    CROSS APPLY
    (
        SELECT CTE_CleanResult.Ident ','
        FROM CTE_CleanResult
        WHERE CTE_CleanResult.AnchorIdent = CTE_Idents.Ident
        ORDER BY CTE_CleanResult.Ident FOR XML PATH(''), TYPE
    ) AS CA_XML(XML_Value)
    CROSS APPLY
    (
        SELECT CA_XML.XML_Value.value('.', 'NVARCHAR(MAX)')
    ) AS CA_Data(XML_Value)
WHERE
    CTE_Idents.Ident IS NOT NULL
ORDER BY Ident;

Points clés :

  • Le CTE (Common Table Expression) récursif parcourt le graphique et construit les composants connectés.
  • L'instruction SELECT finale attribue un groupe Identifie et génère la sortie dans le format souhaité.
  • Cette solution est optimisée pour éviter les calculs redondants et fournir des résultats efficaces.
Dernier tutoriel Plus>

Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.

Copyright© 2022 湘ICP备2022001581号-3