„Wenn ein Arbeiter seine Arbeit gut machen will, muss er zuerst seine Werkzeuge schärfen.“ – Konfuzius, „Die Gespräche des Konfuzius. Lu Linggong“
Titelseite > Programmierung > Wie gruppieren wir verwandte Bezeichner in einem ungerichteten Diagramm, das durch zwei Spalten, „Bezeichner1“ und „Bezeichner2“, dargestellt wird, und weisen ihnen eindeutige Gruppen-IDs zu?

Wie gruppieren wir verwandte Bezeichner in einem ungerichteten Diagramm, das durch zwei Spalten, „Bezeichner1“ und „Bezeichner2“, dargestellt wird, und weisen ihnen eindeutige Gruppen-IDs zu?

Veröffentlicht am 31.10.2024
Durchsuche:884

How do we group related identifiers in an undirected graph represented by two columns, \'Identifier1\' and \'Identifier2\', and assign them unique group IDs?

Suchen verbundener Untergraphen in einem ungerichteten Diagramm

Problem:

Gegeben sei ein ungerichteter Graph, der durch zwei Spalten dargestellt wird, „Bezeichner1“ und „Bezeichner2“, Wie gruppieren wir miteinander verwandte Bezeichner und weisen ihnen eindeutige Gruppen-IDs zu?

Lösung:

Dieses Problem kann gelöst werden, indem die Daten als Kanten in einem Diagramm behandelt und alle Kanten durchlaufen werden rekursiv.

Rekursiver Algorithmus:

  1. Erstellen Sie eine Tabelle mit allen eindeutigen Bezeichnern aus beiden Spalten.
  2. Erstellen Sie eine Tabelle mit allen Kanten (Bezeichnerpaaren) in beiden Richtungen.
  3. Definieren Sie eine rekursive Abfrage, die das Diagramm ausgehend von jedem Bezeichner durchläuft und einen Pfad der durchlaufenen Bezeichner erstellt.
  4. Gruppieren Sie die Ergebnisse nach dem Startbezeichner (Ankerbezeichner), um verbundene Komponenten zu identifizieren.
  5. Weisen Sie jeder verbundenen Komponente basierend auf der Anker-ID eine eindeutige Gruppen-ID zu.

Beispielabfrage (SQL):

WITH
CTE_Idents AS (
    SELECT Ident1 AS Ident
    FROM @T

    UNION

    SELECT Ident2 AS Ident
    FROM @T
),
CTE_Pairs AS (
    SELECT Ident1, Ident2
    FROM @T
    WHERE Ident1 <> Ident2

    UNION

    SELECT Ident2 AS Ident1, Ident1 AS Ident2
    FROM @T
    WHERE Ident1 <> Ident2
),
CTE_Recursive AS (
    SELECT
        CAST(CTE_Idents.Ident AS varchar(8000)) AS AnchorIdent 
        , Ident1
        , Ident2
        , CAST(','   Ident1   ','   Ident2   ',' AS varchar(8000)) AS IdentPath
        , 1 AS Lvl
    FROM 
        CTE_Pairs
        INNER JOIN CTE_Idents ON CTE_Idents.Ident = CTE_Pairs.Ident1

    UNION ALL

    SELECT 
        CTE_Recursive.AnchorIdent 
        , CTE_Pairs.Ident1
        , CTE_Pairs.Ident2
        , CAST(CTE_Recursive.IdentPath   CTE_Pairs.Ident2   ',' AS varchar(8000)) AS IdentPath
        , CTE_Recursive.Lvl   1 AS Lvl
    FROM
        CTE_Pairs
        INNER JOIN CTE_Recursive ON CTE_Recursive.Ident2 = CTE_Pairs.Ident1
    WHERE
        CTE_Recursive.IdentPath NOT LIKE CAST('%,'   CTE_Pairs.Ident2   ',%' AS varchar(8000))
),
CTE_RecursionResult AS (
    SELECT AnchorIdent, Ident1, Ident2
    FROM CTE_Recursive
),
CTE_CleanResult AS (
    SELECT AnchorIdent, Ident1 AS Ident
    FROM CTE_RecursionResult

    UNION

    SELECT AnchorIdent, Ident2 AS Ident
    FROM CTE_RecursionResult
)
SELECT
    CTE_Idents.Ident
    ,CASE WHEN CA_Data.XML_Value IS NULL 
    THEN CTE_Idents.Ident ELSE CA_Data.XML_Value END AS GroupMembers
    ,DENSE_RANK() OVER(ORDER BY 
        CASE WHEN CA_Data.XML_Value IS NULL 
        THEN CTE_Idents.Ident ELSE CA_Data.XML_Value END
    ) AS GroupID
FROM
    CTE_Idents
    CROSS APPLY
    (
        SELECT CTE_CleanResult.Ident ','
        FROM CTE_CleanResult
        WHERE CTE_CleanResult.AnchorIdent = CTE_Idents.Ident
        ORDER BY CTE_CleanResult.Ident FOR XML PATH(''), TYPE
    ) AS CA_XML(XML_Value)
    CROSS APPLY
    (
        SELECT CA_XML.XML_Value.value('.', 'NVARCHAR(MAX)')
    ) AS CA_Data(XML_Value)
WHERE
    CTE_Idents.Ident IS NOT NULL
ORDER BY Ident;

Wichtige Punkte:

  • Der rekursive CTE (Common Table Expression) durchläuft den Graphen und erstellt verbundene Komponenten.
  • Die letzte SELECT-Anweisung weist eine Gruppe zu IDs und generiert Ausgaben im gewünschten Format.
  • Diese Lösung ist optimiert, um redundante Berechnungen zu vermeiden und effiziente Ergebnisse zu liefern.
Neuestes Tutorial Mehr>

Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.

Copyright© 2022 湘ICP备2022001581号-3