"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > \'Identifier1\' 및 \'Identifier2\'라는 두 개의 열로 표시되는 무방향 그래프에서 관련 식별자를 어떻게 그룹화하고 고유한 그룹 ID를 할당합니까?

\'Identifier1\' 및 \'Identifier2\'라는 두 개의 열로 표시되는 무방향 그래프에서 관련 식별자를 어떻게 그룹화하고 고유한 그룹 ID를 할당합니까?

2024년 10월 31일에 게시됨
검색:951

How do we group related identifiers in an undirected graph represented by two columns, \'Identifier1\' and \'Identifier2\', and assign them unique group IDs?

무향 그래프에서 연결된 하위 그래프 찾기

문제:

'식별자1'과 '식별자2'라는 두 개의 열로 표현되는 무향 그래프가 주어지면, 서로 관련된 식별자를 그룹화하고 고유한 그룹 ID를 할당하려면 어떻게 해야 합니까?

해결책:

이 문제는 데이터를 그래프의 모서리로 처리하고 모든 모서리를 탐색하여 해결할 수 있습니다. 재귀적으로.

재귀 알고리즘:

  1. 두 열의 모든 고유 식별자를 포함하는 테이블을 생성합니다.
  2. 두 열의 모든 가장자리(식별자 쌍)를 포함하는 테이블을 생성합니다. 방향.
  3. 각 식별자에서 시작하여 그래프를 순회하고 순회된 식별자의 경로를 구축하는 재귀 쿼리를 정의합니다.
  4. 결과를 시작 식별자(앵커 식별자)별로 그룹화하여 연결된 구성 요소를 식별합니다.
  5. 앵커 식별자를 기반으로 연결된 각 구성 요소에 고유한 그룹 ID를 할당합니다.

예제 쿼리(SQL):

WITH
CTE_Idents AS (
    SELECT Ident1 AS Ident
    FROM @T

    UNION

    SELECT Ident2 AS Ident
    FROM @T
),
CTE_Pairs AS (
    SELECT Ident1, Ident2
    FROM @T
    WHERE Ident1 <> Ident2

    UNION

    SELECT Ident2 AS Ident1, Ident1 AS Ident2
    FROM @T
    WHERE Ident1 <> Ident2
),
CTE_Recursive AS (
    SELECT
        CAST(CTE_Idents.Ident AS varchar(8000)) AS AnchorIdent 
        , Ident1
        , Ident2
        , CAST(','   Ident1   ','   Ident2   ',' AS varchar(8000)) AS IdentPath
        , 1 AS Lvl
    FROM 
        CTE_Pairs
        INNER JOIN CTE_Idents ON CTE_Idents.Ident = CTE_Pairs.Ident1

    UNION ALL

    SELECT 
        CTE_Recursive.AnchorIdent 
        , CTE_Pairs.Ident1
        , CTE_Pairs.Ident2
        , CAST(CTE_Recursive.IdentPath   CTE_Pairs.Ident2   ',' AS varchar(8000)) AS IdentPath
        , CTE_Recursive.Lvl   1 AS Lvl
    FROM
        CTE_Pairs
        INNER JOIN CTE_Recursive ON CTE_Recursive.Ident2 = CTE_Pairs.Ident1
    WHERE
        CTE_Recursive.IdentPath NOT LIKE CAST('%,'   CTE_Pairs.Ident2   ',%' AS varchar(8000))
),
CTE_RecursionResult AS (
    SELECT AnchorIdent, Ident1, Ident2
    FROM CTE_Recursive
),
CTE_CleanResult AS (
    SELECT AnchorIdent, Ident1 AS Ident
    FROM CTE_RecursionResult

    UNION

    SELECT AnchorIdent, Ident2 AS Ident
    FROM CTE_RecursionResult
)
SELECT
    CTE_Idents.Ident
    ,CASE WHEN CA_Data.XML_Value IS NULL 
    THEN CTE_Idents.Ident ELSE CA_Data.XML_Value END AS GroupMembers
    ,DENSE_RANK() OVER(ORDER BY 
        CASE WHEN CA_Data.XML_Value IS NULL 
        THEN CTE_Idents.Ident ELSE CA_Data.XML_Value END
    ) AS GroupID
FROM
    CTE_Idents
    CROSS APPLY
    (
        SELECT CTE_CleanResult.Ident ','
        FROM CTE_CleanResult
        WHERE CTE_CleanResult.AnchorIdent = CTE_Idents.Ident
        ORDER BY CTE_CleanResult.Ident FOR XML PATH(''), TYPE
    ) AS CA_XML(XML_Value)
    CROSS APPLY
    (
        SELECT CA_XML.XML_Value.value('.', 'NVARCHAR(MAX)')
    ) AS CA_Data(XML_Value)
WHERE
    CTE_Idents.Ident IS NOT NULL
ORDER BY Ident;

핵심 사항:

  • 재귀 CTE(공통 테이블 표현식)는 그래프를 순회하여 연결된 구성 요소를 구축합니다.
  • 마지막 SELECT 문은 그룹을 할당합니다. 원하는 형식으로 ID를 생성하고 출력을 생성합니다.
  • 이 솔루션은 중복 계산을 방지하고 효율적인 결과를 제공하도록 최적화되었습니다.
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3