Bigquery의 매개변수화된 쿼리에서 구조체 배열을 전달하는 방법

첫 장 > 프로그램 작성 > Bigquery의 매개변수화된 쿼리에서 구조체 배열을 전달하는 방법

Bigquery의 매개변수화된 쿼리에서 구조체 배열을 전달하는 방법

2024-11-08에 게시됨

검색:909

How to pass an Array of Structs in Bigquery

Google BigQuery에서는 SQL 쿼리를 매개변수화할 수 있습니다. 이 개념에 익숙하지 않다면 기본적으로 다음과 같이 SQL 쿼리를 매개변수화된 템플릿으로 작성할 수 있다는 의미입니다.

INSERT INTO mydataset.mytable(columnA, columnB)
    VALUES (@valueA, @valueB)

그리고 값을 별도로 전달합니다. 여기에는 수많은 이점이 있습니다.

문자열 연결로 생성했을 때보다 쿼리가 더 읽기 쉽습니다.
코드가 더욱 강력해지고 산업화되었습니다.
SQL 주입 공격에 대한 탁월한 보호 기능입니다(필수 XKCD).

Python 스크립트에서 쿼리 매개변수를 전달하는 방법은 언뜻 보기에 간단해 보입니다. 예를 들어:

from google.cloud.bigquery import (
    Client,
    ScalarQueryParameter,
    ArrayQueryParameter,
    StructQueryParameter,
    QueryJobConfig,
)

client=Client()

client.query("
INSERT INTO mydataset.mytable(columnA, columnB)
    VALUES (@valueA, @valueB)
", job_config=QueryJobConfig(
    query_parameters=[
        ScalarQueryParameter("valueA","STRING","A"), 
        ScalarQueryParameter("valueB","STRING","B")
])

위 예에서는 열 A와 B에 간단한("스칼라") 값을 삽입합니다. 그러나 더 복잡한 매개변수를 전달할 수도 있습니다.

배열(ArrayQueryParameter)
구조체(StructQueryParameter)

구조체 배열을 삽입하려고 할 때 문제가 발생합니다. 문제가 많고 문서가 거의 없으며 웹 주제에 대한 리소스가 거의 없습니다. 이 글의 목표는 이러한 격차를 메우는 것입니다.

매개변수화된 쿼리를 사용하여 BigQuery에서 구조체 배열을 유지하는 방법

대상 테이블에 저장하려는 다음 개체를 정의해 보겠습니다.

from dataclasses import dataclass

@dataclass
class Country:
    name: str
    capital_city: str

@dataclass
class Continent:
    name: str
    countries: list[Country]

이 매개변수화된 쿼리를 호출하여

query = UPDATE continents SET countries=@countries WHERE name="Oceania"

얕은 문서를 따르는 첫 번째 시도는 다음과 같습니다.

client.query(query, 
    job_config=QueryJobConfig(query_parameters=[
        ArrayQueryParameter("countries", "RECORD", [
             {name="New Zealand", capital_city="Wellington"},
             {name="Fiji", capital_city="Suva"} ...]
]))

비참하게 실패할 것입니다

속성 오류: 'dict' 개체에 'to_api_repr' 속성이 없습니다.

문제 1번: ArrayQueryParameter의 값은 StructQueryParameter의 인스턴스여야 합니다.

생성자의 세 번째 인수인 값은 원하는 값이 아니라 StructQueryParameter 인스턴스의 컬렉션이어야 합니다. 그럼 빌드해 봅시다:

client.query(query, 
job_config=QueryJobConfig(query_parameters=[
    ArrayQueryParameter("countries", "RECORD", [
    StructQueryParameter("countries",
        ScalarQueryParameter("name", "STRING", ct.name), 
        ScalarQueryParameter("capital_city", "STRING", ct.capital_city)
    )
    for ct in countries])
]))

이번에는 작동합니다... 빈 배열을 설정하려고 할 때까지

client.query(query, 
    job_config=QueryJobConfig(
    query_parameters=[
        ArrayQueryParameter("countries", "RECORD", [])
]))

ValueError: 빈 배열에 대한 자세한 구조체 항목 유형 정보가 누락되었습니다. StructQueryParameterType 인스턴스를 제공하세요.

문제 2번: 전체 구조 유형을 두 번째 인수로 제공하세요.

오류 메시지는 매우 명확합니다. 'RECORD'만으로는 BigQuery가 빈 배열로 무엇을 해야 할지 알 수 없습니다. 완전히 상세한 구조가 필요합니다. 그렇게 하세요

client.query(query, job_config=QueryJobConfig(query_parameters=[
    ArrayQueryParameter("countries",
        StructQueryParameterType(
            ScalarQueryParameterType("STRING","name"),
            ScalarQueryParameterType("STRING","capital_city")
        ), [])
]))

(...ParameterType 생성자의 인수 순서가 ...Parameter 생성자의 반대 순서인지 확인하세요. 또 다른 함정일 뿐입니다...)

이제 빈 배열에서도 작동합니다. 앗!

알고 있어야 할 마지막 사항: StructQueryParameterType의 모든 하위 필드에는 이름이 있어야 합니다. 두 번째 매개변수(이름)가 생성자에서 선택사항인 경우에도 마찬가지입니다. 실제로 하위 필드에는 필수입니다. 그렇지 않으면 새로운 종류의 오류가 발생합니다

빈 구조체 필드 이름

쿼리 매개변수에서 레코드 배열의 사용법을 완료하기 위해 알아야 할 전부라고 생각합니다. 이것이 도움이 되기를 바랍니다!

읽어주셔서 감사합니다! 저는 Stack Labs의 데이터 엔지니어 Matthieu입니다.
Stack Labs 데이터 플랫폼을 알아보고 싶거나 열정적인 데이터 엔지니어링 팀에 합류하고 싶다면 저희에게 연락주세요.

Denys Nevozhai sur Unsplash의 사진

릴리스 선언문 이 기사는 https://dev.to/stack-labs/how-to-pass-an-array-of-structs-in-bigquerys-parameterized-queries-39nm?1에서 복제됩니다. 침해가 있는 경우, 문의: Study_golang@163 .comdelete

최신 튜토리얼 더>

Firefox Back 버튼을 사용할 때 JavaScript 실행이 중단되는 이유는 무엇입니까?
원인 및 솔루션 : 이 동작은 브라우저 캐싱 자바 스크립트 리소스에 의해 발생합니다. 이 문제를 해결하고 후속 페이지 방문에서 스크립트가 실행되도록하기 위해 Firefox 사용자는 Window.onload 이벤트에서 호출되도록 빈 기능을 설정해야합니다. ...

프로그램 작성 2025-03-10에 게시되었습니다
익명의 JavaScript 이벤트 처리기를 깨끗하게 제거하는 방법은 무엇입니까?
익명 이벤트 리스너를 제거하는 데 익명의 이벤트 리스너 추가 요소를 추가하면 유연성과 단순성을 제공하지만 유연성과 단순성을 제공하지만 제거 할 시간이되면 요소 자체를 교체하지 않고 도전 할 수 있습니다. 요소? element.addeventListene...

프로그램 작성 2025-03-10에 게시되었습니다
MySQL 오류 #1089 : 잘못된 접두사 키를 얻는 이유는 무엇입니까?
오류 설명 [#1089- 잘못된 접두사 키 "는 테이블에서 열에 프리픽스 키를 만들려고 시도 할 때 나타날 수 있습니다. 접두사 키는 특정 접두사 길이의 문자열 열 길이를 색인화하도록 설계되었으며, 접두사를 더 빠르게 검색 할 수 있습니...

프로그램 작성 2025-03-10에 게시되었습니다
PHP 배열 키-값 이상 : 07 및 08의 호기심 사례 이해
이 문제는 PHP의 주요 제로 해석에서 비롯됩니다. 숫자가 0 (예 : 07 또는 08)으로 접두사를 넣으면 PHP는 소수점 값이 아닌 옥탈 값 (기본 8)으로 해석합니다. 설명 : echo 07; // 인쇄 7 (10 월 07 = 10 진수 7) ...

프로그램 작성 2025-03-10에 게시되었습니다
$PHP \의 기능 재정의 제한을 극복하는 방법은 무엇입니까?$
PHP \의 기능 재정의 제한을 극복하는 방법은 무엇입니까?
return $ a * $ b; } 그러나 PHP 도구 벨트에는 숨겨진 보석이 있습니다. runkit_function_rename () runkit_function_rename ( 'this', 'that'); run...

프로그램 작성 2025-03-10에 게시되었습니다
전체 HTML 문서에서 특정 요소 유형의 첫 번째 인스턴스를 어떻게 스타일링하려면 어떻게해야합니까?
javascript 솔루션 < /h2> : 최초의 유형 문서 전체를 달성합니다 유형의 첫 번째 요소와 일치하는 JavaScript 솔루션이 필요합니다. 문서에서 첫 번째 일치 요소를 선택하고 사용자 정의를 적용 할 수 있습니다. 그런 ...

프로그램 작성 2025-03-10에 게시되었습니다
SQLALCHEMY 필터 조항에서 'Flake8'플래킹 부울 비교가 된 이유는 무엇입니까?
데이터베이스 테이블의 부울 필드 (Obsoleted)는 비 초소형 테스트 사례의 수를 결정하는 데 사용됩니다. 이 코드는 필터 절에서 테스트 케이스를 사용합니다. casenum = session.query (testcase) .filter (testcas...

프로그램 작성 2025-03-10에 게시되었습니다
PHP를 사용하여 XML 파일에서 속성 값을 효율적으로 검색하려면 어떻게해야합니까?
옵션> 1 varnum "varnum"을 복원 할 수 있습니다. stumped. 이 기능은 XML 요소의 속성에 대한 액세스를 연관 배열로 제공합니다. $ xml = simplexml_load_file ($ file);...

프로그램 작성 2025-03-10에 게시되었습니다
교체 지시문을 사용하여 GO MOD에서 모듈 경로 불일치를 해결하는 방법은 무엇입니까?
[ github.com/coreos/coreos/client github.com/coreos/etcd/client.test imports github.com/coreos/etcd/integration에 의해 테스트 된 Echoed 메시지에 의해 입증 된 바와...

프로그램 작성 2025-03-10에 게시되었습니다
동적 인 크기의 부모 요소 내에서 요소의 스크롤 범위를 제한하는 방법은 무엇입니까?
문제 : 고정 된 사이드 바로 조정을 유지하면서 사용자의 수직 스크롤과 함께 이동하는 스크롤 가능한 맵 디브가있는 레이아웃을 고려합니다. 그러나 맵의 스크롤은 뷰포트의 높이를 초과하여 사용자가 페이지 바닥 글에 액세스하는 것을 방지합니다. ...

프로그램 작성 2025-03-10에 게시되었습니다
$\ "일반 오류 : 2006 MySQL Server가 사라졌습니다 \"데이터를 삽입 할 때?$
\ "일반 오류 : 2006 MySQL Server가 사라졌습니다 \"데이터를 삽입 할 때?
를 해결하는 방법 "일반 오류 : 2006 MySQL Server가 사라졌습니다. 이 오류는 일반적으로 MySQL 구성의 두 변수 중 하나로 인해 서버에 대한 연결이 손실 될 때 발생합니다. 솔루션 : 이 오류를 해결하기위한 키는 Wait_Ti...

프로그램 작성 2025-03-10에 게시되었습니다
McRypt에서 OpenSSL로 암호화를 마이그레이션하고 OpenSSL을 사용하여 McRypt 암호화 데이터를 해제 할 수 있습니까?
질문 : McRypt에서 OpenSSL로 내 암호화 라이브러리를 업그레이드 할 수 있습니까? 그렇다면 어떻게? 대답 : 대답 : 예, McRypt에서 암호화 라이브러리를 OpenSSL로 업그레이드 할 수 있습니다. OpenSSL을 사용하여 McRyp...

프로그램 작성 2025-03-10에 게시되었습니다
유효한 코드에도 불구하고 PHP의 입력을 캡처하는 사후 요청이없는 이유는 무엇입니까?
post request 오작동 주소 php action='' var_dump를 사용하여 양식 제출 후 $ _post 배열의 내용을 확인합니다. action="<?php echo $_SERVER['PHP_SELF'];?>&...

프로그램 작성 2025-03-10에 게시되었습니다
MySQL에서 데이터를 피벗하여 그룹을 어떻게 사용할 수 있습니까?
select d.data_timestamp, sum (data_id = 1 that data_value else 0 End), 'input_1'로 0 End), sum (data_id = 2 an Els.] d.data_timestamp ...

프로그램 작성 2025-03-10에 게시되었습니다
JavaScript 객체에서 키를 동적으로 설정하는 방법은 무엇입니까?
jsobj = 'example'1; jsObj['key' i] = 'example' 1; 배열은 특수한 유형의 객체입니다. 그것들은 숫자 특성 (인치) + 1의 수를 반영하는 길이 속성을 유지합니다. 이 특별한 동작은 표준 객체에...

프로그램 작성 2025-03-10에 게시되었습니다