MySQL에 간단한 더미 데이터를 대규모로 주입하는 방법

첫 장 > 프로그램 작성 > MySQL에 간단한 더미 데이터를 대규모로 주입하는 방법

MySQL에 간단한 더미 데이터를 대규모로 주입하는 방법

2024-08-01에 게시됨

검색:383

How to inject simple dummy data at a large scale in MySQL

소개

테스트를 위해 많은 양의 더미 데이터가 필요하지만 스크립트를 작성하거나 수동으로 레코드를 삽입하는 데 시간을 보내고 싶지 않은 상황에 처한 적이 있습니까? 아니면 MySQL 8.0의 새로운 기능을 활용하여 데이터베이스 작업을 간소화하는 방법이 궁금하신가요? 글쎄, 당신은 치료를 받고 있습니다! 이 게시물에서는 공통 테이블 표현식(CTE)을 사용하여 방대한 양의 더미 데이터를 손쉽게 생성하고 MySQL 데이터베이스에 삽입하는 방법을 살펴보겠습니다.

부하 테스트나 성능 벤치마킹을 위해 백만 개의 해시 값으로 테이블을 채워야 한다고 상상해 보세요. 악몽 같죠? 더 이상은 아닙니다! MySQL 8.0에서 CTE의 출현으로 이를 몇 초 만에 달성할 수 있습니다. 이것이 어떻게 작동하는지, 그리고 이 강력한 기능을 사용하여 데이터 생성 요구 사항을 단순화하는 방법을 살펴보겠습니다.

TL; DR

MySQL 8.0에 추가된 새로운 기능인 CTE(Common Table Expressions)를 사용하면 대량의 단순 더미 데이터를 쉽게 입력할 수 있습니다. 예를 들어, 해시 값을 저장하는 해시라는 테이블에 100만 개의 더미 데이터를 입력하려는 경우 다음 단계를 통해 이를 달성할 수 있습니다.

테이블 정의

먼저 테이블을 만듭니다.

CREATE TABLE hashes (
  id INT PRIMARY KEY AUTO_INCREMENT,
  hash CHAR(64)
);

쿼리 실행

더 높은 재귀 깊이를 허용하도록 세션 변수를 설정합니다.

SET SESSION cte_max_recursion_depth = 1000000;

그런 다음 CTE를 실행하여 100만 개의 행을 삽입합니다.

INSERT INTO hashes(hash)
WITH RECURSIVE cte (n) AS
(
  SELECT 1
  UNION ALL
  SELECT n   1 FROM cte WHERE n 



이 방법은 재귀 공통 테이블 표현식을 활용하여 더미 데이터를 생성합니다.


  
  
  CTE 이해


공통 테이블 표현식(CTE)은 단일 문 내에서 여러 번 참조할 수 있는 명명된 임시 결과 집합입니다. CTE는 복잡한 쿼리를 단순화하고 가독성을 높이는 데 특히 유용합니다.


  
  
  구문 분석



  
  
  재귀 깊이 설정




SET SESSION cte_max_recursion_depth = 1000000;




cte_max_recursion_length 시스템 변수는 재귀의 상한을 설정합니다. 기본적으로는 1000이므로 더 많이 재귀하려면 조정이 필요합니다. 여기서는 1백만으로 설정했습니다.


  
  
  CTE 쿼리




INSERT INTO hashes(hash)
WITH RECURSIVE cte (n) AS
(
  SELECT 1
  UNION ALL
  SELECT n   1 FROM cte WHERE n 



이 쿼리를 분석해 보겠습니다.

WITH RECURSIVE cte (n): CTE 정의를 시작합니다. cte는 임시 결과 집합의 이름이고 n은 열입니다.
SELECT 1: CTE의 비재귀 부분으로, 시작점(초기값) 역할을 합니다.
UNION ALL SELECT n 1 FROM cte WHERE n
SELECT SHA2(n, 256) FROM cte: 쿼리의 마지막 부분은 각 n 값의 SHA-256 해시를 선택하여 삽입할 더미 데이터를 생성합니다.

작동 방식

CTE는 1부터 1,000,000까지의 숫자를 반복적으로 생성합니다. 각 숫자에 대해 SHA-256 해시를 계산하여 해시 테이블에 삽입합니다. 이 접근 방식은 효율적이며 MySQL의 재귀 기능을 활용하여 대용량 데이터를 원활하게 처리합니다.

처리 속도

검증환경

이 기능의 영향을 이해하기 위해 저는 설정 및 설치의 번거로움을 피하기 위해 강력하고 임시적인 환경을 활용하는 Gitpod Enterprise 작업 공간을 사용했습니다. 설정을 간단히 살펴보면 다음과 같습니다.

머신: Gitpod Enterprise XXLarge 작업 공간
OS: Ubuntu 22.04.4 LTS(Jammy Jellyfish)
컨테이너화: Docker 버전 26.0.1
MySQL 버전: 공식 MySQL 8.0 Docker 이미지

결과

100만 행의 경우 쿼리 실행 시간은 약 4.46초입니다.

mysql> INSERT INTO hashes(hash)
    -> WITH RECURSIVE cte (n) AS
    -> (
    ->   SELECT 1
    ->   UNION ALL
    ->   SELECT n   1 FROM cte WHERE n  )
    -> SELECT SHA2(n, 256) FROM cte;
Query OK, 1000000 rows affected (4.43 sec)
Records: 1000000  Duplicates: 0  Warnings: 0

성능 지표

행 수	실행 시간
1,000	0.03초
10,000	0.07초
100,000	0.42초
1,000,000	4.43초
10,000,000	48.53초

결론

MySQL 8.0에서 CTE를 사용하면 대량의 더미 데이터를 신속하게 생성할 수 있게 되었습니다. 부하 테스트 및 성능 벤치마킹에 특히 유용합니다. 단 몇 줄의 코드만으로 쉽게 테이블을 채운 다음 프로젝트의 다른 중요한 부분으로 돌아갈 수 있습니다.

자신에게 가장 적합한 것이 무엇인지 알아보기 위해 주저하지 말고 다양한 데이터 생성 전략과 재귀 깊이를 시도해 보세요. 보안 및 로그 분석에 대한 더 많은 팁과 통찰력을 얻으려면 Twitter @Siddhant_K_code에서 저를 팔로우하고 이와 같은 자세한 최신 기술 콘텐츠에 대한 최신 소식을 받아보세요. 즐거운 코딩하세요!

릴리스 선언문 이 기사는 https://dev.to/siddhantkcode/how-to-inject-simple-dummy-data-at-a-large-scale-in-mysql-eci?1에서 복제됩니다. 침해가 있는 경우, 문의: Study_golang@163 .comdelete

최신 튜토리얼 더>

MySQL 데이터베이스 메소드는 동일한 인스턴스를 덤프 할 필요가 없습니다.
직접 배관 데이터 mysql 클라이언트의 출력을 직접 배관 할 수있는 메소드 : mysqldump --routines --triggers db_name | mysql new_db_name | mysql new_db_name 이 명령은 n...

프로그램 작성 2025-07-13에 게시되었습니다
Java는 여러 반환 유형을 허용합니까 : 일반적인 방법을 자세히 살펴보십시오.
public 목록 getResult (문자열 s); 여기서 foo는 사용자 정의 클래스입니다. 이 방법 선언은 두 가지 반환 유형을 자랑하는 것처럼 보입니다. 목록과 E. 그러나 이것이 사실인가? 일반 방법 : 미스터리 메소드는 단일...

프로그램 작성 2025-07-13에 게시되었습니다
유효한 코드에도 불구하고 PHP의 입력을 캡처하는 사후 요청이없는 이유는 무엇입니까?
post request 오작동 주소 php action='' action = "

프로그램 작성 2025-07-13에 게시되었습니다
McRypt에서 OpenSSL로 암호화를 마이그레이션하고 OpenSSL을 사용하여 McRypt 암호화 데이터를 해제 할 수 있습니까?
질문 : McRypt에서 OpenSSL로 내 암호화 라이브러리를 업그레이드 할 수 있습니까? 그렇다면 어떻게? 대답 : 대답 : 예, McRypt에서 암호화 라이브러리를 OpenSSL로 업그레이드 할 수 있습니다. OpenSSL을 사용하여 McRyp...

프로그램 작성 2025-07-13에 게시되었습니다
열의 열이 다른 데이터베이스 테이블을 어떻게 통합하려면 어떻게해야합니까?
다른 열이있는 결합 테이블 ] 는 데이터베이스 테이블을 다른 열로 병합하려고 할 때 도전에 직면 할 수 있습니다. 간단한 방법은 열이 적은 테이블의 누락 된 열에 null 값을 추가하는 것입니다. 예를 들어, 표 B보다 더 많은 열이있는 두 개의 테이블,...

프로그램 작성 2025-07-13에 게시되었습니다
PHP를 사용하여 XML 파일에서 속성 값을 효율적으로 검색하려면 어떻게해야합니까?
옵션> 1 varnum "varnum"을 복원 할 수 있습니다. stumped. 이 기능은 XML 요소의 속성에 대한 액세스를 연관 배열로 제공합니다. $ xml = simplexml_load_file ($ file);...

프로그램 작성 2025-07-13에 게시되었습니다
전체 HTML 문서에서 특정 요소 유형의 첫 번째 인스턴스를 어떻게 스타일링하려면 어떻게해야합니까?
javascript 솔루션 < /h2> : 최초의 유형 문서 전체를 달성합니다 유형의 첫 번째 요소와 일치하는 JavaScript 솔루션이 필요합니다. 문서에서 첫 번째 일치 요소를 선택하고 사용자 정의를 적용 할 수 있습니다. 그런 ...

프로그램 작성 2025-07-13에 게시되었습니다
익명의 JavaScript 이벤트 처리기를 깨끗하게 제거하는 방법은 무엇입니까?
익명 이벤트 리스너를 제거하는 데 익명의 이벤트 리스너 추가 요소를 추가하면 유연성과 단순성을 제공하지만 유연성과 단순성을 제공하지만 제거 할 시간이되면 요소 자체를 교체하지 않고 도전 할 수 있습니다. 요소? element.addeventListene...

프로그램 작성 2025-07-13에 게시되었습니다
$\ "(1) 대 (;;) : 컴파일러 최적화는 성능 차이를 제거합니까? \"$
\ "(1) 대 (;;) : 컴파일러 최적화는 성능 차이를 제거합니까? \"
대답 : 대부분의 최신 컴파일러에는 (1)과 (;;). 컴파일러 : s-> 7 8 v-> 4를 풀립니다 -e syntax ok gcc : GCC에서 두 루프는 다음과 같이 동일한 어셈블리 코드로 컴파일합니다. . t_while : ...

프로그램 작성 2025-07-13에 게시되었습니다
팬더에서 연도와 1/4 열을 하나의주기적인 열로 병합하는 방법은 무엇입니까?
새로운 기간 열에 대한 열을 연결하는 열 문제 문 : 라는 열이있는 pandas dataframe을 고려하십시오 : 분기 2000 Q2 2001 Q3 목표는 다음과 같은 결과를 얻기 위해 "연도"...

프로그램 작성 2025-07-13에 게시되었습니다
Google API에서 최신 JQuery 라이브러리를 검색하는 방법은 무엇입니까?
https://code.jquery.com/jquery-latest.min.js (jQuery Hosted, Minified) https://code.jquery.com/jquery-latest.js (jquery hosted, Hosted, 비 압축) 압축...

프로그램 작성 2025-07-13에 게시되었습니다
동시에 비동기 작업을 동시에 실행하고 JavaScript에서 오류를 올바르게 처리하는 방법은 무엇입니까?
동시 동시 대기 업무 수행 실행 비동기 작업을 수행 할 때 문제가 발생합니다. getValue2async (); 이 구현은 다음 작업을 시작하기 전에 각 작업의 완료를 순차적으로 기다립니다. 동시 실행을 가능하게하려면 수정 된 접근 방식...

프로그램 작성 2025-07-13에 게시되었습니다
regex를 사용하여 PHP에서 괄호 안에서 텍스트를 추출하는 방법
$ fullstring = "이 (텍스트)을 제외한 모든 것을 무시하는 것"; $ start = strpos ( ', $ fullstring); $ fullString); $ shortstring = substr ($ fulls...

프로그램 작성 2025-07-13에 게시되었습니다
`JSON '패키지를 사용하여 이동하는 JSON 어레이를 구문 분석하는 방법은 무엇입니까?
JSON 어레이를 Parsing JSON 패키지 문제 : JSON 패키지를 사용하여 어레이를 나타내는 JSON 스트링을 어떻게 구문 분석 할 수 있습니까? 예 : type JsonType struct { Array []string ...

프로그램 작성 2025-07-13에 게시되었습니다
PHP를 사용하여 Blob (이미지)을 MySQL에 올바르게 삽입하는 방법은 무엇입니까?
문제 $ sql = "삽입 ImagesTore (imageId, image) 값 ( '$ this- & gt; image_id', 'file_get_contents ($ tmp_image)'; 결과적으로 실제 이...

프로그램 작성 2025-07-13에 게시되었습니다