"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > Magic and Muscles: 매직을 사용한 ETL 및 파워리프팅 훈련 데이터를 사용한 DuckDB

Magic and Muscles: 매직을 사용한 ETL 및 파워리프팅 훈련 데이터를 사용한 DuckDB

2024-08-01에 게시됨
검색:194

여기에서 전체 파이프라인에 액세스할 수 있습니다.

마술사

지난 게시물에서 저는 파워리프팅 훈련 데이터를 시각화하기 위해 Python과 Looker Studio를 사용하여 구축한 대시보드에 대해 썼습니다. 이 게시물에서는 동일한 데이터세트를 사용하여 ETL(추출, 변환, 로드) 파이프라인을 단계별로 안내해 드리겠습니다.

파이프라인을 구축하기 위해 Mage를 사용하여 파이프라인을 조정하고 데이터 변환 및 로드를 위한 Python을 사용합니다. 마지막 단계로 변환된 데이터를 DuckDB 데이터베이스로 내보냅니다.

Mage를 실행하기 위해 공식 도커 이미지를 사용합니다:

docker pull mageai/mageai:latest

파이프라인은 다음과 같습니다.

Image description

발췌

추출은 간단합니다. csv 파일을 읽고 이를 사용하여 pandas 데이터 프레임을 생성하면 다음 단계를 진행할 수 있습니다. 데이터 로더 블록을 사용하면 이미 작업할 템플릿이 있으므로 read_csv() 함수에 "sep" 매개변수를 설정하는 것만 기억하면 데이터가 올바르게 로드됩니다.

from mage_ai.io.file import FileIO
import pandas as pd

if 'data_loader' not in globals():

    from mage_ai.data_preparation.decorators import data_loader

if 'test' not in globals():

    from mage_ai.data_preparation.decorators import test

@data_loader
def load_data_from_file(*args, **kwargs):

    filepath = 'default_repo/data_strong.csv'
    df = pd.read_csv(filepath, sep=';')  

    return df

@test
def test_output(output, *args) -> None:
    assert output is not None, 'The output is undefined'`

변환

이 단계에서는 선택할 수 있는 템플릿이 많은 Transformer 블록을 사용하여 사용자 정의 템플릿을 선택하겠습니다.

우리가 해야 할 변환은 기본적으로 운동 이름 열의 매핑이므로 특정 운동에 해당하는 신체 부위를 식별할 수 있습니다.

import pandas as pd

if 'transformer' not in globals():

    from mage_ai.data_preparation.decorators import transformer

if 'test' not in globals():

    from mage_ai.data_preparation.decorators import test

body_part = {'Squat (Barbell)': 'Pernas',

    'Bench Press (Barbell)': 'Peitoral',

    'Deadlift (Barbell)': 'Costas',

    'Triceps Pushdown (Cable - Straight Bar)': 'Bracos',

    'Bent Over Row (Barbell)': 'Costas',

    'Leg Press': 'Pernas',

    'Overhead Press (Barbell)': 'Ombros',

    'Romanian Deadlift (Barbell)': 'Costas',

    'Lat Pulldown (Machine)': 'Costas',

    'Bench Press (Dumbbell)': 'Peitoral',

    'Skullcrusher (Dumbbell)': 'Bracos',

    'Lying Leg Curl (Machine)': 'Pernas',

    'Hammer Curl (Dumbbell)': 'Bracos',

    'Overhead Press (Dumbbell)': 'Ombros',

    'Lateral Raise (Dumbbell)': 'Ombros',

    'Chest Press (Machine)': 'Peitoral',

    'Incline Bench Press (Barbell)': 'Peitoral',

    'Hip Thrust (Barbell)': 'Pernas',

    'Agachamento Pausado ': 'Pernas',

    'Larsen Press': 'Peitoral',

    'Triceps Dip': 'Bracos',

    'Farmers March ': 'Abdomen',

    'Lat Pulldown (Cable)': 'Costas',

    'Face Pull (Cable)': 'Ombros',

    'Stiff Leg Deadlift (Barbell)': 'Pernas',

    'Bulgarian Split Squat': 'Pernas',

    'Front Squat (Barbell)': 'Pernas',

    'Incline Bench Press (Dumbbell)': 'Peitoral',

    'Reverse Fly (Dumbbell)': 'Ombros',

    'Push Press': 'Ombros',

    'Good Morning (Barbell)': 'Costas',

    'Leg Extension (Machine)': 'Pernas',

    'Standing Calf Raise (Smith Machine)': 'Pernas',

    'Skullcrusher (Barbell)': 'Bracos',

    'Strict Military Press (Barbell)': 'Ombros',

    'Seated Leg Curl (Machine)': 'Pernas',

    'Bench Press - Close Grip (Barbell)': 'Peitoral',

    'Hip Adductor (Machine)': 'Pernas',

    'Deficit Deadlift (Barbell)': 'Pernas',

    'Sumo Deadlift (Barbell)': 'Costas',

    'Box Squat (Barbell)': 'Pernas',

    'Seated Row (Cable)': 'Costas',

    'Bicep Curl (Dumbbell)': 'Bracos',

    'Spotto Press': 'Peitoral',

    'Incline Chest Fly (Dumbbell)': 'Peitoral',

    'Incline Row (Dumbbell)': 'Costas'}


@transformer
def transform(data, *args, **kwargs):
    strong_data = data[['Date', 'Workout Name', 'Exercise Name', 'Weight', 'Reps',    'Workout Duration']]
    strong_data['Body part'] = strong_data['Exercise Name'].map(body_part)

    return strong_data

@test
def test_output(output, *args) -> None:
    assert output is not None, 'The output is undefined'

Mage의 흥미로운 기능은 차트 추가를 사용하여 Transformer 블록 내에서 수행 중인 변경 사항을 시각화할 수 있다는 것입니다. 또한 본문 부분 열을 사용하여 원형 그래프를 생성할 수 있습니다.

Image description

이제 데이터를 DuckDB에 로드할 시간입니다. Docker 이미지에는 이미 DuckDB가 있으므로 파이프라인에 다른 블록을 포함하기만 하면 됩니다. 테이블을 생성하고 데이터를 삽입할 수 있도록 SQL 템플릿과 함께 데이터 내보내기 블록을 포함하겠습니다.

CREATE OR REPLACE TABLE powerlifting 
(
    _date DATE,
    workout_name STRING,
    exercise_name STRING,
    weight STRING,
    reps STRING,
    workout_duration STRING,
    body_part STRING
);

INSERT INTO powerlifting SELECT * FROM {{ df_1 }};

결론

Mage는 파이프라인을 조정하고 ETL과 관련된 특정 작업을 개발하기 위한 완전한 템플릿 세트를 제공하는 강력한 도구입니다. 이 게시물에서는 Mage를 사용하여 데이터 파이프라인을 구축하는 방법에 대해 간략하게 설명했습니다. 향후 게시물에서 우리는 이 놀라운 프레임워크에 대해 더 자세히 알아볼 것입니다.

릴리스 선언문 이 기사는 https://dev.to/deadpunnk/magic-and-muscles-etl-with-magic-and-duckdb-with-data-from-my-powerlifting-training-2ocj?1에서 재현됩니다. 침해, 삭제하려면 [email protected]으로 문의하세요.
최신 튜토리얼 더>
  • Python만 사용하여 프런트엔드 구축
    Python만 사용하여 프런트엔드 구축
    프런트엔드 개발은 백엔드에 초점을 맞춘 개발자에게 벅차고 심지어 악몽 같은 작업이 될 수 있습니다. 내 경력 초기에는 프런트엔드와 백엔드 사이의 경계가 모호했고 모두가 두 가지를 모두 처리해야 했습니다. 특히 CSS는 끊임없는 투쟁이었습니다. 불가능한 임무처럼 느껴졌습...
    프로그램 작성 2024-11-05에 게시됨
  • Laravel에서 Cron 작업을 실행하는 방법
    Laravel에서 Cron 작업을 실행하는 방법
    이 튜토리얼에서는 Laravel에서 크론 작업을 실행하는 방법을 보여드리겠습니다. 무엇보다도 학생들을 위해 간단하고 쉽게 작업을 수행할 수 있습니다. Laravel 앱을 구축하는 동안 여러분의 컴퓨터에서 바로 이러한 자동화된 작업을 설정하고 실행하는 방법을 살펴보겠습니...
    프로그램 작성 2024-11-05에 게시됨
  • 패딩은 인라인 요소의 간격에 어떤 영향을 미치며 충돌을 어떻게 해결할 수 있습니까?
    패딩은 인라인 요소의 간격에 어떤 영향을 미치며 충돌을 어떻게 해결할 수 있습니까?
    인라인 요소의 패딩: 효과 및 제한소스에 따르면 인라인 요소의 상단과 하단에 패딩을 추가해도 영향을 미치지 않습니다. 주변 요소의 간격. 그러나 "패딩은 다른 인라인 요소와 겹칩니다"라는 설명은 패딩이 영향을 미치는 특정 상황이 있을 수 있음을 나타냅...
    프로그램 작성 2024-11-05에 게시됨
  • Django 클래스 기반 뷰가 쉬워졌습니다.
    Django 클래스 기반 뷰가 쉬워졌습니다.
    우리 모두 알고 있듯이 django는 웹 애플리케이션 개발 디자인에 MVT(모델-뷰-템플릿)를 사용합니다. 뷰 자체는 요청을 받고 응답을 반환하는 호출 가능 항목입니다. Django는 클래스 기반 뷰라는 것을 제공하므로 개발자는 클래스 기반 접근 방식을 사용하거나 O...
    프로그램 작성 2024-11-05에 게시됨
  • VAKX로 노코드 AI 에이전트 구축
    VAKX로 노코드 AI 에이전트 구축
    If you’ve been keeping up with the AI space, you already know that AI agents are becoming a game-changer in the world of automation and customer inter...
    프로그램 작성 2024-11-05에 게시됨
  • jQuery Datatable에서 커서 기반 페이지 매김을 구현하는 방법은 다음과 같습니다.
    jQuery Datatable에서 커서 기반 페이지 매김을 구현하는 방법은 다음과 같습니다.
    웹 애플리케이션에서 대규모 데이터세트로 작업할 때 페이지 매김은 성능과 사용자 경험에 매우 중요합니다. 데이터 테이블에 일반적으로 사용되는 표준 오프셋 기반 페이지 매김은 대규모 데이터 세트에는 비효율적일 수 있습니다. 커서 기반 페이지 매김은 특히 실시간 업데이트나...
    프로그램 작성 2024-11-05에 게시됨
  • 동기화 엔진이 웹 애플리케이션의 미래가 될 수 있는 이유
    동기화 엔진이 웹 애플리케이션의 미래가 될 수 있는 이유
    진화하는 웹 애플리케이션 세계에서는 효율성, 확장성, 원활한 실시간 경험이 무엇보다 중요합니다. 전통적인 웹 아키텍처는 응답성 및 동기화에 대한 현대적인 요구로 인해 어려움을 겪을 수 있는 클라이언트-서버 모델에 크게 의존합니다. 이것이 동기화 엔진이 등장하여 오늘날 ...
    프로그램 작성 2024-11-05에 게시됨
  • Python을 사용한 컴퓨터 비전 소개(1부)
    Python을 사용한 컴퓨터 비전 소개(1부)
    참고: 이 게시물에서는 쉽게 따라할 수 있도록 회색조 이미지만 사용합니다. 이미지란 무엇입니까? 이미지는 값의 행렬로 생각할 수 있으며, 각 값은 픽셀의 강도를 나타냅니다. 이미지 형식에는 세 가지 주요 유형이 있습니다. 이진: 이 형식의 이미지는 값이 ...
    프로그램 작성 2024-11-05에 게시됨
  • 웹사이트용 HTML 코드
    웹사이트용 HTML 코드
    항공 관련 웹사이트를 구축하려고 노력해왔습니다. 저는 AI를 사용하여 코드를 생성하는 전체 웹사이트를 생성할 수 있는지 확인하고 싶었습니다. HTML 웹사이트가 블로그와 호환됩니까, 아니면 자바스크립트를 사용해야 합니까? 데모로 사용한 코드는 다음과 같습니다. <...
    프로그램 작성 2024-11-05에 게시됨
  • 프로그래머처럼 생각하기: Java의 기본 사항 배우기
    프로그래머처럼 생각하기: Java의 기본 사항 배우기
    이 글에서는 자바 프로그래밍의 기본 개념과 구조를 소개합니다. 변수와 데이터 유형에 대한 소개로 시작한 다음 연산자와 표현식은 물론 제어 흐름 프로세스에 대해 논의합니다. 둘째, 메서드와 클래스를 설명하고 입력 및 출력 작업을 소개합니다. 마지막으로 이 기사에서는 급여...
    프로그램 작성 2024-11-05에 게시됨
  • PHP GD는 두 이미지의 유사성을 비교할 수 있나요?
    PHP GD는 두 이미지의 유사성을 비교할 수 있나요?
    PHP GD가 두 이미지의 유사성을 결정할 수 있습니까?고려 중인 질문은 두 이미지가 동일한지 확인하는 것이 가능한지 묻습니다. 차이점을 비교하여 PHP GD. 이는 두 이미지 간의 차이를 획득하고 그것이 완전히 흰색(또는 균일한 색상)으로 구성되어 있는지 결정하는 것...
    프로그램 작성 2024-11-05에 게시됨
  • 이 키를 사용하여 고급 수준 테스트 작성(JavaScript의 Test Desiderata)
    이 키를 사용하여 고급 수준 테스트 작성(JavaScript의 Test Desiderata)
    이 글에서는 모든 고위 개발자가 알아야 할 12가지 테스트 모범 사례를 배우게 됩니다. Kent Beck의 기사 "Test Desiderata"에 대한 실제 JavaScript 예제를 볼 수 있습니다. 그의 기사는 Ruby에 있기 때문입니다. 이러한 ...
    프로그램 작성 2024-11-05에 게시됨
  • matlab/octave 알고리즘을 C로 포팅하여 AEC에 대한 최상의 솔루션
    matlab/octave 알고리즘을 C로 포팅하여 AEC에 대한 최상의 솔루션
    완료! 나 자신에게 조금 감동받았습니다. 저희 제품에는 에코 제거 기능이 필요하며 세 가지 가능한 기술 솔루션이 확인되었습니다. 1) MCU를 사용하여 오디오 신호의 오디오 출력과 오디오를 감지하고 두 개의 선택적 채널 전환 사이의 오디오 출력과 오디오 입력의 강도에...
    프로그램 작성 2024-11-05에 게시됨
  • 단계별 웹 페이지 구축: HTML의 구조 및 요소 탐색
    단계별 웹 페이지 구축: HTML의 구조 및 요소 탐색
    ? 오늘은 내 소프트웨어 개발 여정의 중요한 단계입니다! ? 나는 첫 번째 코드 줄을 작성하여 HTML의 필수 요소를 살펴보았습니다. 해당 요소와 태그가 포함되어 있습니다. 어제는 웹사이트를 구성하는 복싱 기술을 탐구했고, 오늘은 머리글, 바닥글, 콘텐츠 영역과 같은 ...
    프로그램 작성 2024-11-05에 게시됨
  • 프로젝트 아이디어가 독특할 필요는 없습니다. 그 이유는 다음과 같습니다.
    프로젝트 아이디어가 독특할 필요는 없습니다. 그 이유는 다음과 같습니다.
    혁신의 세계에서는 프로젝트 아이디어가 가치를 가지려면 획기적이거나 완전히 독특해야 한다는 일반적인 오해가 있습니다. 그러나 그것은 사실과 거리가 멀다. 오늘날 우리가 사용하는 많은 성공적인 제품은 경쟁사와 핵심 기능 세트를 공유합니다. 이들을 차별화하는 것은 반드시 아...
    프로그램 작성 2024-11-05에 게시됨

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3