Pandas에서 대용량 DataFrame을 효율적으로 처리하는 방법: 청크업! - 프로그램 작성 - luping.net

"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.

온라인 도구

소프트웨어 튜토리얼

사이트 탐색

프로그램 작성

첫 장 > 프로그램 작성 > Pandas에서 대용량 DataFrame을 효율적으로 처리하는 방법: 청크업!

Pandas에서 대용량 DataFrame을 효율적으로 처리하는 방법: 청크업!

2024-11-08에 게시됨

검색:760

How to Efficiently Process Large DataFrames in Pandas: Chunk It Up!

Pandas - 대용량 데이터 프레임을 청크로 분할

대용량 데이터 프레임을 처리하려고 할 때 흔히 발생하는 장애물은 무서운 메모리 오류입니다. 효과적인 솔루션 중 하나는 데이터프레임을 더 작고 관리 가능한 덩어리로 나누는 것입니다. 이 전략은 메모리 소비를 줄일 뿐만 아니라 효율적인 처리를 촉진합니다.

이를 달성하기 위해 목록 이해 또는 NumPy array_split 함수를 활용할 수 있습니다.

목록 이해

n = 200000  # Chunk row size
list_df = [df[i:i n] for i in range(0, df.shape[0], n)]

NumPy array_split

list_df = np.array_split(df, math.ceil(len(df) / n))

개별 청크를 검색할 수 있습니다. 사용:

list_df[0]
list_df[1]
...

청크를 단일 데이터프레임으로 재조립하려면 pd.concat:

# Example: Concatenating by chunks
rejoined_df = pd.concat(list_df)

AcctName별로 슬라이싱

AcctName 값으로 데이터 프레임을 분할하려면 다음과 같이 groupby 메서드를 사용합니다.

list_df = []

for n, g in df.groupby('AcctName'):
    list_df.append(g)

최신 튜토리얼 더>

PHP에서 콜백 함수에서 외부 계산 변수를 사용하는 방법은 무엇입니까?
배열 $ ARR이 있고 Array_Filter를 사용하여 $ ARR. 의 요소 평균보다 적은 값 만 포함하는 새 배열을 생성하고자합니다. 그러나 사용 키워드는 솔루션을 제공합니다. 사용 키워드 사용 키워드를 사용하면 익명 함수가 상위 스코프에서 변...

프로그램 작성 2025-04-16에 게시되었습니다
PYTZ가 처음에 예상치 못한 시간대 오프셋을 표시하는 이유는 무엇입니까?
import pytz pytz.timezone ( 'Asia/Hong_kong') std> discrepancy source 역사 전반에 걸쳐 변동합니다. PYTZ가 제공하는 기본 시간대 이름 및 오프...

프로그램 작성 2025-04-16에 게시되었습니다
$\ "일반 오류 : 2006 MySQL Server가 사라졌습니다 \"데이터를 삽입 할 때?$
\ "일반 오류 : 2006 MySQL Server가 사라졌습니다 \"데이터를 삽입 할 때?
를 해결하는 방법 "일반 오류 : 2006 MySQL Server가 사라졌습니다. 이 오류는 일반적으로 MySQL 구성의 두 변수 중 하나로 인해 서버에 대한 연결이 손실 될 때 발생합니다. 솔루션 : 이 오류를 해결하기위한 키는 Wait_Ti...

프로그램 작성 2025-04-16에 게시되었습니다
Fastapi Custom 404 페이지 제작 가이드
custom 404 fastapi 가없는 페이지를 찾을 수 없습니다. 적절한 방법은 특정 요구 사항에 따라 다릅니다. 404 상태 코드에서 리디렉션 response = await call_next(request) if response.sta...

프로그램 작성 2025-04-16에 게시되었습니다
.NET에서 조립 전환 및 어셈블리 파일 버전을 얻는 방법은 무엇입니까?
그러나 어셈블리 파일 버전을 얻으려면 다른 접근법이 필요합니다. system.reflection.Assembly Assembly = System.Reflection.assembly.getexecutingAssembly (); System.Diagnostics.F...

프로그램 작성 2025-04-16에 게시되었습니다
Homebrew에서 GO를 설정하면 명령 줄 실행 문제가 발생하는 이유는 무엇입니까?
발생하는 문제를 해결하려면 다음을 수행하십시오. 1. 필요한 디렉토리 만들기 mkdir $ home/go mkdir -p $ home/go/src/github.com/user 2. 환경 변수 구성

프로그램 작성 2025-04-16에 게시되었습니다
Ajax 포스트 요청에서 Django CSRF 확인이 실패하는 이유는 무엇입니까?
이 문제를 해결하기 위해 다음 단계를 고려하십시오. 토큰 및 CSRFTOKE라는 변수로 보관합니다. 이 토큰은 헤더를 설정하기 전에 참석해야합니다. var csrftoken = getCookie ( 'csrftoken'); XHR.SetRequestH...

프로그램 작성 2025-04-16에 게시되었습니다
MySQLI로 전환 한 후 Codeigniter가 MySQL 데이터베이스에 연결 해야하는 이유
문제를 디버깅하려면 파일 끝에 다음 코드를 추가하고 출력을 검토하는 것이 좋습니다. echo ''; print_r ($ db ); echo ''; echo '데이터베이스에 연결 :'. $ db ; $ dbh = mysq...

프로그램 작성 2025-04-16에 게시되었습니다
Java의 배열 및 목록 : 성능을 최적화하기 위해 어느 것을 선택해야합니까?
배열의 장점 배열의 장점은 메모리에 인접하게 데이터를 저장할 때의 잠재적 성능 이점을 제공하여 개별 요소에 액세스하는 것과 관련된 오버 헤드를 줄입니다. 배열 그러나 배열은 또한 한계가 있습니다 : 고정 크기 : 배열...

프로그램 작성 2025-04-16에 게시되었습니다
jQuery ajax 호출 데이터 오류를받지 만 PHP는 JSON을 반환했습니다.
php가 JSON Return php에서 JSON 데이터를 반환하는 방법을 보여줍니다. echo json_encode ([[ '반환'=> 1, 'msg1'=> '메시지가 보냈습니다. ]); 종료; 헤더...

프로그램 작성 2025-04-16에 게시되었습니다
HTML 서식 태그
HTML 서식 요소 **HTML Formatting is a process of formatting text for better look and feel. HTML provides us ability to format text without...

프로그램 작성 2025-04-16에 게시되었습니다
.NET 애플리케이션 스택 추적 메소드 예외 로깅이 없습니다
system.diagnostics.stacktrace 고맙게도 Diagnostics Namespace는 현재 스택 트레이스를 인쇄하기위한 솔루션을 제공합니다. system.diagnostics.stacktrace 클래스는 예외가없는 경우에도 ...

프로그램 작성 2025-04-16에 게시되었습니다
순수한 CS로 여러 끈적 끈적한 요소를 서로 쌓을 수 있습니까?
순수한 CSS에서 서로 위에 여러 개의 끈적 끈적 요소가 쌓일 수 있습니까? 원하는 동작을 볼 수 있습니다. 여기 : https://webthemez.com/demo/sticky-multi-header-scroll/index.html Java...

프로그램 작성 2025-04-16에 게시되었습니다
PHP를 사용하여 Blob (이미지)을 MySQL에 올바르게 삽입하는 방법은 무엇입니까?
문제 $ sql = "삽입 ImagesTore (imageId, image) 값 ( '$ this- & gt; image_id', 'file_get_contents ($ tmp_image)'; 결과적으로 실제 이...

프로그램 작성 2025-04-16에 게시되었습니다
PostgreSQL의 각 고유 식별자에 대한 마지막 행을 효율적으로 검색하는 방법은 무엇입니까?
postgresql : 각각의 고유 식별자에 대한 마지막 행을 추출하는 select distinct on (id) id, date, another_info from the_table order by id, date desc; id ...

프로그램 작성 2025-04-16에 게시되었습니다

분류 더>

일본어를 배우다 한국어를 배우다 중국어를 배우다 외국어를 배우다 게임 일반적인 문제 기술 주변기기 일체 포함 소프트웨어 튜토리얼 프로그램 작성 기사

중국어 공부

1 "걷다"를 중국어로 어떻게 말하나요? 走路 중국어 발음, 走路 중국어 학습
2 "비행기를 타다"를 중국어로 어떻게 말하나요? 坐飞机 중국어 발음, 坐飞机 중국어 학습
3 "기차를 타다"를 중국어로 어떻게 말하나요? 坐火车 중국어 발음, 坐火车 중국어 학습
4 "버스를 타다"를 중국어로 어떻게 말하나요? 坐车 중국어 발음, 坐车 중국어 학습
5 운전을 중국어로 어떻게 말하나요? 开车 중국어 발음, 开车 중국어 학습
6 수영을 중국어로 뭐라고 하나요? 游泳 중국어 발음, 游泳 중국어 학습
7 자전거를 타다 중국어로 뭐라고 하나요? 骑自行车 중국어 발음, 骑自行车 중국어 학습
8 중국어로 안녕하세요를 어떻게 말해요? 你好중국어 발음, 你好중국어 학습
9 감사합니다를 중국어로 어떻게 말하나요? 谢谢중국어 발음, 谢谢중국어 학습
10 How to say goodbye in Chinese? 再见Chinese pronunciation, 再见Chinese learning

도구 더>

이미지 base64 디코딩

중국어 병음

유니코드 인코딩

JS 난독화 암호화 압축

URL 16진수 암호화 도구

UTF-8 인코딩 변환 도구

온라인 Ascii 인코딩 및 디코딩 도구

MD5 암호화 도구

해시/해시 텍스트 온라인 암호화 및 암호 해독 도구

온라인 SHA 암호화

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3