부울 인덱싱을 사용하여 Pandas 데이터 개체를 효율적으로 필터링하는 방법은 무엇입니까?

첫 장 > 프로그램 작성 > 부울 인덱싱을 사용하여 Pandas 데이터 개체를 효율적으로 필터링하는 방법은 무엇입니까?

부울 인덱싱을 사용하여 Pandas 데이터 개체를 효율적으로 필터링하는 방법은 무엇입니까?

2024-11-01에 게시됨

검색:726

How to Efficiently Filter Pandas Data Objects Using Boolean Indexing?

부울 인덱싱을 사용하여 Pandas 데이터 프레임 및 시리즈를 효율적으로 필터링

데이터 분석 시나리오에서는 결과 범위를 좁히기 위해 여러 필터를 적용하는 것이 중요한 경우가 많습니다. 이 문서의 목표는 Pandas 데이터 개체에 대한 여러 비교 작업을 연결하는 효율적인 접근 방식을 다루는 것입니다.

도전

목표는 관계 연산자 사전을 처리하고 이를 특정 Pandas에 추가로 적용하는 것입니다. Series 또는 DataFrame으로 인해 필터링된 데이터 세트가 생성됩니다. 이 작업을 수행하려면 특히 대규모 데이터 세트를 처리할 때 불필요한 데이터 복사를 최소화해야 합니다.

해결책: 부울 인덱싱

Pandas는 부울 인덱싱을 사용하여 데이터를 필터링하는 매우 효율적인 메커니즘을 제공합니다. 부울 인덱싱에는 논리적 조건을 생성한 다음 이러한 조건을 사용하여 데이터를 인덱싱하는 작업이 포함됩니다. 다음 예를 고려하십시오.

df.loc[df['col1'] >= 1, 'col1']

이 코드 줄은 DataFrame df의 모든 행을 선택합니다. 'col1' 열의 값이 1보다 크거나 같습니다. 결과는 필터링된 값을 포함하는 새로운 Series 개체입니다.

여러 필터를 적용하려면 & (및) 및 | (또는). 예를 들면 다음과 같습니다.

df[(df['col1'] >= 1) & (df['col1'] <= 1)]

이 작업은 행을 필터링합니다. 'col1'은 1보다 크거나 같고 1보다 작거나 같습니다.

도우미 함수

여러 필터를 적용하는 프로세스를 단순화하기 위해 도우미 함수를 만들 수 있습니다.

def b(x, col, op, n): 
    return op(x[col], n)

def f(x, *b):
    return x[(np.logical_and(*b))]

b 함수는 주어진 열과 연산자에 대한 부울 조건을 생성하는 반면, f는 DataFrame 또는 Series에 여러 부울 조건을 적용합니다.

사용 예

이러한 기능을 사용하기 위해 필터 기준 사전을 제공할 수 있습니다.

filters = {'>=': [1], 'b1 = b(df, 'col1', ge, 1)
b2 = b(df, 'col1', le, 1)
filtered_df = f(df, b1, b2)
이 코드는 DataFrame df의 'col1' 열에 필터를 적용하고 필터링된 결과가 포함된 새 DataFrame을 반환합니다.
향상된 기능
Pandas 0.13에는 문자열 표현식을 사용하여 필터를 적용하는 편리한 방법을 제공하는 쿼리 메서드가 도입되었습니다. 유효한 열 식별자의 경우 다음 코드가 가능해집니다.
df.query('col1 이 줄은 우리와 동일한 필터링을 달성합니다. 이전 예에서는 보다 간결한 구문을 사용했습니다.
부울 인덱싱 및 도우미 함수를 활용하여 Pandas 데이터 프레임 및 시리즈에 여러 필터를 효율적으로 적용할 수 있습니다. 이 접근 방식은 특히 대규모 데이터 세트로 작업할 때 데이터 복사를 최소화하고 성능을 향상시킵니다.

릴리스 선언문 이 글은 1729395079에서 재인쇄되었습니다. 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다.

최신 튜토리얼 더>

동적 인 크기의 부모 요소 내에서 요소의 스크롤 범위를 제한하는 방법은 무엇입니까?
문제 : 고정 된 사이드 바로 조정을 유지하면서 사용자의 수직 스크롤과 함께 이동하는 스크롤 가능한 맵 디브가있는 레이아웃을 고려합니다. 그러나 맵의 스크롤은 뷰포트의 높이를 초과하여 사용자가 페이지 바닥 글에 액세스하는 것을 방지합니다. ...

프로그램 작성 2025-04-18에 게시되었습니다
installUtil.exe를 사용한 후 ADD/RESP 프로그램에 Windows 서비스가 나타나지 않는 이유는 무엇입니까?
installutil.exe가 프로그램 추가/제거하기위한 서비스를 추가하지 않는 이유 Wind installutil.exe 는 주로 생산 배포 솔루션이 아닌 개발자 도구이기 때문입니다. 올바른 방법 : MSI 설치 자 사용 적절한 서비스 배포...

프로그램 작성 2025-04-18에 게시되었습니다
열의 열이 다른 데이터베이스 테이블을 어떻게 통합하려면 어떻게해야합니까?
다른 열이있는 결합 테이블 ] 는 데이터베이스 테이블을 다른 열로 병합하려고 할 때 도전에 직면 할 수 있습니다. 간단한 방법은 열이 적은 테이블의 누락 된 열에 null 값을 추가하는 것입니다. 예를 들어, 표 B보다 더 많은 열이있는 두 개의 테이블,...

프로그램 작성 2025-04-18에 게시되었습니다
MySQL 오류 #1089 : 잘못된 접두사 키를 얻는 이유는 무엇입니까?
오류 설명 [#1089- 잘못된 접두사 키 "는 테이블에서 열에 프리픽스 키를 만들려고 시도 할 때 나타날 수 있습니다. 접두사 키는 특정 접두사 길이의 문자열 열 길이를 색인화하도록 설계되었으며, 접두사를 더 빠르게 검색 할 수 있습니...

프로그램 작성 2025-04-18에 게시되었습니다
SQL Server 쿼리가 일련 번호 위치를 사용하여 데이터를 선택할 수 있습니까?
서수 위치를 사용하여 데이터를 선택할 수 있습니까? SQL Server는 서수 위치를 사용하여 열 데이터를 선택하지 않습니다. 대신, 당신은 당신의 쿼리에 열 이름을 명시 적으로 지정해야합니다. Workaround : 칼럼 이름이 알려진지를 가진 테이블 ...

프로그램 작성 2025-04-18에 게시되었습니다
PHP를 사용하여 XML 파일에서 속성 값을 효율적으로 검색하려면 어떻게해야합니까?
옵션> 1 varnum "varnum"을 복원 할 수 있습니다. stumped. 이 기능은 XML 요소의 속성에 대한 액세스를 연관 배열로 제공합니다. $ xml = simplexml_load_file ($ file);...

프로그램 작성 2025-04-18에 게시되었습니다
안내서가 고유성을 보장 할 수 있습니까? 실용적인 데모
Guid는 절대적으로 독특하지 않습니다 : 간단한 반격 ] Guid가 독창성이라는 일반적인 아이디어에 의문을 제기했습니다. 이 기사는 Guid의 비 유성 성을 보여주는 간단한 C# 프로그램을 제공하고 프로그램 안정성과 성능을 향상시키기위한 개선 된 버전과 ...

프로그램 작성 2025-04-18에 게시되었습니다
모든 브라우저에서 좌회전 텍스트의 슬래시 메소드 구현
] ] 경사 선의 텍스트 정렬 배경 기울어 진 줄에서 왼쪽 정렬 된 텍스트를 달성하면 비밀리에 특히 도전이 될 수 있습니다. 호환성 (IE9로 돌아 가기). 솔루션 Lletion lless 를 사용하여 일련의 정사각형 요소를 소개하고 크기를 계산하여 효과적...

프로그램 작성 2025-04-18에 게시되었습니다
FormData ()로 여러 파일 업로드를 처리하려면 어떻게해야합니까?
); 그러나이 코드는 첫 번째 선택된 파일 만 처리합니다. 파일 : var files = document.getElementById ( 'filetOUpload'). 파일; for (var x = 0; x

프로그램 작성 2025-04-18에 게시되었습니다
C#의 NullReferenceExceptions를 방지하고 처리하는 방법?
nullReferenceException이란 무엇입니까? NullReferenceException은 빈 객체의 멤버에 액세스하려고 할 때 발생하는 C#의 런타임 예외입니다. 빈 개체의 메소드를 호출하십시오. 빈 개체의 속성에 액세스하려고 노력하십시오....

프로그램 작성 2025-04-18에 게시되었습니다
ORA-12560 오류 해결 : TNS 프로토콜 어댑터 문제 해결 안내서
"ORA-12560 : TNS : 프로토콜 어댑터 오류"는 Oracle 데이터베이스에 연결할 때 빈번한 문제입니다. 이 오류는 일반적으로 데이터베이스 서비스 또는 클라이언트가 서버에 연결할 수없는 문제를 나타냅니다. 해상도 단계 이 오...

프로그램 작성 2025-04-18에 게시되었습니다
PHP 스크립트 실행 시간을 정확하게 측정하는 방법은 무엇입니까?
Linux 기반 시스템의 경우 월 클록 시간 만 필요하다면 (스크립트의 실행이 시작된 이후 총 시간), 다음과 같은 방법은 다음과 같습니다. // $ time_start = 마이크로 타임 (true); // 여기에서 스크립트를 실행하십시오 // 타이머를 중...

프로그램 작성 2025-04-18에 게시되었습니다
C#의 두 날짜의 차이를 효율적으로 계산하는 방법은 무엇입니까?
C# 의 날짜 차이를 효율적으로 계산하는 방법.] 다양한 프로그래밍 시나리오에서 두 날짜 사이의 일수 차이를 결정하는 것이 일반적인 작업입니다. C#에는 날짜 클래스 및 timespan 구조를 사용하는 것을 포함 하여이 차이를 계산하는 몇 가지 방법이...

프로그램 작성 2025-04-18에 게시되었습니다
JavaScript 십진 및 16 진전 전환 기술
육각형 문자열로 변환 HexString = HexString = HexString = HexString을 사용하십시오. Yournumber.toString (16); 예를 들어, 소수점 10을 16 진수로 변환하기 위해 다음과 같이 씁니다. ...

프로그램 작성 2025-04-18에 게시되었습니다
SQL Server 2016의 JSON 객체 어레이에서 값 배열을 추출하는 방법은 무엇입니까?
SQL Server 2016 : JSON 개체 어레이를 값 배열로 변환 SQL Server 2016의 JSON 기능은 강력하지만 특정 데이터 구조를 추출하려면 때때로 창의적인 접근 방식이 필요합니다. 이 예제는 JSON 배열을 더 간단한 값으로 변환하는...

프로그램 작성 2025-04-18에 게시되었습니다