Pandas - 5. 데이터 전처리
데이터 전처리데이터 전처리는 데이터 분석과 모델링의 필수 과정으로, 데이터의 품질을 향상시키고 분석 결과의 신뢰성을 높입니다. 이 문서에서는 Pandas를 활용한 데이터 전처리 기법을 초보자가 이해하기 쉽게 설명하고, 다양한 예제와 함께 각 개념을 소개합니다.1. 결측치 처리⚠️ Tip: 결측치를 처리하기 전, 데이터에서 결측치가 발생한 이유를 분석하는 것이 중요합니다. 단순한 입력 오류인지, 특정 패턴이 있는지 확인하세요.1.1 결측치 확인 (isnull, notnull)import pandas as pdimport numpy as np# 샘플 데이터 생성data = {'이름': ['철수', '영희', '민수', np.nan, '현우'], '나이': [25, np.nan, 22, 27, n..
2025.02.04