Python(44)
-
Pandas - 4. 데이터 선택 및 필터링
Pandas에서 데이터를 선택하고 필터링하는 방법은 데이터 분석의 핵심 요소입니다. 이 문서에서는 iloc, loc, at, iat 등의 기본적인 데이터 선택 방법부터 조건부 필터링, 고급 인덱싱, 대용량 데이터 처리까지 초보자가 이해하기 쉽게 설명하고 예제를 포함하였습니다.1. 샘플 데이터 준비이 문서의 모든 예제에서 사용할 일관된 데이터프레임을 생성합니다.import pandas as pd# 샘플 데이터 생성data = { '이름': ['철수', '영희', '민수', '지연', '현우'], '나이': [25, 30, 22, 27, 35], '도시': ['서울', '부산', '대구', '광주', '서울'], '점수': [90, 85, 88, 76, 95]}df = pd.DataFr..
2025.02.04 -
Pandas - 3. 데이터 입출력 (I/O)
Pandas는 다양한 형식의 데이터를 쉽게 읽고 쓸 수 있는 강력한 데이터 입출력(I/O) 기능을 제공합니다. 이 문서에서는 파일 입출력의 기본적인 사용법과 주요 옵션을 초보자가 이해하기 쉽게 상세히 설명하고, 각 파일 형식에 대한 예제를 포함합니다.1. 파일 읽기1.1 CSV 파일 읽기 (read_csv)CSV 파일은 데이터 저장에 널리 사용되는 형식으로, Pandas의 read_csv 함수는 이를 간단하게 읽을 수 있습니다.기본 사용법import pandas as pd# CSV 파일 읽기try: df = pd.read_csv('example.csv') print(df)except FileNotFoundError as e: print(f"에러 발생: {e}")주요 옵션sep: 구분자를 ..
2025.01.24 -
Pandas - 2. 데이터 구조
Pandas는 데이터를 효율적으로 분석하고 조작하기 위해 두 가지 주요 데이터 구조인 Series와 DataFrame을 제공합니다. 이 문서에서는 초보자도 쉽게 이해할 수 있도록 각 데이터 구조의 정의, 생성 방법, 속성, 활용 방법을 예제와 함께 상세히 설명합니다.1. Series1.1 Series의 정의와 특성정의: Series는 1차원 데이터 구조로, 값(value)과 인덱스(index)의 결합 형태입니다.특성:Python의 리스트, 딕셔너리, Numpy 배열과 유사하지만, 데이터에 레이블(index)을 부여할 수 있는 강력한 기능을 제공합니다.같은 데이터 타입의 값들의 집합이며, 인덱스를 통해 데이터 접근이 용이합니다.1.2 Series 생성 방법1. 리스트로 생성import pandas as p..
2025.01.24 -
Pandas - 1. 소개와 설치
Pandas란 무엇인가?Pandas는 Python에서 데이터 분석과 조작을 간편하게 수행할 수 있도록 설계된 강력한 라이브러리입니다. Pandas는 구조화된 데이터를 효율적으로 처리하고, 분석 및 조작하는 데 필요한 도구들을 제공합니다.주요 특징:데이터 조작: 데이터를 정렬, 필터링, 그룹화, 집계 등 다양한 방식으로 다룰 수 있음간편한 파일 입출력: CSV, Excel, JSON 등 다양한 형식의 데이터를 읽고 쓸 수 있음풍부한 데이터 구조: Series(1차원 데이터)와 DataFrame(2차원 데이터) 제공고성능: C로 구현된 내부 연산으로 빠르고 효율적인 데이터 처리가 가능함Pandas의 주요 개념과 활용 사례주요 개념Series: 1차원 데이터 구조로, Python의 리스트나 Numpy 배열과 ..
2025.01.24 -
Matplotlib - 7. 3D 그래프
Matplotlib의 3D 그래프 기능은 데이터를 3차원으로 시각화하여 복잡한 데이터를 직관적으로 이해하는 데 도움을 줍니다. 3D 그래프를 생성하려면 mpl_toolkits.mplot3d에서 제공하는 Axes3D를 사용합니다. 이 섹션에서는 3D 그래프의 기본, 표면 그래프, 그리고 3D 등고선 그래프를 다룹니다.7.1 3D 그래프 기본Axes3D로 3D 축 생성3D 그래프를 생성하려면 Axes3D를 사용하여 3D 축을 추가해야 합니다. 이후, plot3D나 scatter3D를 사용하여 데이터를 시각화합니다.예제: 3D 선 그래프 (plot3D)import numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3D#..
2025.01.21 -
Matplotlib - 6. 시각화 최적화
Matplotlib을 사용하여 데이터 시각화를 최적화하면 그래프가 더 명확하고 전문적으로 보입니다. 이 섹션에서는 그래프 레이아웃 조정, 사용자 정의 텍스트 추가, 컬러맵 활용, 색상 막대 추가, 그래프 주석 등 시각화의 세부 요소를 최적화하는 방법을 다룹니다.6.1 그래프 레이아웃 조정Figure 크기와 DPI 설정 (figsize와 dpi)그래프의 전체 크기와 해상도를 조정하여 더 명확하고 고해상도의 시각화를 생성할 수 있습니다.예제:import matplotlib.pyplot as plt# Figure 크기와 DPI 설정data = [10, 20, 30, 40]labels = ["A", "B", "C", "D"]plt.figure(figsize=(10, 6), dpi=100) # 가로 10인치, ..
2025.01.21