히트맵(2)
-
데이터 사이언스 - 2. Python을 활용한 데이터 분석 기초 (2.2 데이터 분석 필수 라이브러리)
2.2 데이터 분석 필수 라이브러리데이터 분석을 수행할 때 파이썬의 강력한 라이브러리를 활용하면 데이터를 효율적으로 다룰 수 있다.특히, NumPy, Pandas, Matplotlib, Seaborn은 데이터 처리 및 시각화를 위한 필수 도구이다.2.2.1 NumPy: 다차원 배열 연산, 선형대수NumPy란?NumPy(Numerical Python)는 수치 연산을 위한 라이브러리로, 다차원 배열(NumPy 배열)을 빠르게 처리할 수 있다.또한, 선형대수, 난수 생성, 행렬 연산 등의 기능을 제공하며, 머신러닝과 데이터 분석에서 기본적으로 사용된다.NumPy 배열 생성NumPy 배열은 ndarray(다차원 배열) 형태로 데이터를 저장하며, 리스트보다 훨씬 빠른 연산을 수행할 수 있다.import numpy..
2025.03.20 -
Matplotlib - 3. 다양한 그래프 유형
Matplotlib은 다양한 그래프 유형을 제공하여 데이터를 효과적으로 시각화할 수 있습니다. 이 섹션에서는 주요 그래프 유형과 그 사용법, 장단점, 그리고 적합한 사용 시나리오를 설명합니다.3.1 선 그래프개요선 그래프는 시간에 따른 데이터 변화를 시각화하거나 연속적인 데이터를 비교하는 데 사용됩니다.사용 시나리오매출 성장 추세기온 변화주식 가격 변동장단점장점:연속 데이터를 직관적으로 표현 가능.여러 데이터 시리즈를 한 그래프에서 비교 가능.단점:데이터 시리즈가 많을 경우 혼란을 초래할 수 있음.예제: 여러 데이터 시리즈와 선 스타일 지정import matplotlib.pyplot as pltx = [1, 2, 3, 4, 5]y1 = [10, 20, 30, 40, 50]y2 = [15, 25, 35, ..
2025.01.21