프로그래밍 (확장)(36)
-
판다스 (Pandas) (Pivot Table)
pivot을 생성할 때 index, columns, values에 지정된 값이 유일하지 않으면 ValueError가 발생하는데 pivot_table 함수는 피벗 테이블을 만들 때 중복 값을 처리할 수 있다 기본 사용법DataFrame.pivot_table(values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All', observed=False, sort=True) values: 피벗 테이블에 포함될 데이터 열index: 행 레이블로 사용할 열columns: 열 레이블로 사용할 열aggfunc: 집계 함수 (기본값은 'mean')fill_value: 결측..
2024.08.03 -
판다스 (Pandas) (GroupBy)
판다스의 groupby 함수는 데이터를 그룹으로 묶어 요약 통계를 계산하는 기능을 제공한다. SQL의 GROUP BY 구문과 유사하다. (참고: 예제 소스코드 ChatGPT로 생성 했습니다.) 기본 사용법groupby 함수는 데이터를 특정 열을 기준으로 그룹화한 후, 각 그룹에 대해 요약 통계를 계산할 수 있다.DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, dropna=True) by: 그룹화할 열(또는 열들)의 이름, 배열, 또는 함수. 단일 열이나 여러 열의 이름을 문자열 또는 리스트 형태로 전달할 수 있습니다.axis: 그룹화할 축..
2024.08.03 -
판다스 (Pandas) (Pivot)
pivot 함수는 데이터를 재구조화하고 요약할 수 있는 도구로 특정 열의 값들을 새로 만든 열과 행 인덱스에 배치해서 테이블을 재구조화 합니다. 기본 사용법DataFrame.pivot(index=None, columns=None, values=None) index: 새로 만들 행 인덱스로 사용할 열 이름 또는 이름의 리스트columns: 새로 만들 열 이름으로 사용할 열 이름 또는 이름의 리스트values: 새로운 프레임의 데이터 값으로 사용할 열 이름 ChatGPT 생성 예시 코드 1: 데이터 프레임 생성.import pandas as pddata = { 'Date': ['2020-01-01', '2020-01-02', '2020-01-01', '2020-01-02'], 'City': ['..
2024.08.03 -
판다스 (Pandas) (데이터 정제)
1. 결측치 처리결측치 확인 예시 (ChatGPT 생성):import pandas as pd# 결측치가 있는 DataFrame 생성data = {'Name': ['Alice', 'Bob', None], 'Age': [25, None, 35], 'City': ['New York', 'Los Angeles', None]}df = pd.DataFrame(data)# 결측치 확인print(df.isnull())print(df.isnull().sum()) Name Age City0 False False False1 False True False2 True False TrueName 1Age 1City 1dtype: int64 결측치 ..
2024.08.03 -
판다스 (Pandas) (데이터 선택 및 필터링)
1. 인덱싱과 슬라이싱데이터 선택하기import pandas as pd# DataFrame 생성data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'], 'Age': [25, 30, 35, 40, 45], 'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix']}df = pd.DataFrame(data)# 단일 열 선택print(df['Name'])# 여러 열 선택print(df[['Name', 'City']])# 열 추가df['Salary'] = [50000, 60000, 70000, 80000, 90000]print(df)0 Alice1 ..
2024.08.02 -
판다스 (Pandas) (데이터 입출력)
1. CSV 파일 읽기import pandas as pd# CSV 파일 읽기df = pd.read_csv('sample_data.csv')print(df) 2. Excel 파일 읽기 import pandas as pd# Excel 파일 읽기df = pd.read_excel('sample_data.xlsx')print(df) 3. JSON 파일 읽기 import pandas as pd# JSON 파일 읽기df = pd.read_json('sample_data.json')print(df) 4. HTML 파일 읽기import pandas as pd# HTML 파일 읽기url = 'https://example.com/sample_data.html'df_list = pd.read_html(url)df = d..
2024.08.02