Pandas 14

Python(파이썬) Pandas(판다스)의 데이터 프레임 한글 정상 출력 코드

import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': path = "c:/Windows/Fonts/malgun.ttf" font_name = font_manager.FontProperties(fname=p..

Pandas 2021.12.16

Python(파이썬) Pandas(판다스)의 dataframe(데이터 프레임) 합치기 concat()

df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']}, index=[0, 1, 2, 3]) df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 'B': ['B4', 'B5', 'B6', 'B7'], 'C': ['C4', 'C5', 'C6', 'C7'], 'D': ['D4', 'D5', 'D6', 'D7']}, index=[4, 5, 6, 7]) df3 = pd.DataFrame({'A': ['A8', 'A9', 'A10', 'A11'], 'B': ['B8', 'B9..

Pandas 2021.12.16

Python(파이썬) Pandas(판다스)의 sort_values 정렬하기

import pandas as pd df = pd.DataFrame({'Employee ID':[111, 222, 333, 444], 'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'], 'Salary [$/h]':[35, 29, 38, 20], 'Years of Experience':[3, 4 ,9, 1]}) 기본값은 ascending=True 으로 오름차순은 안적어도 됩니다. 내림차순으로 하려면 ascending=False를 적어주시면 됩니다. 정렬 조건이 두개 이상일때 정렬할 대상을 리스트로 넣어주시면 됩니다. 만약 이름으로 정렬하고 이름이 같다면 경력으로 정렬한다고 했을때 만약 이름으로 정렬하고 이름이 같으면 경력으로 정렬하되, 이름은 오름차순, 경력은 ..

Pandas 2021.12.16

Python(파이썬) Pandas(판다스)의 데이터 프레임 정보보기(info),연산값 한눈에 보기(describe) ,위,아래 잘라서 보기

Pandas를 사용하기 앞서 Pandas를 import 해야 합니다. Pandas 코드를 편하게 사용하기 위해 as pd를 붙임으로써 pd로 사용합니다. import pandas as pd 먼저 read_csv로 첨부파일을 읽어옵니다. head( ) 함수를 이용해 csv파일 위쪽 행 5개를 가져올 수 있습니다. ( )안에 숫자를 넣으면 해당 숫자만큼 불러옵니다. tail( ) 함수를 이용해 csv파일 뒷쪽 행 5개를 가져올 수 있습니다. ( )안에 숫자를 넣으면 해당 숫자만큼 불러옵니다. describe( )를 이용해 개수, 평균, 표준편차 등등 한번에 확인이 가능합니다. info( )를 사용해 해당 인덱스의 데이터 타입을 확인할 수 있습니다. shape를 사용해 행열을 알 수 있습니다.

Pandas 2021.12.05

Python(파이썬) Pandas(판다스)의 index 세팅(set_index),복구(reset_index),컬럼 순서 변경

Pandas를 사용하기 앞서 Pandas를 import 해야 합니다. Pandas 코드를 편하게 사용하기 위해 as pd를 붙임으로써 pd로 사용합니다. import pandas as pd 먼저 새 컬럼을 만들어줍니다. 새로 만든 컬럼을 인덱스로 세팅해줄수 있습니다. 다시 원래대로 인덱스 설정을 컬럼으로 복구할 수 있습니다. 컬럼 순서 변경은 데이터 액세스 기호 [ ] 를 이용해 원하는 순서로 다시 설정할 수 있습니다.

Pandas 2021.12.04

Python(파이썬) Pandas(판다스)의 index(행)과 coluem(열) 추가(append),삭제(drop),이름변경(rename)

Pandas를 사용하기 앞서 Pandas를 import 해야 합니다. Pandas 코드를 편하게 사용하기 위해 as pd를 붙임으로써 pd로 사용합니다. import pandas as pd 먼저 데이터프레임을 만듭니다. 새로운 데이터 프레임 만들고 그 데이터프레임을 추가 원하는 데이터프레임의 행과 열을 삭제 axis= 0은 행(index) 1은 열(coluems) 입니다. 원하는 데이터프레임의 행과 열의 이름 변경

Pandas 2021.12.04

Python(파이썬) Pandas(판다스)의 NaN데이터 파악(isna()), 삭제(dropna()), 채우기(fillna())

먼저 데이터 프레임을 만들어줍니다. 1. NaN데이터 파악하는 방법 2. NaN데이터 삭제하는 방법 3. NaN데이터 특정 값으로 채우는 방법 4. NaN데이터 원하는 특정 값으로 채우는 방법 3. NaN데이터 다른 데이터 값으로 대체해서 채우는 방법 각 컬럼별로 최대값으로 채우기 각 컬럼별로 최소값으로 채우기 각 컬럼별로 그 컬럼의 평균값으로 채우기 해당 방법으로 min(),max(),mean(),std() 사용 가능합니다.

Pandas 2021.12.04

Python(파이썬) Pandas(판다스)의 DataFrames 요소 액세스 .loc[ ] , iloc[ ]

중요!!! 데이터 프레임에서 데이터를 액세스하는 방법 3가지! 데이터 억세스 기호는 대괄호! 1. 컬럼의 값을 가져오는 방법 : 바로 대괄호 쓰고 컬럼이름 쓴다 2. 행과 열의 정보로, 데이터를 가져오는 방법 2-1. 사람용인 인덱스와 컬럼명으로 데이터 억세스하는 방법 ~~~~ => .loc[ , ] 3. 행과 열의 정보로 , 데이터를 가져오는 방법 3-1. 컴푸터가 자동으로 매기는 인덱스로, 행과 열을 액세스하는 방법 ~~~~ .iloc[ , ] 데이터 프레임의 데이터 변경

Pandas 2021.12.04