Python(파이썬) Pandas(판다스)의 데이터 가공하기 Pandas를 사용하기 앞서 Pandas를 import 해야 합니다. Pandas 코드를 편하게 사용하기 위해 as pd를 붙임으로써 pd로 사용합니다. import pandas as pd 먼저 데이터프레임을 만즐어줍니다. store1의 watches의 데이터 변경 shirts라는 새로운 컬럼만들기 suits라는 새로운 컬럼 만들고 pants와 shirts가 합친 값으로 데이터 넣기 Pandas 2021.12.04
Python(파이썬) Pandas(판다스)의 NaN데이터 파악(isna()), 삭제(dropna()), 채우기(fillna()) 먼저 데이터 프레임을 만들어줍니다. 1. NaN데이터 파악하는 방법 2. NaN데이터 삭제하는 방법 3. NaN데이터 특정 값으로 채우는 방법 4. NaN데이터 원하는 특정 값으로 채우는 방법 3. NaN데이터 다른 데이터 값으로 대체해서 채우는 방법 각 컬럼별로 최대값으로 채우기 각 컬럼별로 최소값으로 채우기 각 컬럼별로 그 컬럼의 평균값으로 채우기 해당 방법으로 min(),max(),mean(),std() 사용 가능합니다. Pandas 2021.12.04
Python(파이썬) Pandas(판다스)의 DataFrames 요소 액세스 .loc[ ] , iloc[ ] 중요!!! 데이터 프레임에서 데이터를 액세스하는 방법 3가지! 데이터 억세스 기호는 대괄호! 1. 컬럼의 값을 가져오는 방법 : 바로 대괄호 쓰고 컬럼이름 쓴다 2. 행과 열의 정보로, 데이터를 가져오는 방법 2-1. 사람용인 인덱스와 컬럼명으로 데이터 억세스하는 방법 ~~~~ => .loc[ , ] 3. 행과 열의 정보로 , 데이터를 가져오는 방법 3-1. 컴푸터가 자동으로 매기는 인덱스로, 행과 열을 액세스하는 방법 ~~~~ .iloc[ , ] 데이터 프레임의 데이터 변경 Pandas 2021.12.04
Python(파이썬) Pandas(판다스)의 csv파일 읽기, 저장, Unnamed: 지우기 test.csv 모습입니다. my_file로 새롭게 저장한 모습입니다. Pandas 2021.12.04
Python(파이썬) Pandas(판다스)의 Dataframe 데이터 프레임 레이블 생성 Pandas를 사용하기 앞서 Pandas를 import 해야 합니다. Pandas 코드를 편하게 사용하기 위해 as pd를 붙임으로써 pd로 사용합니다. import pandas as pd 용어 : 데이터프레임(DataFrame)은 인덱스(index)와 컬럼(columns)과 벨류(values)로 되어있습니다. 왼쪽에 굵은 글씨( bike, book, glasses, pants, watch )가 인덱스이고, 위에 굵은 글씨( Peter, Bruce)가 컬럼입니다. 마지막 NaN( Not a Number ) 은 해당 항목에 값이 없음을 뜻합니다. Pandas 2021.12.04
Python(파이썬) Pandas(판다스)의 데이터 액세스와 연산 Pandas를 사용하기 앞서 Pandas를 import 해야 합니다. Pandas 코드를 편하게 사용하기 위해 as pd를 붙임으로써 pd로 사용합니다. import pandas as pd 타입을 확인해보면 판다스 시리즈인걸 확인할 수 있습니다! 슬라이싱을 사용해서 데이터를 가져올 수 있습니다. 리스트로 한번에 연산도 가능합니다. Pandas 2021.12.04
Python(파이썬) Pandas(판다스)의 Series 데이터 생성하기 판다스의 장점 기본적인 통계데이터 제공합니다. NaN values 처리와 숫자 문자열을 알아서 로드합니다. 데이터셋들을 merge 할 수 있습니다. NumPy, Matplotlib(차트 그리는 라이브러리)와 통합됩니다. Pandas를 사용하기 앞서 Pandas를 import 해야 합니다. Pandas 코드를 편하게 사용하기 위해 as pd를 붙임으로써 pd로 사용합니다. import pandas as pd Pandas Series 데이터 생성하기 ※ 판다스의 1차원 데이터를 Series(시리즈) 라고 부릅니다. 시리즈의 왼쪽부분이 index(0, 1, 2, 3), 오른쪽부분이 values(30, 6, Yes, No) Pandas 2021.12.02
Python(파이썬) Numpy(넘파이)의 boolean연산과 배열 연산,Broadcasting(브로드캐스팅) scoli() boolean 연산 넘파이 boolean 연산에서는 and,or가 아닌 &와 |로 사용합니다. 1차원 배열 연산 2차원 배열 연산 각 요소마다 연산이 수행되는 Broadcasting(브로드캐스팅) Numpy 2021.12.02
Python(파이썬) Numpy(넘파이)의 Slicing 데이터 변경 주의할 점과 copy복사하기 슬라이싱해서, Z변수에 담아서 처리하면, 원본 X를 공유하게 됩니다. 그래서 이럴 경우엔 복사해서 사용하는 방법이 있습니다. copy함수 사용 두가지 방법 1. 2. Numpy 2021.12.01