전체 글 180

Logistic Regression , Confusion Matrix

분류에 사용한다. (Classification) 예시) 나이대별로 이메일을 클릭해서 열지 말지를 분류 해봅시다. 이메일 클릭을 할 사람과 안할 사람으로 분류하겠습니다. 빨간점이 바로 데이터이며, 액션의 0과 1이 바로 레이블입니다. 레이블이 있다는 것은, 수퍼바이저드 러닝이라는 뜻입니다. 중요! 이렇게 비슷하게 생긴 함수가 이미 존재합니다. 이름은 sigmoid function 따라서 리니어 리그레션 식을, y 값을 시그모이드에 대입해서 , 일차방정식으로 만들면 다음과 같아집니다. 위와 같은 식을 가진 regression을, Logistic Regression이라 합니다. 이제 클릭을 한다, 안 한다로 두개의 클래스로 분류할 수 있습니다. 확률로 나타낼 수 있습니다. p는 확률값을 나타냅니다. 20대는 ..

머신러닝 2022.03.28

Multiple Linear Regression

아래처럼, 여러개의 features를 기반으로, 수익을 예측하려 합니다. 위와 같이, 여러개의 변수들을 통해, 수익과의 관계를 분석하고, 이를 통해 새로운 데이터가 들어왔을 때, 수익이 어떻게 될 지를 예측하고자 합니다. 아래는 하나의 변수일 때와, 여러개의 변수가 있을 때의 Linear Regression을 나타냅니다. 2차원에서는 선이지만, 3차원에서는 평면이 됩니다. 이제, 오차가 가장 적을때의 b값들을 찾아봅니다. Profit 수익을 예측하려 한다. 이것이 디펜더블 배리어블, 나머지는 인티펜더블 베리어블 1. 먼저 식을 세운다. 이때 숫자가 아닌 값은 어떻게 처리해야할까 catergorical 로 바꿔주면 된다. 구글드라이브 import from google.colab import drive dr..

머신러닝 2022.03.28

Linear Regression

Linear Regression 이란? 경력과 연봉의 관계를 분석하여, 경력이 주어졌을때 연봉을 예측하려 합니다. 데이터를 살펴보니, 아래와 같은 그래프로 나왔다고 가정했을 때, 아래 그림처럼, 해당 분포를 만족하는 직선을 찾으려 하는것이 목표입니다. 직선을 찾기 위해서는, 우리가 잘 아는 직선의 방정식을 이용하여, 직선의 기울기와 y절편을 구하면 되는 것입니다. 오차 = 실제값 - 예측값 여기에서 주의해야 할 점! x,y가 우리에게 데이터셋으로 주어졌습니다. 따라서 우리는 b을 찾아야하는 것입니다. 즉, b0, b1의 값을 찾아 가는 과정을 학습이라고 부릅니다. 그렇다면 학습이란 바로(오차)를 줄여 나가는 것입니다. 아래는 오차를 나타냅니다. 그렇다면 오차란? 그리고 직선은 처음에 어디서 가져올까요? ..

머신러닝 2022.03.28

Data Preprocessing,Feature Scaling and OneHotEncoding 머신러닝에 필요한 데이터 처리

먼저 아나콘다에 scikit learn이 설치되어야 합니다 설치가 안되었으면 다음으로 설치합니다. $ conda install -c conda-forge scikit-learn Colab환경에서 진행함으로 구글 드라이브를 import 합니다. from google.colab import drive drive.mount('/content/drive') 데이터처리에 필요한 파이브러리들을 import 합니다. import numpy as np import matplotlib.pyplot as plt import pandas as pd 데이터처리할 csv파일을 구글 드라이브에 옮긴 뒤 Colab으로 불러온 후 변수 처리합니다. df=pd.read_csv('/content/drive/MyDrive/위치/Data...

머신러닝 2022.03.28

구글 API Key 발급 받기(유튜브 API Key)

https://console.cloud.google.com/apis/dashboard Google Cloud Platform 하나의 계정으로 모든 Google 서비스를 Google Cloud Platform을 사용하려면 로그인하세요. accounts.google.com 먼저 상단 홈페이지에서 구글 로그인을 해주세요 좌측에 라이브러리를 선택합니다. 검색창에 원하시는 서비스 이름을 검색합니다. 저는 Youtube로 하겠습니다. Youtube Data API v3를 선택해주세요 사용버튼을 선택하시고 기다리시면 아래와 같은 창이 나옵니다. 상단에 +사용자 인증 정보 만들기를 선택해주시고 API키를 선택해주시면 API Key가 나오게 됩니다. API키를 타인에게 알려주시지 마시고 자신에게 필요한 서비스를 이용하시..

API 2022.03.24

AWS Lambda서버, serverless로 python flask API 서비스 만들기(internal server error 해결 방법, s3에 올린 사진이 깨질 경우)

https://www.serverless.com/ Serverless: Develop & Monitor Apps On AWS Lambda Easily develop and monitor auto-scaling applications on AWS Lambda, API Gateway, DynamoDB, etc., with the Serverless Framework and Serverless Monitoring Dashboard. www.serverless.com 회원가입을 합니다. create app을 누르고 python flask API를 누릅니다. 만드실 서버이름을 정해주시고 create 숫자가 들어가도 되지만 제일 앞에 들어가면 안됩니다. 왠만하면 소문자로만 하세요 해당 명령어를 복사 후 아나콘다 프..

AWS 2022.03.04

Github README에 사진 올리기, 글자 굵기와 크기

이렇게 README에 사진과 글자 크기 및 굵기를 어떻게 조절할까요? 이 귀여운 고양이 사진을 README에 올릴겁니다. 보시는거와 같이 #은 글자 크기입니다. 글자 앞뒤에 __(언더바 두개)인건 굵기 입니다. 사진 같은 경우엔 []안에는 보고 작성자가 쉽게 확인할 수 있게 사진 이름을 넣어줍니다 () 안엔 사진의 이미지링크를 넣어주면 됩니다. 위 고양이 사진에 우클릭 - 이미지링크 복사 하시고 붙여넣으시면 됩니다. AWS의 S3에 등록후 하는 방법도 있습니다.(그건 다음에..)

Git 2022.02.09

Git이란?

git은 컴퓨터 파일의 변경사항을 추적하고 여러 명의 사용자들 간에 해당 파일들의 작업을 조율하기 위한 분산 버전 관리 시스템이다. -위키백과 버전 관리 시스템 : Git 코딩할 때 단순히 Ctrl + z를 눌러 이전 상태로 되돌리는 것이 아니라, 원하는 시점마다 깃발을 꽂고(버전을 만들고) 이들 간에 자유롭게 돌아다닐 수 있다 내가 만든 버전 뿐 아니라 동료가 만든 버전으로 이동할 수 있고, 동료와 내 버전을 비교해서 최신본으로 코드를 업데이트를 할 수 있다. Git을 사용하는 두 가지 방법은 CLI와 GUI가 있다 커밋 푸시 풀

Git 2022.02.07

MySQL WorkBench 에 AWS DB 설정하기

+ 버튼을 눌러주세요 https://dbfoot.tistory.com/151?category=1248160 AWS Free Tier 설치하기 https://aws.amazon.com/ko/free/?trk=fa2d6ba3-df80-4d24-a453-bf30ad163af9&sc_channel=ps&sc_campaign=acquisition&sc_medium=ACQ-P|PS-GO|Brand|Desktop|SU|Core-Main|Core|KR|KR|Text&ef_id=Cj0KCQiAuvOPBhDX.. dbfoot.tistory.com 여기서 만들었던 프리티어를 사용하겠습니다. 프리티어 만들때 설정했던 username과 포트 번호 엔드포인트를 Hostname에 넣어줍니다. 그리고 Store in Keychain..

MySQL 2022.02.04