1. Logistic Regression 이번 글 역시 이전 글과 똑같이 김성훈 교수님의 유튜브 강의를 기반으로 하여 작성하였다. 아래 사진을 클릭하면 동영상 싸이트로 갈 수 있다. 1. Logistic Regression(Classification) Logistic Regression의 결과는 yes/no, 1/0과 같이 2개 결과를 가진다. 예로 들어 하나의 변수 x가 있을 때 x의 값 50을 기준으로 작으면 0, 크면 1이라고 한다. 이러한 관계 때문에 데이터의 분포가 Linear Regression과 달라 지고 결과적으로 Linear Regression에서 사용한 Hypothesis(H(x) = Wx+b)를 사용할 수 없다. 강의에서는 수식을 사용할 수 없는 이유는 2가지를 제시하였다. 첫번째 이..
1. 개요 학습 모델을 선정하기에 앞서 학습할 데이터의 분포의 특징에 따라 어떠한 회귀법을 사용할지 선택해야한다. 회귀법을 선택할때 고려할 요소는 독립 변수이 수, 종속 변수의 유형 그리고 회귀선의 형태가 있다. 해당 글은 analyticsvidhya의 글을 번역한 것이라고 보면 된다. 2. Regression 종류 1. Linear Regression 가장 널리 알려진 모델링 기술 중 하나이며 종속 변수(Y)는 연속적이며 독립 변수(X)는 연속적이거나 이산적일 수 있으며 회귀선은 선형을 가진다. 방정식 Y = a + b*X로 표시되며, 여기서 a는 절편이고, b는 선의 기울기, e는 오차 항을 나타낸다. 단순 선형 회귀과 다중 선형 회귀의 차이점은 독립 변수(X)의 수에 따라 결정된다. 학습한 선에 대..
1. 범주형 속성 처리 1. 범주형(Categorical) 속성 ▪ 예제 : 성별, 전공, 특기 2. 범주형 속성을 Asymmetric binary 변수로 변환함 3. 주요 이슈 ▪ 범주형 속성 value가 여러 종류라면?- 다른 속성을 추가한다. ▪ 한쪽 속성값으로 편향되었다면?- 새로운 정보가 없다고 속성을 판단하여 제거한다. 2. 연속형 속성 처리 1. 연속형(Continuous) 속성 ▪ 예 : 나이, 몸무게, 연봉 2. 처리 방법 ▪ 이산화 기반(Discretization-based) 방법 • 통계 기반(Statistics-based) 방법 • Non-discretization 기법 • Min-Apriori 기법 3. 연속형 속성 처리 방법 1. 이산화 기반(Discretization-based..
- Total
- Today
- Yesterday
- 알고리즘
- Notification
- 파일입출력
- 인텐트
- java 파일 입출력
- java url
- 카운터
- vim
- LISTVIEW
- android
- 서버
- Java Decompiler
- 아두이노
- 5582
- php
- 포켓몬 고
- java
- vim 설치
- c언어
- 테라펀딩 #투게더펀딩 #P2P투자 #부동산 소액 투자 #카카오 #토스
- counter
- Service
- Res
- 안드로이드
- 파일 입출력
- 포켓몬 Go
- 유전
- jad
- 유전 알고리즘
- 자바 입출력
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |