본문 바로가기
환급 챌린지!

[패스트캠퍼스 수강 후기] 머신러닝 인강 100% 환급 챌린지 21회차 미션

by 빅데이터1020 2020. 11. 8.
SMALL

안녕하세요.

패스트 캠퍼스 수강후기 - 머신러닝과 데이터 분석 A-Z 21회차 미션 시작합니다!

머신러닝 인강 후기 21회차는 이어서 PCA에 대해 공부합니다.

 

분석파트는 이론과 실습이 모두 제공됩니다.

저는 이론부분만 정리해서 올릴 예정입니다!

 

PCA 실습은 강의에서 제공하는 파일을 보면서 강사님의 지시에 따라 실습을 따라하시면 됩니다.

 

PCA는 선형대수학의 활용적인 측면이 강하고

통계 데이터 분석(주성분 찾기), 데이터 압축(차원 감소), 노이즈 제거 등 다양한 부분에서 활용됩니다.

또한 Collinearity(공선성)을 해결해서 회귀모델의 문제를 해결하는 데 쓰이기도 합니다.

 

그래서 이번 강의에서는 PCA의 수행과정에 앞서 선형대수학의 기초지식에 대해 학습하는 시간을 갖습니다.

 

" PCA 수학적 개념이해 - Eigen Vector, Eigen Value "

정방행렬 A에 대해 아래를 만족할 경우, v는 고유벡터 (eigen vector)이고 λ는 고유값(eigen value)입니다.

- Av = λv

- Av를 선형변환합니다.

 

여기서 eigen vector, eigen value의 의미를 좀더 구체적으로 살펴보겠습니다.

아래의 블로그를 참고했습니다.

https://newsight.tistory.com/95

 

Eigenvalue, Eigenvector, PCA, SVD

# 아이겐 벡터와 아이겐 벨류의 의미 : 3*3으로된 행렬에 일련의 값들이 들어있다고 하자. 이 값들은 3차원 공간상에 점들로 표현될 수 있다. 그런데 만약 이 점들에 전부 x,y위에만 존재한다면, 

newsight.tistory.com

 

3*3 Matrix에 일련의 값들이 들어있다고 가정합니다.

이 값들은 3차원 공간상에 점들로 표현될 수 있습니다.

만약 이 점들이 전부 x, y 위에만 존재한다면, 사실 x, y 라는 2개의 차원만으로 표현될 수 있는 데이터였던 것입니다.

이러한 n*n Matrix에서의 핵심 차원을 알아내는 것이 바로 eigen vector eigen value입니다.

 

# 정의 : 임의의 정방행렬(n*n) A에대해, AB=λB를 만족하는 (, B0이 아닌 벡터) Beigenvector, 상수 λeigenvalue 라고 한다.

 

기하학적으로는

임의의 점에 대해서 A라는 transformation을 행할 때 고유 벡터는 방향이 바뀌지 않는다는 의미입니다.

고유값은 그 변화되는 스케일의 정도를 의미합니다.

" PCA 수학적 개념 이해 - Singular Value Decompostion (SVD) "

 

Singular Value Decompositionn x p Matrix를 아래와 같은 요소로 나누는 것을 말합니다.

 

위와 같이 SVD를 통해 임의의 Matrix 의 공분산 구조 행렬의 eigen vector, eigen value를 얻을 수 있습니다.

Xcentered 되어있다면, Xtransposed * X는 공분산 구조가 됩니다.

 

 

머신러닝 인강 최강자를 만나고 싶으면!? https://bit.ly/3lZfGmn

LIST