본문 바로가기

Andrew Ng6

Lecture 7) Regularization YouTube에 올라온 Andrew Ng 교수님의 Machine Learning 영상을 보고 일곱 번째 Lecture를 듣고 캡쳐 및 내용을 적은 포스트이다. 7.1 The Problem Of Overfitting Cost Function이 Linear Regression인 Housing Prices 사례로 Overfitting을 알아보자. 즉 Overfitting은 많은 feature를 갖고 있을 때 Hypothesis가 아마도 Training Set에 매우 Fit되어 있을 수 있다. 따라서 새로운 Data Set에 대해서는 일반화하는 것을 실패할 수 밖에 없다. Cost Function이 Logistic Regression인 사례로도 Overfitting을 알아보자. Overfitting을 막기 위해.. 2022. 1. 23.
Lecture 6) Logistic Regression YouTube에 올라온 Andrew Ng 교수님의 Machine Learning 영상을 보고 여섯 번째 Lecture를 듣고 캡쳐 및 내용을 적은 포스트이다. 다섯 번째 Lecture는 Octave 튜토리얼이라서 건너뛰고 혹시 궁금하다면 다른 블로그의 포스트를 찾아보자. 6.1 Classification y의 값이 0이면 Negative Class이고 1이면 Positive Class이다. e.g. Tumor(종양)가 Malignant(악성종양) 여부를 분류 - 0이면 Benign Tumor(양성종양)을 의미한다 - 1이면 Malignant Tumor(악성종양)을 의미한다 Logistic Regression도 Classification 알고리즘의 일정으로 0 2022. 1. 23.
Lecture 4) Linear Regression With Multiple Variables YouTube에 올라온 Andrew Ng 교수님의 Machine Learning 영상을 보고 네 번째 Lecture를 듣고 캡쳐 및 내용을 적은 포스트이다. 4.1 Multiple Features X^(1) = [ 2104 5 1 45 ] 의 feature를 갖는다. (1)은 테이블의 첫 번째 행을 의미한다. X^(1)에서 j가 3일 경우, Age of home 값인 1을 가르킨다. 이렇게 여러 개의 feature를 갖는 경우, h(x) = theta 0 + theta 1 이 아닌 아래 hypothesis가 성립된다. h(x) = theta 0 + theta 1 + theta 2 + theta 3 + theta 4 이것을 Mutlivariate Linear Regression 이라고도 부르다. 4.2 G.. 2022. 1. 23.
Lecture 3) Linear Algebra YouTube에 올라온 Andrew Ng 교수님의 Machine Learning 영상을 보고 세 번째 Lecture를 듣고 캡쳐 및 내용을 적은 포스트이다. Linear Algebra(선형대수학)에 대한 강의로, Matrix와 Vector로 할 수 있는 일들의 집합과 표기법에 대한 강의이다. 3.1 Matrix And Vector 3.1.1 Matrix 숫자의 직사각형 배열을 의미한다. 아래 이미지는 2d(2차원) 배열을 표기한 것이다. (대문자로 표기한다.) Matrix의 차원은 행의 갯수 x 열의 갯수로 표기한다. 따라서 왼쪽은 4 x 2 matrix, 우측은 2 x 3 matrix로 표기할 수 있다. (x 는 by라고 읽는다.) Matrix의 요소는 아래와 같이 읽는다. A43과 같이 없는 요소를 .. 2022. 1. 23.
Lecture 2) Linear Regression With One Variable YouTube에 올라온 Andrew Ng 교수님의 Machine Learning 영상을 보고 두 번째 Lecture를 듣고 캡쳐 및 내용을 적은 포스트이다. 2.1 Model Representation 이 문제는 Lecture 1에서도 봤듯이 Supervised Learning의 한 예시이다. 각 데이터마다 정답이 주어지며, 이 예시는 Regression problem이라고 지난 영상에서 언급했다. 주어진 Dataset을 우리는 Trainingset이라고 부르고 Notation(표기법)을 아래와 같이 정의하자. m = 47개, x는 Size in feet^2, y는 Price in 1000's를 의미하고 (x, y)는 하나의 training 사례이다. 즉 Training set of housing pri.. 2022. 1. 22.
Lecture 1) Machine Learning 이란? YouTube에 올라온 Andrew Ng 교수님의 Machine Learning 영상을 보고 Lecture별로 강의 내용을 정리하고자 한다. 정리한 내용을 두고두고 참고할 수 있으니깐! 작심삼일이나 하지 말자 영어로 강의를 하시기 때문에 잘못 이해한 부분이 있을 수 있다.. 1.1 What Is Machine Learning A computer program is said to learn from experience E with respect to some task T and some performance measure P, if tis performance on T, as measured by P, improves with experience E. 이메일 프로그램이 내가 스팸이라고 표시하거나 표시하지 .. 2022. 1. 20.