ML&DL30

분류와 회귀 분류와 회귀 순방향 신경망으로 모델을 설계하기 위해서는 기본적으로 모델의 입출력 형태, 활성 함수의 종류, 네트워크 크기 등을 고려해야한다. 이 중 입출력 형태는 풀고자 하는 문제가 정의되면 자동으로 정의되는 것이 일반적이지만, 활성 함수의 종류와 네트워크 크기 등은 검증을 하는 절차가 필요하다. 이를 모델 검증 단계라고 하며, 하이퍼파라미터(hyper-parameter) 탐색을 하여 최적의 모델을 찾아낸다. 이러한 설계 과정을 이해하기 위해 지도 학습의 대표적인 문제인 분류 문제와 회귀 문제를 살펴보자. 분류는 범주형 데이터를 예측하는 문제이고, 회귀는 숫자형 데이터를 예측하는 문제라고 요약할 수 있다. 분류 문제 분류(classification) 문제는 데이터의 클래스(class) 또는 카테고리(ca.. ML&DL/ML DL 기본기 2022. 6. 22.

범용 함수 근사기로서의 신경망 범용 함수 근사기로서의 신경망 뉴런은 가중 합산과 활성 함수를 순차 실행하는 합성 함수이므로, 뉴런의 그룹인 계층 또한 합성 함수이고 계층을 순차적으로 쌓은 신경망 역시 합성 함수이다. 이때 뉴런은 실함수로 정의되고, 계층과 신경망은 벡터함수로 정의된다. 실함수와 벡터함수 실함수(real-valued function)는 크기가 n인 벡터 $x^T=(x_1, x_2, x_3, ... , x_n)$를 입력으로 하며 실수 $f(x)=f(x_1, x_2, ... , x_n)$를 출력을 갖는 $f: \mathbb{R}^n\rightarrow \mathbb{R}$ 형태의 함수이다. 벡터함수(vector function)는 크기가 n인 벡터 $x^T=(x_1, x_2, x_3, ... , x_n)$를 입력으로 하며 .. ML&DL/ML DL 기본기 2022. 6. 15.

순방향 신경망 구조 순방향 신경망의 구조 순방향 신경망(Feedforward Neural Network, FNN)은 다층 퍼셉트론의 다른 이름으로, 인공 신경망 모델의 가장 기본적인 형태라고 할 수 있다. 순방향 신경망은 데이터 구조에 대한 특별한 가정사항이 없기 때문에 데이터는 서로 독립되어 있다고 가정한다. 이름에서 알 수 있듯이, 데이터가 한 방향으로 전달되는 순방향 연결만을 갖는 모델로, 퍼셉트론의 연산과 같은 기본 뉴런연산으로 실행된다. 범용 근사 정리(universal approximation theorem)를 통해 n차원 공간의 연속 함수를 근사할 수 있는 범용 근사기로써의 기능을 할 수 있음이 증명되었는데, 이 정리를 아는 것은 신경망 모델 원리 이해에 기본이 된다. 순방향 신경망은 뉴런들이 모여 계층(lay.. ML&DL/ML DL 기본기 2022. 6. 8.

딥러닝의 역사 딥러닝의 역사 인공 신경망의 발전은 컴퓨터와 생체 신경망 연구의 발전과 맞물려 있다. 대규모 컴퓨팅 자원이 필수적인 인공지능은 컴퓨터의 성능과 최전선에서 관계를 이루기 때문에, 컴퓨팅 파워와 함께 발전한다는 말이 과언이 아니다. 또한 생체 신경망의 원리를 모방하고 있는 만큼 생체 신경망에 대한 연구가 진행될수록 인공 신경망 또한 더욱 사람처럼 학습하고 추론하게 될 것이다. 최초의 인공 신경망: 매컬러-피츠 모델 매컬러-피츠(McCulloch-Pitts) 모델은 '최초의 인공 신경망' 모델로서 인간의 신경계를 이진 뉴런으로 표현하려고 했다. 신경 생리학자인 매컬러는 인간의 신경계를 범용 계산 장치로 모델링할 수 있을지 궁금해했고, 천재 수학자 피츠를 만나면서 세계 최초로 인공 신경망을 정의했다. 이들이 정.. ML&DL/ML DL 기본기 2022. 6. 1.

지능과 인공 신경망 지능과 인공 신경망 지능(intelligence)은 '어떤 문제에 당면했을 때 자신의 지식과 경험을 활용해서 문제를 해결하는 능력'을 의미한다. 지능을 가진 생물체는 자신의 경험을 활용하여 문제를 해결하거나, 때로는 아예 새로운 방식을 찾아내기도 한다. 즉, 지능은 광범위한 인식 능력과 문제 해결 능력을 포괄한다고 할 수 있다. 인간의 인지 능력과 호기심 인간은 지능이 굉장히 높은 생명체이다. 그런 만큼 세상을 인지하는 능력이 탁월하며, 인간만이 가지는 특성은 대부분 이러한 높은 인지 능력으로부터 비롯된다. 인간은 자신이 처한 상황을 포괄적으로 파악할 뿐만 아니라 과거를 회상하고 아직 일어나지 않은 미래를 상상하며 과거, 현재, 미래를 통합적으로 이해한다. 그 안에서 인간은 인과적 사고를 통해 문제를 자.. ML&DL/ML DL 기본기 2022. 5. 25.

추천시스템의 한계 추천시스템의 한계 빅데이터 시대의 흐름에 따라 선택지는 점차 많아지고 있고, 이러한 상황 속에 더욱 빠르게 최적의 선택을 할 수 있도록 도와주는 추천시스템은 굉장히 각광 받고 있고 많이 연구되고 있는 분야임에는 틀림이 없다. 하지만 추천시스템은 당연히 만능이 아니고, 수행하고자 하는 서비스의 목적성에 따라 치열한 고민이 수반되어야 하는 경우가 많다. 기본적으로 최적의 추천을 위해서 어떤 데이터를 어떻게, 얼마나 수집해야 하는지에 대한 설계가 필요하며, 수집된 데이터를 어떻게 사용해서 언제 추천할 것인지 또한 중요하다. 적절한 추천시스템의 구축을 위해 고민해야 하는 대표적인 내용들은 다음과 같다. Scalability 추천시스템을 학습하고 구축할 때 사용한 데이터와 실제 서비스를 통해 얻어지는 데이터는 상.. ML&DL/추천시스템 2022. 5. 17.

추천시스템의 만족도: Beyond Accuracy 추천시스템의 만족도: Beyond Accuracy 추천시스템은 Prediction뿐만 아니라 Discovery의 기능 또한 중요하다. 예를 들어, '트랜스포머'를 재밌게 본 사람에게 '트랜스포머2'를 추천해주는 것은 Prediction이라고 할 수 있고 '리얼스틸'이나 '퍼시픽림'을 추천해주는 것은 Discovery이다. 즉, 유저 자신도 모르는 취향을 발굴하는 것이 Discovery인데 이는 단순히 navigation step을 줄여주는 것을 넘어서 exploration을 높여주어 사용자의 만족도를 높여준다. 이처럼 최근에는 '정확도'를 넘어서 유저에게 최적의 사용 경험을 제공하기 위한 노력이 계속 되고 있다. 이외에도, '.. ML&DL/추천시스템 2022. 5. 10.

Identities and Inverses Identities and Inverses 대수학의 또 다른 특징으로는 Identities(항등원)와 Inverses(역원)가 있다. Identities 어떤 값 a와 연산 *이 있을 때, a에 * 연산을 한 결과가 그대로 a인 경우를 말한다. $a * e = a\qquad$ e는 *에 대한 identities ex) Additive Identities $a+e = a$ $\rightarrow (a+e)-a = a - a$ $\rightarrow (e+a)-a=0\qquad \qquad$by commutativity $\rightarrow e+(a-a)=0\qquad \qquad$by associativity $\therefore e=0\qquad$임의 a의 덧셈에 대한 항등원은 0 ex) Multipl.. ML&DL/Math for ML 2022. 5. 6.

Algebraic Property Algebraic Property 대수학(Algebra)에는 크게 세 가지 특징이 있다. Commutative Property (=Law) Associative Property Distributive Property 각각에 대해서 살펴보자. Commutative Property 교환 법칙이라고도 한다. 이름에서 알 수 있듯이, 연산자에 의해 피연산되는 객체의 위치가 서로 교환되어도 식이 성립하는지 여부에 관한 법칙으로, Commutative Property가 성립되는 연산자에 대해서는 피연산자의 위치가 서로 바뀌어도 같은 결과를 도출한다. 대표적으로 $+$, $\times$ 등이 있다. 교환 법칙을 만족하는 연산을 가환(commutative), 만족하지 않는 연산을 비가환(noncommutative, a.. ML&DL/Math for ML 2022. 5. 6.

추천시스템의 유형 "왜 그렇게 힘들게 돌을 두드리시나요?" "꼬마야, 이 바위 안에는 천사가 들어있단다. 나는 지금 잠자는 천사를 깨워 자유롭게 해주는 중이야." '다비드상'을 조각 중인 미켈란젤로와 한 소년의 대화 콘텐츠 기반 필터링 콘텐츠 기반 필터링 방식은, 사용자가 특정한 아이템을 매우 선호하는 경우, 그 아이템과 비슷한 콘텐츠를 가진 다른 아이템을 추천하는 방식이다. 예를 들어 한 사용자가 특정 영화에 높은 평점을 줬다면, 그 영화의 장르, 출연진, 감독, 키워드 등 공통점을 갖는 유사한 다른 영화를 추천해주는 방식이다. 이는 보통 태그 형식으로 레이블 된 데이터에 대하여 적용된다. [자세히] 최근접 이웃 협업 필터링 신작 영화가 나왔을 때를 생각해보자. 영화를 보게 된다면 만원이 넘는 영화 관람료는 물론이고, .. ML&DL/추천시스템 2022. 4. 26.

추천시스템의 개요 "절대 거절 못할 제안을 하지" 영화 '대부'에서 추천 시스템의 개요 21세기는 '추천 시스템 전성시대'라고 봐도 무방하다. 아마존, 쿠팡 등 전자상거래 업체부터, 유튜브, 애플 뮤직 등 콘텐츠 포털까지, 대부분의 온라인 스토어는 사용자의 취향을 이해하고 최적의 상품과 콘텐츠를 추천하는 추천 시스템을 적극적으로 활용하고 있다. 범람하는 데이터의 홍수 속에, 사람들은 점점 더 선택에 어려움을 느끼고, 이는 사용자 경험에 악영향을 끼친다. 한정된 시간이라는 제약 조건 속에 너무 많은 선택지가 부여되는 것은 사용자로 하여금 압박감을 느끼게 하는데, 이러한 문제를 해결해주는 것이 바로 추천 시스템인 것이다. 추천 시스템을 채택하는 주체는 추천을 위한 대량의 데이터를 가진다. 예를 들어 온라인 스토어는 많은 양의.. ML&DL/추천시스템 2022. 4. 19.

회귀분석 회귀분석 지도 학습 (Supervised Learning) Y = f(X)에 대하여 입력 변수 X와 출력 변수 Y의 관계에 대하여 모델링하는 것 회귀(regression): 입력 변수 X에 대해서 연속형 출력 변수 Y를 예측 분류(classification): 입력 변수 X에 대해서 이산형 출력 변수 Y를 예측 회귀분석 입력 변수인 X의 정보를 활용하여 출력 변수인 Y를 예측하는 방법으로, 크게 선형회귀분석 / 비선형회귀분석으로 나뉜다. 1. 단순 선형 회귀분석 입력 변수가 X, 출력 변수가 Y일때, 단순 선형 회귀의 회귀식은 위와 같다. 위 식에서 $\beta_0$는 절편(intercept), $\beta_1$은 기울기(slope)이며, 둘을 통틀어 회귀계수(coefficients)라고 한다.($\ep.. ML&DL/ML DL 기본기 2021. 12. 11.

이전 1 2 3 다음

티스토리툴바