ML&DL38 지능과 인공 신경망 지능과 인공 신경망 지능(intelligence)은 '어떤 문제에 당면했을 때 자신의 지식과 경험을 활용해서 문제를 해결하는 능력'을 의미한다. 지능을 가진 생물체는 자신의 경험을 활용하여 문제를 해결하거나, 때로는 아예 새로운 방식을 찾아내기도 한다. 즉, 지능은 광범위한 인식 능력과 문제 해결 능력을 포괄한다고 할 수 있다. 인간의 인지 능력과 호기심 인간은 지능이 굉장히 높은 생명체이다. 그런 만큼 세상을 인지하는 능력이 탁월하며, 인간만이 가지는 특성은 대부분 이러한 높은 인지 능력으로부터 비롯된다. 인간은 자신이 처한 상황을 포괄적으로 파악할 뿐만 아니라 과거를 회상하고 아직 일어나지 않은 미래를 상상하며 과거, 현재, 미래를 통합적으로 이해한다. 그 안에서 인간은 인과적 사고를 통해 문제를 자.. ML&DL/ML DL 기본기 2022. 5. 25. 추천시스템의 한계 추천시스템의 한계 빅데이터 시대의 흐름에 따라 선택지는 점차 많아지고 있고, 이러한 상황 속에 더욱 빠르게 최적의 선택을 할 수 있도록 도와주는 추천시스템은 굉장히 각광 받고 있고 많이 연구되고 있는 분야임에는 틀림이 없다. 하지만 추천시스템은 당연히 만능이 아니고, 수행하고자 하는 서비스의 목적성에 따라 치열한 고민이 수반되어야 하는 경우가 많다. 기본적으로 최적의 추천을 위해서 어떤 데이터를 어떻게, 얼마나 수집해야 하는지에 대한 설계가 필요하며, 수집된 데이터를 어떻게 사용해서 언제 추천할 것인지 또한 중요하다. 적절한 추천시스템의 구축을 위해 고민해야 하는 대표적인 내용들은 다음과 같다. Scalability 추천시스템을 학습하고 구축할 때 사용한 데이터와 실제 서비스를 통해 얻어지는 데이터는 상.. ML&DL/추천시스템 2022. 5. 17. 추천시스템의 만족도: Beyond Accuracy 추천시스템의 만족도: Beyond Accuracy 추천시스템은 Prediction뿐만 아니라 Discovery의 기능 또한 중요하다. 예를 들어, '트랜스포머'를 재밌게 본 사람에게 '트랜스포머2'를 추천해주는 것은 Prediction이라고 할 수 있고 '리얼스틸'이나 '퍼시픽림'을 추천해주는 것은 Discovery이다. 즉, 유저 자신도 모르는 취향을 발굴하는 것이 Discovery인데 이는 단순히 navigation step을 줄여주는 것을 넘어서 exploration을 높여주어 사용자의 만족도를 높여준다. 이처럼 최근에는 '정확도'를 넘어서 유저에게 최적의 사용 경험을 제공하기 위한 노력이 계속 되고 있다. 이외에도, '.. ML&DL/추천시스템 2022. 5. 10. Identities and Inverses Identities and Inverses 대수학의 또 다른 특징으로는 Identities(항등원)와 Inverses(역원)가 있다. Identities 어떤 값 a와 연산 *이 있을 때, a에 * 연산을 한 결과가 그대로 a인 경우를 말한다. $a * e = a\qquad$ e는 *에 대한 identities ex) Additive Identities $a+e = a$ $\rightarrow (a+e)-a = a - a$ $\rightarrow (e+a)-a=0\qquad \qquad$by commutativity $\rightarrow e+(a-a)=0\qquad \qquad$by associativity $\therefore e=0\qquad$임의 a의 덧셈에 대한 항등원은 0 ex) Multipl.. ML&DL/Math for ML 2022. 5. 6. Algebraic Property Algebraic Property 대수학(Algebra)에는 크게 세 가지 특징이 있다. Commutative Property (=Law) Associative Property Distributive Property 각각에 대해서 살펴보자. Commutative Property 교환 법칙이라고도 한다. 이름에서 알 수 있듯이, 연산자에 의해 피연산되는 객체의 위치가 서로 교환되어도 식이 성립하는지 여부에 관한 법칙으로, Commutative Property가 성립되는 연산자에 대해서는 피연산자의 위치가 서로 바뀌어도 같은 결과를 도출한다. 대표적으로 $+$, $\times$ 등이 있다. 교환 법칙을 만족하는 연산을 가환(commutative), 만족하지 않는 연산을 비가환(noncommutative, a.. ML&DL/Math for ML 2022. 5. 6. 추천시스템의 유형 "왜 그렇게 힘들게 돌을 두드리시나요?" "꼬마야, 이 바위 안에는 천사가 들어있단다. 나는 지금 잠자는 천사를 깨워 자유롭게 해주는 중이야." '다비드상'을 조각 중인 미켈란젤로와 한 소년의 대화 콘텐츠 기반 필터링 콘텐츠 기반 필터링 방식은, 사용자가 특정한 아이템을 매우 선호하는 경우, 그 아이템과 비슷한 콘텐츠를 가진 다른 아이템을 추천하는 방식이다. 예를 들어 한 사용자가 특정 영화에 높은 평점을 줬다면, 그 영화의 장르, 출연진, 감독, 키워드 등 공통점을 갖는 유사한 다른 영화를 추천해주는 방식이다. 이는 보통 태그 형식으로 레이블 된 데이터에 대하여 적용된다. [자세히] 최근접 이웃 협업 필터링 신작 영화가 나왔을 때를 생각해보자. 영화를 보게 된다면 만원이 넘는 영화 관람료는 물론이고, .. ML&DL/추천시스템 2022. 4. 26. 추천시스템의 개요 "절대 거절 못할 제안을 하지" 영화 '대부'에서 추천 시스템의 개요 21세기는 '추천 시스템 전성시대'라고 봐도 무방하다. 아마존, 쿠팡 등 전자상거래 업체부터, 유튜브, 애플 뮤직 등 콘텐츠 포털까지, 대부분의 온라인 스토어는 사용자의 취향을 이해하고 최적의 상품과 콘텐츠를 추천하는 추천 시스템을 적극적으로 활용하고 있다. 범람하는 데이터의 홍수 속에, 사람들은 점점 더 선택에 어려움을 느끼고, 이는 사용자 경험에 악영향을 끼친다. 한정된 시간이라는 제약 조건 속에 너무 많은 선택지가 부여되는 것은 사용자로 하여금 압박감을 느끼게 하는데, 이러한 문제를 해결해주는 것이 바로 추천 시스템인 것이다. 추천 시스템을 채택하는 주체는 추천을 위한 대량의 데이터를 가진다. 예를 들어 온라인 스토어는 많은 양의.. ML&DL/추천시스템 2022. 4. 19. 회귀분석 회귀분석 지도 학습 (Supervised Learning) Y = f(X)에 대하여 입력 변수 X와 출력 변수 Y의 관계에 대하여 모델링하는 것 회귀(regression): 입력 변수 X에 대해서 연속형 출력 변수 Y를 예측 분류(classification): 입력 변수 X에 대해서 이산형 출력 변수 Y를 예측 회귀분석 입력 변수인 X의 정보를 활용하여 출력 변수인 Y를 예측하는 방법으로, 크게 선형회귀분석 / 비선형회귀분석으로 나뉜다. 1. 단순 선형 회귀분석 입력 변수가 X, 출력 변수가 Y일때, 단순 선형 회귀의 회귀식은 위와 같다. 위 식에서 $\beta_0$는 절편(intercept), $\beta_1$은 기울기(slope)이며, 둘을 통틀어 회귀계수(coefficients)라고 한다.($\ep.. ML&DL/ML DL 기본기 2021. 12. 11. 회귀분석을 위한 확률 기초 회귀분석을 위한 확률 기초 1. 확률 기초 확률 실험( Random experiment) 실험의 결과는 미리 알 수 없다. ex - 주사위를 던졌을 때 어떤 눈이 나올지는 미리 알 수 없다. 실험에서 일어날 수 있는 모든 결과는 사전에 알려져 있다. ex - 주사위를 던졌을 때 1~6 중 하나의 눈이 나올 것이다. 이론적으로는 실험을 반복할 수 있다. 표본 공간 (Sample Space) 모든 결과들의 모임ex - 주사위를 던졌을 때 나올 수 있는 결과들의 집합 근원 사건 (Sample outcome) 표본 공간의 원소 ex - 1, 2, 3, 4, 5, 6 사건 (Event) 표본 공간의 부분집합 (근원 사건의 집합) ML&DL/Math for ML 2021. 12. 9. 통계학 기초: 회귀분석을 위한 통계 회귀분석을 위한 통계 0. 통계학이란? 통계학의 전반적인 이해를 위해서는 모집단과 표본에 대해 알아야 한다. 모집단 (Population) 연구의 대상이 되는 모든 개체들을 모은 집합 일반적으로 시간적, 공간적 제약으로 인해 모집단 전체를 대상으로 한 분석은 불가능하다. 표본 (Sample) 모집단 일부의 관측값들 각각의 집단에서 우리가 관심 있게 봐야 할 것들은 다음과 같다. 모수 (Parameter) 수치로 표현되는 모집단의 특성 모집단의 요약 값이라고 할 수 있다. ex - 모집단의 평균, 분산 등 통계량 (Statistic) 표본의 관측값들에 의해서 결정되는 양 추정량 모수를 추정하기 위한 목적을 가진 통계량 1. 자료의 종류 통계학에서 주로 다루는 자료는 크게 두 가지로 나눌 수 있다. 수치형 .. ML&DL/ML DL 기본기 2021. 12. 8. 과적합(Overfitting) 과적합(Overfitting) 1. 과적합이란 학습 데이터에 대해서는 높은 정확도를 보이지만, 검증 데이터 혹은 테스트 데이터에 대해서는 정확도가 낮은 경우를 의미한다. 복잡한 모형일수록, 데이터가 적을수록 과적합이 일어나기 쉽다. 과적합은 데이터 사이언스뿐만 아니라 AI 전반적으로 매우 큰 이슈 아래 그림은 회귀분석에서 고차항을 넣었을 때 만들어지는 직선 2. 분산(Variance)과 편파성(Bias) 3. 분산과 편파성의 트레이드오프(Tradeoff) 딜레마 분산과 표준편차가 모두 낮은 경우 (좌측 상단) 거의 존재하지 않는, 가장 이상적인 상황이다. 타깃 값에 높은 정확도를 가지고 적중함을 확인할 수 있다. 분산과 표준편차가 모두 높은 경우 (우측 하단) 예측값이 한 곳에 모이지도 않았고 타깃 값에.. ML&DL/ML DL 기본기 2021. 12. 7. 모델 적합성 평가 및 실험설계 모델의 적합성 평가 및 실험설계 0. 용어 설명 MSE(mean squared error) 평균 제곱 오차. 예측값과 실제값 사이의 오차(잔차)의 제곱에 대한 평균 회귀 모형의 예측력을 평가하기 위해 예측 값과 실제 값이 유사한지 평가할 수 있는 척도로, 숫자가 작을수록 더욱 정확한 모델이라고 판단한다. 이외에도 Average error, MAE, MAPE, RMSE 등이 있다. Overfitting 과적합. 머신러닝에서, 학습 데이터를 과하게 학습하는 것을 뜻한다. 실제 데이터의 부분집합인 학습 데이터에 대해서는 오차가 감소하지만, 실제 데이터에 대해서는 오차가 증가하게 된다. Underfitting 과적합의 반대 개념. 과소 적합이라고도 불림. 학습 데이터가 충분치 않거나 학습이 제대로 이루어지지 않.. ML&DL/ML DL 기본기 2021. 12. 5. 이전 1 2 3 4 다음