일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 데이터 검증
- mdp
- MLOps
- RL
- 강화학습
- 논문 리뷰
- 데이터 전처리
- 윤성우의 열혈 자료구조
- 그래프씽킹
- 머신러닝
- recsys
- 선형대수학
- CVPR
- 딥러닝
- reinforcement learning
- TFX
- TFDV
- 텐서플로우 익스텐디드
- 개발배경지식
- data structure
- agent
- IT
- ML 파이프라인
- Semantic segmentation
- 운영체제
- Stack
- OS
- 글또9기
- 자료구조
- 그래프데이터
- Today
- Total
목록ML&DL/ML DL 기본기 (14)
성장通
딥러닝의 역사 인공 신경망의 발전은 컴퓨터와 생체 신경망 연구의 발전과 맞물려 있다. 대규모 컴퓨팅 자원이 필수적인 인공지능은 컴퓨터의 성능과 최전선에서 관계를 이루기 때문에, 컴퓨팅 파워와 함께 발전한다는 말이 과언이 아니다. 또한 생체 신경망의 원리를 모방하고 있는 만큼 생체 신경망에 대한 연구가 진행될수록 인공 신경망 또한 더욱 사람처럼 학습하고 추론하게 될 것이다. 최초의 인공 신경망: 매컬러-피츠 모델 매컬러-피츠(McCulloch-Pitts) 모델은 '최초의 인공 신경망' 모델로서 인간의 신경계를 이진 뉴런으로 표현하려고 했다. 신경 생리학자인 매컬러는 인간의 신경계를 범용 계산 장치로 모델링할 수 있을지 궁금해했고, 천재 수학자 피츠를 만나면서 세계 최초로 인공 신경망을 정의했다. 이들이 정..
지능과 인공 신경망 지능(intelligence)은 '어떤 문제에 당면했을 때 자신의 지식과 경험을 활용해서 문제를 해결하는 능력'을 의미한다. 지능을 가진 생물체는 자신의 경험을 활용하여 문제를 해결하거나, 때로는 아예 새로운 방식을 찾아내기도 한다. 즉, 지능은 광범위한 인식 능력과 문제 해결 능력을 포괄한다고 할 수 있다. 인간의 인지 능력과 호기심 인간은 지능이 굉장히 높은 생명체이다. 그런 만큼 세상을 인지하는 능력이 탁월하며, 인간만이 가지는 특성은 대부분 이러한 높은 인지 능력으로부터 비롯된다. 인간은 자신이 처한 상황을 포괄적으로 파악할 뿐만 아니라 과거를 회상하고 아직 일어나지 않은 미래를 상상하며 과거, 현재, 미래를 통합적으로 이해한다. 그 안에서 인간은 인과적 사고를 통해 문제를 자..
회귀분석 지도 학습 (Supervised Learning) Y = f(X)에 대하여 입력 변수 X와 출력 변수 Y의 관계에 대하여 모델링하는 것 회귀(regression): 입력 변수 X에 대해서 연속형 출력 변수 Y를 예측 분류(classification): 입력 변수 X에 대해서 이산형 출력 변수 Y를 예측 회귀분석 입력 변수인 X의 정보를 활용하여 출력 변수인 Y를 예측하는 방법으로, 크게 선형회귀분석 / 비선형회귀분석으로 나뉜다. 1. 단순 선형 회귀분석 입력 변수가 X, 출력 변수가 Y일때, 단순 선형 회귀의 회귀식은 위와 같다. 위 식에서 $\beta_0$는 절편(intercept), $\beta_1$은 기울기(slope)이며, 둘을 통틀어 회귀계수(coefficients)라고 한다.($\ep..
회귀분석을 위한 통계 0. 통계학이란? 통계학의 전반적인 이해를 위해서는 모집단과 표본에 대해 알아야 한다. 모집단 (Population) 연구의 대상이 되는 모든 개체들을 모은 집합 일반적으로 시간적, 공간적 제약으로 인해 모집단 전체를 대상으로 한 분석은 불가능하다. 표본 (Sample) 모집단 일부의 관측값들 각각의 집단에서 우리가 관심 있게 봐야 할 것들은 다음과 같다. 모수 (Parameter) 수치로 표현되는 모집단의 특성 모집단의 요약 값이라고 할 수 있다. ex - 모집단의 평균, 분산 등 통계량 (Statistic) 표본의 관측값들에 의해서 결정되는 양 추정량 모수를 추정하기 위한 목적을 가진 통계량 1. 자료의 종류 통계학에서 주로 다루는 자료는 크게 두 가지로 나눌 수 있다. 수치형 ..
과적합(Overfitting) 1. 과적합이란 학습 데이터에 대해서는 높은 정확도를 보이지만, 검증 데이터 혹은 테스트 데이터에 대해서는 정확도가 낮은 경우를 의미한다. 복잡한 모형일수록, 데이터가 적을수록 과적합이 일어나기 쉽다. 과적합은 데이터 사이언스뿐만 아니라 AI 전반적으로 매우 큰 이슈 아래 그림은 회귀분석에서 고차항을 넣었을 때 만들어지는 직선 2. 분산(Variance)과 편파성(Bias) 3. 분산과 편파성의 트레이드오프(Tradeoff) 딜레마 분산과 표준편차가 모두 낮은 경우 (좌측 상단) 거의 존재하지 않는, 가장 이상적인 상황이다. 타깃 값에 높은 정확도를 가지고 적중함을 확인할 수 있다. 분산과 표준편차가 모두 높은 경우 (우측 하단) 예측값이 한 곳에 모이지도 않았고 타깃 값에..
모델의 적합성 평가 및 실험설계 0. 용어 설명 MSE(mean squared error) 평균 제곱 오차. 예측값과 실제값 사이의 오차(잔차)의 제곱에 대한 평균 회귀 모형의 예측력을 평가하기 위해 예측 값과 실제 값이 유사한지 평가할 수 있는 척도로, 숫자가 작을수록 더욱 정확한 모델이라고 판단한다. 이외에도 Average error, MAE, MAPE, RMSE 등이 있다. Overfitting 과적합. 머신러닝에서, 학습 데이터를 과하게 학습하는 것을 뜻한다. 실제 데이터의 부분집합인 학습 데이터에 대해서는 오차가 감소하지만, 실제 데이터에 대해서는 오차가 증가하게 된다. Underfitting 과적합의 반대 개념. 과소 적합이라고도 불림. 학습 데이터가 충분치 않거나 학습이 제대로 이루어지지 않..