일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 개발배경지식
- RL
- TFDV
- 윤성우의 열혈 자료구조
- 선형대수학
- data structure
- 텐서플로우 익스텐디드
- 논문 리뷰
- 운영체제
- ML 파이프라인
- recsys
- 자료구조
- agent
- OS
- 글또9기
- 강화학습
- 그래프씽킹
- CVPR
- reinforcement learning
- 데이터 검증
- 딥러닝
- 데이터 전처리
- 그래프데이터
- Semantic segmentation
- 머신러닝
- mdp
- IT
- MLOps
- Stack
- TFX
- Today
- Total
목록전체 글 (68)
성장通
그래프 스키마 언어 그래프를 공부하다보면 이를 이해하는 주체에 따라 다르게 해석되는 용어들이 존재한다. 이로 인해 발생하는 오해와 소통 오류를 방지하기 위해 그래프 스키마를 설명하는 공식 용어가 있는데, 이를 그래프 스키마 언어(Graph Schema Language, GSL)라고 한다. 그래프 스키마 언어는 그래프 데이터베이스 스키마를 만들기 위해 개념을 적용하는 시각적 언어로, 개념적 그래프 모델, 그래프 스키마, 그래프 데이터베이스를 설계하고 공유하며 소통을 돕기 위해 사용된다. 정점 레이블과 간선 레이블 정점과 간선이 그래프의 필수 요소 중 하나인만큼, 그래프 스키마 언어에서도 첫 번째로 알아야할 것을 꼽자면 정점 레이블(vertex label)과 간선 레이블(edge label)을 들 수 있다...
관계형에서 그래프 씽킹으로 그래프를 도입하여 그래프 씽킹을 시작하기 전에 생각해봐야 할 세 가지 질문이 있다. 관계형 기술보다 그래프 기술이 문제 해결에 더 적합한가? 데이터를 어떻게 그래프로 사고할 수 있는가? 그래프 스키마는 어떻게 모델링하는가? 이 세 가지 질문을 이해하고 답변하기 위해 많은 시간을 투자한다면 그래프 기술을 성공적으로 도입할 수 있을 것이다. 그럼 이러한 질문들을 이해하기 위해 다음을 살펴보도록 하자. 질문에 답하기 위해, 이번 포스팅에서 관계형 기술과 그래프 기술의 차이점을 알아보고 예제 데이터를 두 가지 방식으로 생각해 볼 것이다. 또한 다음 포스팅에서 그래프 스키마 언어를 알아보고 이를 이용하여 그래프 스키마 모델링을 진행해 볼 것이다. 마지막으로 이를 종합하여 관계형과 그래프..
최적화 알고리즘 - SGD, 네스테로프, AdaGrad, RMSProp, Adam 신경망의 손실 함수가 복잡한 경우, 학습의 기본 최적화 알고리즘인 경사 하강법(Gradient Descent)과 미니 배치 훈련 방식으로 변형된 확률적 경사 하강법(Stochastic Gradient Descent, 이하 SGD)만으로는 최적해를 찾기 어려울뿐더러 학습 속도 또한 느리다. 이러한 한계를 극복하기 위해 확률적 경사 하강법을 변형한 많은 알고리즘이 제안되었다. 그중 주요 최적화 알고리즘인 SGD 모멘텀, 네스테로프 모멘텀, AdaGrad, RMSProp, Adam을 살펴보도록 하자. 확률적 경사 하강법의 문제점 확률적 경사 하강법의 개선 알고리즘들을 살펴보기 전에, 확률적 경사 하강법에는 어떠한 문제점이 있는지..
빈도주의 V.S. 베이즈주의 빈도주의(Freqatist) 빈도주의(Freqatist)는 철저히 데이터에 기반을 둔 개념으로, 확률을 사건의 빈도로 보는 주의를 의미한다. 빈도론자들은 특정한 사건이 얼만큼 빈번하게 반복되어 발생하는가를 관찰하고 가설을 세워 모델을 만들고 검증한다. 예를 들어, '주사위를 던질 때 6이 나올 확률'을 계산하기 위해 무수히 많이 주사위를 굴려보고 그 통계를 확인할 수 있다. 빈도주의에서는 이와 같이, 특정 사건의 확률을 계산하기 위해 가장 이상적인 방법은 무수한 시행이라고 주장한다. 다만, 이와 같은 방법은 물리적 한계가 존재할 뿐만 아니라 실제 실험에 적용되는 외부 요인이 너무나 많기 때문에 실제로 사용하기에는 무리가 있는 방법이다. 여러 번의 실험 및 관찰을 통해 알게된 ..
일차결합, 일차종속, 일차독립 일차결합 일차결합(Linear Combination)의 정의는 다음과 같다. 벡터공간 $V$의 공집합이 아닌 부분공간 $S$에 속하는 유한 개의 벡터 $u_1, ... , u_k$와 유한 개의 스칼라 $a_1, ... , a_k$에 대하여 다음과 같은 벡터 $v$를 $S$의 일차결합(Linear combination)이라 한다. $$ v = a_1u_1 + ... + a_ku_k $$ 이때, $v$는 벡터 $u_1,...,u_k$의 일차결합이며 $a_1,...,a_k$를 계수(Coefficient)라고 한다. * 여기서, 정의에 따라 벡터 한 개와 스칼라의 곱 또한 일차결합에 해당함에 유의하자. 부분 공간의 정의에 따라, $S$의 모든 일차결합은 $V$에 속한다. 증명) $..
그래프 씽킹 그래프 씽킹(Graph Thinking)은 말 그대로 '데이터 간의 관계를 그래프로 생각하는 방법'으로, 도메인 문제를 연결된 그래프로 표현하고 그래프 기술을 사용해 도메인 역학 관계를 설명함으로써 문제를 해결한다. 데이터를 그래프로 표현하면 해당 도메인 내 데이터 간 복잡한 네트워크를 직관적으로 이해할 수 있어 문제 해결에 도움이 된다. 데이터를 잘 저장하고 불러오는 것에 초점을 맞췄던 것에서 데이터 내에 숨어있는 가치를 발굴하는 것으로 초점이 넘어감에 따라 그래프 기술은 새로운 데이터 혁신을 불러왔다. 복잡한 문제와 복잡한 시스템 먼저 여기서 말하고자 하는 '복잡한 문제'와 '복잡한 시스템'에 대해서 정의하고 넘어가도록 하자. 복잡한 문제란 복잡한 시스템에 존재하는 네트워크를 가리킨다. ..