일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 그래프데이터
- TFX
- data structure
- reinforcement learning
- 머신러닝
- 선형대수학
- ML 파이프라인
- agent
- 텐서플로우 익스텐디드
- RL
- Stack
- CVPR
- recsys
- 데이터 전처리
- TFDV
- Semantic segmentation
- 운영체제
- OS
- 논문 리뷰
- 글또9기
- 개발배경지식
- 윤성우의 열혈 자료구조
- 그래프씽킹
- 자료구조
- 강화학습
- MLOps
- mdp
- 데이터 검증
- 딥러닝
- IT
- Today
- Total
목록리뷰/논문 리뷰 (10)
성장通
1st Place Solution of Egocentric 3D Hand Pose Estimation Challenge 2023 이번 게시글에서는 ICCV Egocentric 3D Hand Pose Estimation Challenge 2023에서 1위를 한 솔루션을 분석해 보도록 하겠다. 해당 대회는 AssemblyHands 데이터셋을 활용하여 Egocentric 3D hand pose estimation을 수행하는 대회이다. 여기서 Egocentric 이란, 별도의 외부 view를 두는 Exocentric과 대비되는 용어로 '1인칭 시점'이라고 이해하면 된다. 즉, Hand pose estimation의 대상이 되는 손을 가진 사람의 시점을 의미하는 것으로, AR 헤드셋을 쓰고 자신의 손을 바라보고 ..
Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data Yang, L., Kang, B., Huang, Z., Xu, X., Feng, J., & Zhao, H. (2024). Depth anything: Unleashing the power of large-scale unlabeled data. arXiv preprint arXiv:2401.10891. Abstract 이 논문은 단안 깊이 추정(Monocular Depth Estimation)을 위한 Foundation Model로써 'Depth Anything'을 제시한 논문이다. 새로운 기술 모듈을 추구하지 않고 비교적 심플한 아키텍처를 사용했음에도 불구하고 강력한 성능을 보이고 있는..
Masked Autoencoders Are Scalable Vision Learners He, Kaiming, et al. "Masked autoencoders are scalable vision learners." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022. Abstract 해당 논문에서 제시한 Masked Autoencoder(이하 MAE)는 Autoencoder 방식과 Self-supervised Learning을 결합한 모델로, asymmetric encoder-decoder 모델 구조를 가진다. 기존 자연어처리 분야에서 많이 사용되던 Masked language modeling을 이..
Large Kernel Matters -- Improve Semantic Segmentation by Global Convolutional Network Chao Peng, Xiangyu Zhang, Gang Yu, Guiming Luo, Jian Sun; Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017, pp. 4353-4361 Abstract 네트워크 아키텍처 디자인 연구에 있어, 당시 트렌드는 큰 커널 대신 작은 필터(1x1 혹은 3x3)를 여러 개 쌓는 형태를 선호하는 모습을 보였다. 이는 이미지 처리 분야에서 같은 컴퓨팅 자원 소모 대비 성능이 좋았기 때문인데, Semantic Se..
RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation Guosheng Lin, Anton Milan, Chunhua Shen, Ian Reid; Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017, pp. 1925-1934 Abstract 지금까지 리뷰한 논문들은 성공적인 Semantic Segmentation을 위해 이미지 처리의 자타공인 강자, CNNs를 수정한 구조들을 제시하였다. 기본적인 CNN은 층을 거칠수록 resolution이 낮아진다는 문제를 해결하기 위해 Upsampling이나 Dil..
Dilated Residual Networks Fisher Yu, Vladlen Koltun, Thomas Funkhouser; Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017, pp. 472-480 Abstract 2016년에 공개된 DilatedNet(리뷰)에 이어 등장한 모델 구조이다. Semantic Segmentation은 물론, 모델의 깊이나 복잡성 증가 없이 Image Classification에서도 좋은 성능을 낼 수 있는 DRN은 Dilated Convolution 개념에 잔차(Residual) 개념을 더한 구조이다. 2022년 7월 기준 약 1,200회 이상의 인용 수를 보..