글또2 [Paper Review] GazeGen: Gaze-Driven User Interaction for Visual Content Generation TL;DRGazeGen은 Harvard와 Meta Reality Labs Research가 개발한 시스템으로, 사용자의 시선을 이용해 AR 환경에서 콘텐츠를 생성하고 조작할 수 있는 새로운 상호작용 방식을 제공한다. 주요 기술인 DFT Gaze는 Knowledge Distillation과 Masked Autoencoder로 경량화된 모델이며, 적은 파라미터로도 높은 정확도를 유지한다. GazeGen은 사용자가 시선을 통해 객체를 추가, 삭제, 재배치하는 편집을 가능하게 하고, Midas Touch 문제를 해결하기 위해 Trigger Mechanism을 도입해 의도하지 않은 조작을 방지한다. 시스템은 AR 및 VR 환경에서 사용자의 비언어적 의도를 실시간으로 파악해 사용자 경험을 확장할 가능성을 보여주며,.. 리뷰/논문 리뷰 2024. 11. 9. [글또 X Udemy] 랭체인 - LangChain 으로 LLM 기반 애플리케이션 개발하기 랭체인 - LangChain 으로 LLM 기반 애플리케이션 개발하기 나는 현재 카일(변성윤)님이 운영 중이신 개발자 글쓰기 커뮤니티인 '글또'에서 9기 멤버로 활동 중이다. 글또는 기술 블로그를 운영하는 데에 관심이 많은 개발자와 여러 IT 관련 직군들이 모여있는 커뮤니티로, 약 5개월간 2주에 한 번 이상 퀄리티 있는 글을 쓰고 이를 서로 공유하는 커뮤니티이다. * 글또(개발자 글쓰기 모임) 소개 글또(개발자 글쓰기 모임) 소개 | 글또 Document글또 소개geultto.github.io 이번 기수에는 유명한 온라인 교육 플랫폼 Udemy에서 글또 멤버들에게 1개 내지는 2개의 강의를 후원해주었고, 나는 당시 LLM 기반 서비스를 만들어보고자 했었기에 '랭체인 - LangChain 으로 LLM 기반.. 리뷰/도서, 강의 리뷰 2024. 4. 26. 이전 1 다음