전체 글163 CVPR과 UIST에 등장한 1인칭 시점으로 압력 예측하는 논문 비교해 보기 CVPR과 UIST에 등장한 1인칭 시점으로 압력 예측하는 논문 비교해 보기얼마 전 CVPR 2025 논문들을 훑어보다가, 흥미로운 주제를 다룬 논문 하나가 눈에 들어왔다. "사람의 손이 무언가를 만질 때, 기계가 그 촉각(압력) 정보를 단지 '보기만 하고도' 추정할 수 있을까?"라는 질문에서 출발한 연구였다. 이 논문을 보자마자, 문득 UIST 2024에서 접했던 비슷한 주제의 논문이 떠올랐다. 둘 다 1인칭 시점에서 손의 압력을 예측한다는 공통점이 있지만, 접근 방식은 꽤 다르다. 짧게 비교해 보면 재미있을 것 같아 이 글로 정리해 본다. 공통 주제: 1인칭 시점 영상으로 터치 압력 계산하기두 논문 모두 에고센트릭(1인칭 시점) 영상 기반으로 손의 압력을 추정하는 기술을 다루고 있다. 하지만 센싱 방.. 개인공부&프로젝트 2025. 6. 16. 퍼스널 페이지에 LLM 연동하기 4편 - 실제 기록 기반 개선하기 퍼스널 페이지에 LLM 연동하기 4편 - 실제 기록 기반 개선하기약 두 달 전, 개인 포트폴리오를 개편할 겸 노션(Notion)으로 관리하던 이력을 웹사이트 형태로 옮겼다. 바쁜 일정 탓에 따로 홍보하지 않고 잠시 잊고 지냈는데, 오늘 문득 생각나서 들어가 보니 누군가 내 웹사이트에 방문해 챗봇과 대화를 나눈 흔적이 남아 있었다. 기록을 살펴보니, 사용자는 ‘your recent work’에 대해 질문했고, 이에 대한 챗봇의 응답은 나의 최근 경력을 중심으로 이루어졌다. 틀린 답변은 아니었지만, 질문의 의도는 아마도 "최근 논문이나 연구 성과"였을 가능성이 높아 보였다. 나는 대학원생이자 연구자이므로, ‘recent work’이라는 표현은 ‘최근 직장’보다는 ‘최근 연구’나 ‘논문’으로 해석되는 것이 더.. 개인공부&프로젝트 2025. 6. 15. Windows에서 vLLM 설치 시 "ERROR: Failed to build installable wheels for some pyproject.toml based projects (vllm)" 오류 해결하기 Windows에서 vLLM 설치 시 "ERROR: Failed to build installable wheels for some pyproject.toml based projects (vllm)" 오류 해결하기Python에서 대형 모델 실행을 위해 vllm 패키지를 설치하던 중, Windows 환경에서는 다음과 같은 오류가 발생할 수 있다:error: could not create 'build\bdist.win-amd64\wheel\.\vllm\model_executor\layers\quantization\utils\configs\N=1536,K=1536,device_name=AMD_Instinct_MI300X,dtype=fp8_w8a8,block_shape=[128,128].json': No such .. 개인공부&프로젝트 2025. 5. 30. [도서 리뷰] 윌 라슨의 엔지니어링 리더쉽 * 한빛미디어 서평단 활동을 위해서 책을 협찬받아 작성된 서평입니다.윌 라슨의 엔지니어링 리더쉽윌 라슨 지음임백준 옮김 윌 라슨의 엔지니어링 리더십 | 윌 라슨 - 교보문고윌 라슨의 엔지니어링 리더십 | 테크 리더로 성장하고 싶은 당신을 위한 필독서 윌 라슨의 엔지니어링 리더십 전략 대방출엔지니어링 조직을 이끄는 일은 단순한 기술 관리가 아닙니다. 뛰어난product.kyobobook.co.kr 간단 서평최근 들어 리더십에 대한 관심이 점점 커지고 있다. 단순히 기술을 잘 다루는 것만으로는 더 이상 조직 내에서 큰 역할을 맡기 어렵다는 점을 체감하는 개발자와 연구자들이 많아지고 있으며, 나 역시 그중 한 명이다. 스타트업에서 짧게나마 리더 역할을 경험한 뒤 대학원으로 돌아와 연구를 이어가고 있는 지금.. 리뷰/도서, 강의 리뷰 2025. 5. 29. 어텐션과 트랜스포머 아키텍처 어텐션과 트랜스포머 아키텍처트랜스포머(Transformer)는 현대 인공지능 모델의 중추라 할 수 있다. 2017년, Google Brain이 발표한 "Attention is All You Need [1]" 논문은 기존의 순환 신경망(RNN) 구조를 대체할 수 있는 새로운 접근 방식을 제시했으며, 이후 트랜스포머는 자연어 처리뿐 아니라 음성, 영상, 심지어 단백질 구조 예측까지 다양한 분야에 확장되었다.이번 글에서는 트랜스포머의 핵심 구조를 수식과 함께 최대한 직관적으로 풀어내며, 이 아키텍처가 왜 그렇게 강력한지 이해해보고자 한다.트랜스포머의 핵심 요소트랜스포머는 크게 입력 임베딩, 포지셔널 인코딩, 어텐션 메커니즘, 피드포워드 신경망, 정규화와 잔차 연결이라는 다섯 가지 핵심 요소로 나눌 수 있다. .. 카테고리 없음 2025. 5. 23. 10가지 UI/UX 사용성 원칙으로 본 그룹바이에이치알 웹사이트 분석 10가지 UI/UX 사용성 원칙으로 본 그룹바이에이치알 웹사이트 분석사용자 경험(UX)과 인터페이스(UI) 디자인에서 가장 중요한 것은 바로 '사용성(Usability)'이다. 아무리 좋은 기능일지라도 사용자가 쉽게 이해하고 원활하게 이용할 수 없다면 좋은 서비스라고 보기 어렵다. 사용성이 만족되고 난 후에야, 그 기능에 대한 평가가 이어지는 것이다. 세계적인 UX 전문가인 야콥 닐슨(Jakob Nielsen)이 제시한 '10가지 UI/UX 사용성 원칙(Usability Heuristics)'은 이러한 문제를 해결하는 데 필수적인 가이드라인이 된다. 이 원칙은 웹사이트, 모바일 앱, 소프트웨어 등 다양한 디지털 제품의 사용성을 평가하고 개선하는 데 널리 활용된다. 그렇다면, 내가 공동창업자로 있었던 '(.. 개인공부&프로젝트 2025. 4. 21. AWS SAA 자격증 대비: Amazon EFS 관련 스토리지 선택 방법 정리 노트 AWS SAA 자격증 대비: Amazon EFS 관련 스토리지 선택 방법 정리 노트문제Q. 한 기업이 애플리케이션을 위한 스토리지 솔루션을 찾고 있습니다.이 솔루션은 다음과 같은 조건을 만족해야 합니다:고가용성과 확장성이 뛰어나야 합니다.기본 프로토콜(NFS 등)을 통해 AWS 및 온프레미스의 여러 Linux 인스턴스에서 마운트 할 수 있는 파일 시스템으로 작동해야 합니다.최소 크기 요구 사항이 없어야 합니다.이 회사는 온프레미스 네트워크에서 VPC로 액세스하기 위해 사이트 간 VPN을 설정했습니다.이러한 요구 사항을 충족하는 스토리지 솔루션은 무엇인가요? 선택지:(A) Amazon FSx 멀티 AZ 배포(B) Amazon EBS 멀티-어태치 볼륨(C) 여러 마운트 대상이 있는 Amazon Elastic.. 개인공부&프로젝트/AWS Solution Architect 2025. 4. 9. 벨만 방정식 벨만 방정식벨만 방정식은 결국 가치 함수를 재귀적으로 나타낸 것이다. 이 벨만 방정식에는 벨만 기대 방정식과 벨만 최적 방정식이 있는데, 이 둘을 살펴보고 이터레이션이 어떻게 일어나는지 알아보도록 하자. 벨만 기대 방정식가치함수는 어떤 상태의 가치, 즉 에이전트가 그 상태로 갈 경우에 얻게 될 보상의 합에 대한 기댓값을 나타낸다. 이는 정책 $\pi$에 영향을 받으며 식으로는 $v_\pi(s) = E_\pi[R_{t+1} + \gamma v_\pi(S_{t+1})|S_t=s]$로 나타낸다. 이와 같은 방정식을 벨만 기대 방정식(Bellman Expectation Equation)이라고 하며, 현재 상태의 가치함수와 다음 상태의 가치함수 사이의 관계를 식으로 나타낸 것이다. 이는 가치함수 값의 지속적인 업.. ML&DL/강화학습 2025. 4. 7. 퍼스널 페이지에 LLM 연동하기 3편 – RAG 연결과 Langfuse 기반 모니터링 퍼스널 페이지에 LLM 연동하기 3편 – RAG 연결과 Langfuse 기반 모니터링TL;DRAstro 기반 챗봇 UI와 Gemini API를 연결한 이후, 본격적으로 벡터 검색 기반 RAG 기능을 통합했다. Pinecone을 통해 사용자의 질문과 유사한 컨텍스트를 찾아내고, Gemini로부터 응답을 생성하는 구조를 구현했으며, Langfuse를 활용해 전 과정을 트레이싱하고 분석할 수 있도록 했다. 앞선 글에서 챗봇 UI와 Gemini API를 연동한 구조까지 소개했다면, 이번 글에서는 드디어 1편에서 구축한 벡터 지식베이스를 챗봇과 연결하고, 실시간 RAG(Retrieval-Augmented Generation)를 수행하는 기능을 구현하는 과정을 정리한다. 또한, 챗봇 시스템의 행동을 추적하고 분석하.. 개인공부&프로젝트 2025. 4. 6. 퍼스널 페이지에 LLM 연동하기 2편 – Astro에 챗봇 연결하기 (feat. Gemini) 퍼스널 페이지에 LLM 연동하기 2편 – Astro에 챗봇 연결하기 (feat. Gemini)TL;DR퍼스널 페이지에 RAG 기반 LLM 챗봇을 붙이기 위해 Jekyll을 사용했지만, 챗봇 UI 구현과 실시간 처리에 한계를 느껴 Astro + Vercel로 전환했다. Astro의 SSR과 컴포넌트 기반 구조 덕분에 Gemini API와 통신하는 LLM 챗봇 프론트를 구현할 수 있었고, 기존 정적 페이지를 더 유연한 형태로 확장할 수 있게 되었다. 지난 글에서는 Jekyll 기반 퍼스널 페이지에서 Markdown 콘텐츠를 수집하고, 이를 벡터화해 FAISS로 저장하는 지식베이스 구축 과정을 소개했다. 프로젝트의 궁극적인 목표는 이 콘텐츠를 기반으로 작동하는 RAG(Retrieval-Augmented Gen.. 개인공부&프로젝트 2025. 4. 5. 퍼스널 페이지에 LLM 연동하기 1편 - 지식베이스 자동 구축 퍼스널 페이지에 LLM 연동하기 1편 - 지식베이스 자동 구축나는 원래 개인 프로필을 노션에 정리해두고 있었다. 사실 프론트엔드나 웹 개발에는 큰 흥미도, 여유도 없었기 때문에 빠르게 쓸 수 있는 도구를 선호했기 때문이다. 하지만 이번에 연구실에 진학하면서 사정이 달라졌다. 연구 경험과 논문 실적이 자연스럽게 드러나면서도 깔끔한 구조의 퍼스널 페이지가 필요했기 때문이다. 나는 웹 개발 경험이 거의 없는 상태였기 때문에, 빠르고 안정적으로 정적 웹사이트를 만들 수 있는 방법을 찾다가 Jekyll을 선택했다. Markdown 파일만 잘 관리하면 사이트가 자동으로 생성되고, GitHub Pages를 통해 손쉽게 배포할 수 있는 점이 특히 마음에 들었다. 처음에는 이 정도로도 충분하다고 생각했다. 그런데 문득 .. 개인공부&프로젝트 2025. 3. 30. 모델 기반 vs 모델 프리 모델 기반 vs 모델 프리강화학습에서 모델은 환경의 동작을 예측하는 역할을 한다. 즉, 특정 상태에서 행동을 취했을 때 다음 상태와 보상을 어떻게 받을지 예측하는 기능을 가지고 있다. 이번 게시물에서는 이러한 모델의 사용 여부에 따른 강화학습의 분류를 알아보고, 각 분류별 대표적인 사례를 확인해보도록 하자.Model-based RL모델 기반 강화학습은 환경의 동작을 예측할 수 있는 모델을 학습하거나 사전에 제공 받아 이를 활용해 학습하는 방식으로, 에이전트는 환경과 직접 상호작용 하기 전에 모델을 사용해 시뮬레이션을 수행하고 최적의 행동을 결정한다. 모델은 일반적으로 다음 상태를 예측하는 확률 분포인 상태 전이 확률(Transition Probability) $\mathcal{P}$와 다음 보상을 예측하.. ML&DL/강화학습 2025. 3. 28. 이전 1 2 3 4 ··· 14 다음