전체 글165 [도서 리뷰] 잘되는 머신러닝 팀엔 이유가 있다 * 한빛미디어 서평단 활동을 위해서 책을 협찬받아 작성된 서평입니다.잘되는 머신러닝 팀엔 이유가 있다데이비드 탄, 에이다 양, 데이비드 콜스 지음라인 AI Lab 옮김 잘되는 머신러닝 팀엔 이유가 있다 | 데이비드 탄 - 교보문고잘되는 머신러닝 팀엔 이유가 있다 | 머신러닝 프로젝트의 구조를 분석하고 최고의 성과로 연결하는 법 자동 테스트, 리팩터링, MLOps와 협업 기술까지 제품 개발 및 관리 노하우와 팀 운영 전략product.kyobobook.co.kr간단 서평학부 시절, 2년 정도 짧게 창업을 경험한 적이 있다. 당시 나는 머신러닝 팀을 이끌었다. 기술적으로는 꽤 준비돼 있었다고 생각했지만, 프로젝트를 제품으로 이끄는 과정은 순탄치 않았다. 모델은 잘 만들었지만 모델의 배포와 유지 관리, 협업.. 리뷰/도서, 강의 리뷰 2025. 7. 27. [도서 리뷰] 랭체인으로 RAG 개발하기: VectorRAG & GraphRAG * 본 리뷰는 길벗 출판사의 활동을 위해서 책을 협찬받아 작성된 서평입니다.랭체인으로 RAG 개발하기: VectorRAG & GraphRAG서지영 지음 랭체인으로 RAG 개발하기: VectorRAG & GraphRAG | 서지영 - 교보문고랭체인으로 RAG 개발하기: VectorRAG & GraphRAG | VectorRAG와 GraphRAG의 차이와 구현 방법을 기본 예제로 간단히! OpenAI와 DeepSeek의 개념과 성능 차이를 실습을 통해 직접 확인한다.VectorRAG와 GraphRAG, 두 RAG는product.kyobobook.co.kr간단 서평2022년, ChatGPT가 처음 세상에 나왔을 무렵, 나는 그룹바이라는 기업에서 구직자와 기업 간의 연결을 목표로 한 채용 추천 시스템을 만들고.. 리뷰/도서, 강의 리뷰 2025. 7. 13. CVPR과 UIST에 등장한 1인칭 시점으로 압력 예측하는 논문 비교해 보기 CVPR과 UIST에 등장한 1인칭 시점으로 압력 예측하는 논문 비교해 보기얼마 전 CVPR 2025 논문들을 훑어보다가, 흥미로운 주제를 다룬 논문 하나가 눈에 들어왔다. "사람의 손이 무언가를 만질 때, 기계가 그 촉각(압력) 정보를 단지 '보기만 하고도' 추정할 수 있을까?"라는 질문에서 출발한 연구였다. 이 논문을 보자마자, 문득 UIST 2024에서 접했던 비슷한 주제의 논문이 떠올랐다. 둘 다 1인칭 시점에서 손의 압력을 예측한다는 공통점이 있지만, 접근 방식은 꽤 다르다. 짧게 비교해 보면 재미있을 것 같아 이 글로 정리해 본다. 공통 주제: 1인칭 시점 영상으로 터치 압력 계산하기두 논문 모두 에고센트릭(1인칭 시점) 영상 기반으로 손의 압력을 추정하는 기술을 다루고 있다. 하지만 센싱 방.. 개인공부&프로젝트 2025. 6. 16. 퍼스널 페이지에 LLM 연동하기 4편 - 실제 기록 기반 개선하기 퍼스널 페이지에 LLM 연동하기 4편 - 실제 기록 기반 개선하기약 두 달 전, 개인 포트폴리오를 개편할 겸 노션(Notion)으로 관리하던 이력을 웹사이트 형태로 옮겼다. 바쁜 일정 탓에 따로 홍보하지 않고 잠시 잊고 지냈는데, 오늘 문득 생각나서 들어가 보니 누군가 내 웹사이트에 방문해 챗봇과 대화를 나눈 흔적이 남아 있었다. 기록을 살펴보니, 사용자는 ‘your recent work’에 대해 질문했고, 이에 대한 챗봇의 응답은 나의 최근 경력을 중심으로 이루어졌다. 틀린 답변은 아니었지만, 질문의 의도는 아마도 "최근 논문이나 연구 성과"였을 가능성이 높아 보였다. 나는 대학원생이자 연구자이므로, ‘recent work’이라는 표현은 ‘최근 직장’보다는 ‘최근 연구’나 ‘논문’으로 해석되는 것이 더.. 개인공부&프로젝트 2025. 6. 15. Windows에서 vLLM 설치 시 "ERROR: Failed to build installable wheels for some pyproject.toml based projects (vllm)" 오류 해결하기 Windows에서 vLLM 설치 시 "ERROR: Failed to build installable wheels for some pyproject.toml based projects (vllm)" 오류 해결하기로컬 PC에서 LLM 실행을 위해 vllm 패키지를 설치하던 중, Windows 환경에서는 다음과 같은 오류가 발생하였다:error: could not create 'build\bdist.win-amd64\wheel\.\vllm\model_executor\layers\quantization\utils\configs\N=1536,K=1536,device_name=AMD_Instinct_MI300X,dtype=fp8_w8a8,block_shape=[128,128].json': No such file o.. 개인공부&프로젝트 2025. 5. 30. [도서 리뷰] 윌 라슨의 엔지니어링 리더쉽 * 한빛미디어 서평단 활동을 위해서 책을 협찬받아 작성된 서평입니다.윌 라슨의 엔지니어링 리더쉽윌 라슨 지음임백준 옮김 윌 라슨의 엔지니어링 리더십 | 윌 라슨 - 교보문고윌 라슨의 엔지니어링 리더십 | 테크 리더로 성장하고 싶은 당신을 위한 필독서 윌 라슨의 엔지니어링 리더십 전략 대방출엔지니어링 조직을 이끄는 일은 단순한 기술 관리가 아닙니다. 뛰어난product.kyobobook.co.kr 간단 서평최근 들어 리더십에 대한 관심이 점점 커지고 있다. 단순히 기술을 잘 다루는 것만으로는 더 이상 조직 내에서 큰 역할을 맡기 어렵다는 점을 체감하는 개발자와 연구자들이 많아지고 있으며, 나 역시 그중 한 명이다. 스타트업에서 짧게나마 리더 역할을 경험한 뒤 대학원으로 돌아와 연구를 이어가고 있는 지금.. 리뷰/도서, 강의 리뷰 2025. 5. 29. 어텐션과 트랜스포머 아키텍처 어텐션과 트랜스포머 아키텍처트랜스포머(Transformer)는 현대 인공지능 모델의 중추라 할 수 있다. 2017년, Google Brain이 발표한 "Attention is All You Need [1]" 논문은 기존의 순환 신경망(RNN) 구조를 대체할 수 있는 새로운 접근 방식을 제시했으며, 이후 트랜스포머는 자연어 처리뿐 아니라 음성, 영상, 심지어 단백질 구조 예측까지 다양한 분야에 확장되었다.이번 글에서는 트랜스포머의 핵심 구조를 수식과 함께 최대한 직관적으로 풀어내며, 이 아키텍처가 왜 그렇게 강력한지 이해해보고자 한다.트랜스포머의 핵심 요소트랜스포머는 크게 입력 임베딩, 포지셔널 인코딩, 어텐션 메커니즘, 피드포워드 신경망, 정규화와 잔차 연결이라는 다섯 가지 핵심 요소로 나눌 수 있다. .. 카테고리 없음 2025. 5. 23. 10가지 UI/UX 사용성 원칙으로 본 그룹바이에이치알 웹사이트 분석 10가지 UI/UX 사용성 원칙으로 본 그룹바이에이치알 웹사이트 분석사용자 경험(UX)과 인터페이스(UI) 디자인에서 가장 중요한 것은 바로 '사용성(Usability)'이다. 아무리 좋은 기능일지라도 사용자가 쉽게 이해하고 원활하게 이용할 수 없다면 좋은 서비스라고 보기 어렵다. 사용성이 만족되고 난 후에야, 그 기능에 대한 평가가 이어지는 것이다. 세계적인 UX 전문가인 야콥 닐슨(Jakob Nielsen)이 제시한 '10가지 UI/UX 사용성 원칙(Usability Heuristics)'은 이러한 문제를 해결하는 데 필수적인 가이드라인이 된다. 이 원칙은 웹사이트, 모바일 앱, 소프트웨어 등 다양한 디지털 제품의 사용성을 평가하고 개선하는 데 널리 활용된다. 그렇다면, 내가 공동창업자로 있었던 '(.. 개인공부&프로젝트 2025. 4. 21. AWS SAA 자격증 대비: Amazon EFS 관련 스토리지 선택 방법 정리 노트 AWS SAA 자격증 대비: Amazon EFS 관련 스토리지 선택 방법 정리 노트문제Q. 한 기업이 애플리케이션을 위한 스토리지 솔루션을 찾고 있습니다.이 솔루션은 다음과 같은 조건을 만족해야 합니다:고가용성과 확장성이 뛰어나야 합니다.기본 프로토콜(NFS 등)을 통해 AWS 및 온프레미스의 여러 Linux 인스턴스에서 마운트 할 수 있는 파일 시스템으로 작동해야 합니다.최소 크기 요구 사항이 없어야 합니다.이 회사는 온프레미스 네트워크에서 VPC로 액세스하기 위해 사이트 간 VPN을 설정했습니다.이러한 요구 사항을 충족하는 스토리지 솔루션은 무엇인가요? 선택지:(A) Amazon FSx 멀티 AZ 배포(B) Amazon EBS 멀티-어태치 볼륨(C) 여러 마운트 대상이 있는 Amazon Elastic.. 개인공부&프로젝트/AWS Solution Architect 2025. 4. 9. 벨만 방정식 벨만 방정식벨만 방정식은 결국 가치 함수를 재귀적으로 나타낸 것이다. 이 벨만 방정식에는 벨만 기대 방정식과 벨만 최적 방정식이 있는데, 이 둘을 살펴보고 이터레이션이 어떻게 일어나는지 알아보도록 하자. 벨만 기대 방정식가치함수는 어떤 상태의 가치, 즉 에이전트가 그 상태로 갈 경우에 얻게 될 보상의 합에 대한 기댓값을 나타낸다. 이는 정책 $\pi$에 영향을 받으며 식으로는 $v_\pi(s) = E_\pi[R_{t+1} + \gamma v_\pi(S_{t+1})|S_t=s]$로 나타낸다. 이와 같은 방정식을 벨만 기대 방정식(Bellman Expectation Equation)이라고 하며, 현재 상태의 가치함수와 다음 상태의 가치함수 사이의 관계를 식으로 나타낸 것이다. 이는 가치함수 값의 지속적인 업.. ML&DL/강화학습 2025. 4. 7. 퍼스널 페이지에 LLM 연동하기 3편 – RAG 연결과 Langfuse 기반 모니터링 퍼스널 페이지에 LLM 연동하기 3편 – RAG 연결과 Langfuse 기반 모니터링TL;DRAstro 기반 챗봇 UI와 Gemini API를 연결한 이후, 본격적으로 벡터 검색 기반 RAG 기능을 통합했다. Pinecone을 통해 사용자의 질문과 유사한 컨텍스트를 찾아내고, Gemini로부터 응답을 생성하는 구조를 구현했으며, Langfuse를 활용해 전 과정을 트레이싱하고 분석할 수 있도록 했다. 앞선 글에서 챗봇 UI와 Gemini API를 연동한 구조까지 소개했다면, 이번 글에서는 드디어 1편에서 구축한 벡터 지식베이스를 챗봇과 연결하고, 실시간 RAG(Retrieval-Augmented Generation)를 수행하는 기능을 구현하는 과정을 정리한다. 또한, 챗봇 시스템의 행동을 추적하고 분석하.. 개인공부&프로젝트 2025. 4. 6. 퍼스널 페이지에 LLM 연동하기 2편 – Astro에 챗봇 연결하기 (feat. Gemini) 퍼스널 페이지에 LLM 연동하기 2편 – Astro에 챗봇 연결하기 (feat. Gemini)TL;DR퍼스널 페이지에 RAG 기반 LLM 챗봇을 붙이기 위해 Jekyll을 사용했지만, 챗봇 UI 구현과 실시간 처리에 한계를 느껴 Astro + Vercel로 전환했다. Astro의 SSR과 컴포넌트 기반 구조 덕분에 Gemini API와 통신하는 LLM 챗봇 프론트를 구현할 수 있었고, 기존 정적 페이지를 더 유연한 형태로 확장할 수 있게 되었다. 지난 글에서는 Jekyll 기반 퍼스널 페이지에서 Markdown 콘텐츠를 수집하고, 이를 벡터화해 FAISS로 저장하는 지식베이스 구축 과정을 소개했다. 프로젝트의 궁극적인 목표는 이 콘텐츠를 기반으로 작동하는 RAG(Retrieval-Augmented Gen.. 개인공부&프로젝트 2025. 4. 5. 이전 1 2 3 4 ··· 14 다음