전체 글142 [도서 리뷰] GPT API를 활용한 인공지능 앱 개발 GPT API를 활용한 인공지능 앱 개발올리비에 케일린, 마리-알리스 블레트 지음이일섭, 박태환 옮김 GPT API를 활용한 인공지능 앱 개발(2판)o1부터 RAG, 랭체인, 파인 튜닝 그리고 프롬프트 엔지니어링까지 GPT와 파이썬을 활용한 실전 LLM 앱 개발www.hanbit.co.kr* 한빛미디어 서평단 활동을 위해서 책을 협찬 받아 작성된 서평입니다.간단 서평최근 들어 LLM(Large Language Model) 기반 애플리케이션이 급속도로 확산되고 있다. 다양한 기업과 연구소에서 RAG(Retrieval-Augmented Generation), 파인 튜닝, 프롬프트 엔지니어링 등을 활용해 AI 챗봇과 자동화 시스템을 구축하고 있으며, 나 역시 연구실에서 LLM을 기반으로 한 연구를 진행 중이.. 리뷰/도서, 강의 리뷰 2025. 2. 28. AI Agent의 개념과 기본 구현 방법 AI Agent의 개념과 기본 구현 방법AI Agent는 특정한 목적을 달성하기 위해 설계된 인공지능 시스템으로, 외부 환경과 상호작용하며 데이터를 기반으로 결정을 내린다. 최근에는 다양한 AI Agent 프레임워크가 등장하면서, 이를 활용한 개발이 점점 쉬워지고 있다. 하지만 AI Agent의 핵심 개념을 이해하는 것이 중요하며, 이를 직접 구현해보는 과정이 큰 도움이 된다. 이번 글에서는 Dummy Agent를 구현해서 그 동작 과정을 살펴보도록 하겠다. Hugging Face Serverless API 활용Hugging Face는 AI 모델을 실행할 수 있는 Serverless API를 제공한다. 이를 이용하면 로컬 환경에서 직접 모델을 실행하지 않고도 Inference를 수행할 수 있다. API .. 카테고리 없음 2025. 2. 23. LLM Agent의 Thought-Action-Observation Cycle LLM Agent의 Thought-Action-Observation CycleAI Agent는 단순한 자연어 처리 모델을 넘어, Reasoning, Planning, Acting 능력을 갖춘 시스템이다. 이들을 가능하게 하는 핵심 개념이 Thought-Action-Observation Cycle이며, 이는 Agent가 지속적으로 환경과 상호작용하며 목표를 달성하도록 돕는다. 본 글에서는 이 사이클이 어떻게 작동하는지에 대해 전문적인 관점에서 살펴본다. Thought: Internal Reasoning과 PlanningAgent의 첫 번째 단계는 Thought, 즉 내부 추론(Internal Reasoning)과 계획(Planning) 단계다. 주어진 Query를 분석하고, 해결해야 할 Problem을 정.. 개인공부&프로젝트/LLM 에이전트 스터디 2025. 2. 23. LLM 에이전트의 도구 사용 LLM 에이전트의 도구 사용AI 에이전트의 핵심 기능 중 하나는 행동(Actions)을 수행하는 능력이다. 이는 단순한 텍스트 생성에 국한되지 않으며, 도구(Tools)를 활용함으로써 확장된다. 적절한 도구를 제공하고, 이를 명확하게 설명하면 AI 에이전트가 보다 복잡한 작업을 수행할 수 있다. 도구란 무엇인가?도구(Tool)란 LLM이 사용할 수 있도록 제공된 특정 기능을 의미한다. 도구는 특정한 목적을 수행하는 함수로, 대표적인 예시는 다음과 같다. 도구 유형설명웹 검색최신 정보를 인터넷에서 가져옴이미지 생성텍스트 기반의 이미지 생성정보 검색외부 데이터베이스에서 정보 검색API 호출GitHub, YouTube 등 외부 API와 상호작용 도구는 LLM의 내부 지식이 훈련된 시점까지만 반영된다는 한계를 .. 개인공부&프로젝트/LLM 에이전트 스터디 2025. 2. 22. 왜 RNN보다 트랜스포머가 좋다는걸까? (feat. 혁펜하임의 Easy! 딥러닝) 왜 RNN보다 트랜스포머가 더 강력한가? (feat. 혁펜하임의 Easy! 딥러닝)시계열 데이터를 다룰 때 가장 먼저 배우는 것은 RNN이다. RNN은 가장 기본적인 모델인 만큼 필수적으로 배우고 넘어가야 하는 개념 중 하나인데, 사실 대부분의 논문을 보면 RNN을 그대로 쓰는 경우는 거의 없다. 그 대신 트랜스포머(Transformer)를 주로 사용하곤 하는데, 이 트랜스포머의 어떤 점이 RNN을 대체하고 있는지 간단하게 정리해 보았다.연속적인 데이터와 RNN의 등장연속적인 데이터를 다룰 때 가장 중요한 개념 중 하나가 토크나이징(Tokenizing)이다. 자연어 처리(NLP)에서 문장을 의미 있는 단위로 나누는 과정은 필수적이며, 이를 효과적으로 수행하는 것이 모델 성능에 직접적인 영향을 미친다. 예.. 개인공부&프로젝트 2025. 2. 15. PARA 프레임워크로 생산성 관리하기 (feat. LLM Agent) PARA 프레임워크로 생산성 관리하기 (feat. LLM Agent)대학원 생활을 하다 보면 연구에만 집중하기 어려운 순간이 많다. 실험과 논문 작성도 벅찬데, 수업과 미팅, 각종 행정 업무까지 겹치면 하루가 어떻게 지나가는지도 모를 정도다. 여러 태스크가 뒤섞이고, 급한 일부터 처리하다 보면 정작 중요한 연구는 뒷전으로 밀려버리기 일쑤다. 그때그때 흩어진 생각과 자료를 정리하려 해도, 어디서부터 손을 대야 할지 막막할 때가 많다. 이런 혼란 속에서 PARA 프레임워크를 도입하면 업무를 체계적으로 정리하고, 연구와 기타 업무 사이에서 생각이 분절되는 문제를 해결할 수 있을 것 같았다. 하지만 막상 적용하려니, 이를 효과적으로 구축하는 과정이 또 하나의 부담으로 다가왔다. 그래서 AI의 도움을 받아 나만의.. 개인공부&프로젝트 2025. 2. 15. Message와 Special Token Message와 Special Token이전 글에서 LLM이 어떻게 작동하는지 살펴보았다면, 이제는 이러한 모델이 대화를 구조화하는 방식인 채팅 템플릿(Chat Templates)에 대해 자세히 알아보자. 사용자가 AI 에이전트와 상호 작용하는 주요 방법은 채팅 인터페이스를 통한 대화이다. 하지만 모델은 개별 메시지를 기억하지 않으며, 모든 대화 내역이 하나의 단일 프롬프트로 변환된 후 모델에 전달된다. 이 과정에서 특수 토큰(Special Tokens)이 중요한 역할을 하며, 각 LLM 모델은 고유한 포맷을 요구한다.시스템 메시지와 역할 정의대화는 일반적으로 시스템 메시지(System Message), 사용자 메시지(User Message), 어시스턴트 메시지(Assistant Message)로 구성된.. 개인공부&프로젝트/LLM 에이전트 스터디 2025. 2. 15. Agent의 두뇌, LLM에 대해서 알아보자 Agent의 두뇌, LLM에 대해서 알아보자AI 에이전트의 핵심 구성 요소 중 하나는 AI 모델이며, 가장 일반적으로 사용되는 것이 대규모 언어 모델(LLM, Large Language Model)이다. 이번 글에서는 LLM이 무엇인지, 그리고 어떻게 에이전트를 구동하는지 간단히 살펴보도록 하자. LLM이란 무엇인가?LLM은 방대한 양의 텍스트 데이터를 학습하여 인간의 언어를 이해하고 생성할 수 있는 AI 모델이다. 이 모델들은 수백만에서 수십억 개의 매개변수(parameters)를 가지며, 텍스트의 패턴과 구조를 학습하여 자연스러운 언어 출력을 생성한다. 현대의 LLM은 Transformer 아키텍처를 기반으로 하며, 이 구조는 "Attention" 메커니즘을 활용하여 텍스트의 문맥을 효과적으로 이해하.. 개인공부&프로젝트/LLM 에이전트 스터디 2025. 2. 14. AI 에이전트에 대해서 알아보자 (feat. LLM) AI 에이전트에 대해서 알아보자 (feat. LLM)최근 AI(LLM)의 발전과 함께 '에이전트(Agent)'는 사용자의 목표를 달성하기 위해 환경과 상호 작용하며 추론(reasoning), 계획(planning), 행동(execution) 등의 과정을 수행하는 시스템으로 주목받고 있다. 나 또한 단순 텍스트 응답 외에 다양한 작업을 자유롭게 수행하는 에이전트에 관심이 생겼고, 이를 연구에 활용해보고자 하는 목표를 갖게 되었다. 따라서, 에이전트에 대한 본격적인 공부를 하기 앞서 에이전트가 무엇인지, 어떤 것을 할 수 있는지를 간단하게 알아보고자 한다.에이전트란 무엇인가?에이전트는 AI 모델을 활용하여 주어진 목표를 수행하는 시스템이다. 사용자의 요청을 이해하고, 계획을 세운 후 실행하는 능력을 갖춘 것.. 개인공부&프로젝트/LLM 에이전트 스터디 2025. 2. 13. [도서 리뷰] 그림으로 이해하고 만들면서 익히는 유니티 교과서 * 길벗 출판사에서 도서를 제공받아 작성된 서평입니다.그림으로 이해하고 만들면서 익히는 유니티 교과서기타무라 마나미 지음김은철, 유세라 옮김 유니티 교과서 | 기타무라 마나미 - 교보문고유니티 교과서 | 유니티 2023 버전에 맞춰 개정! 그림으로 이해하고 만들면서 익히는 가장 쉬운 유니티 입문서![유니티 교과서(개정7판)]은 유니티를 사용해 2D/3D 게임과 애니메이션을 만들면서 유product.kyobobook.co.kr간단 서평연구실에서 테스트 베드를 제작하기 위해 유니티를 활용해야 했다. 하지만 유니티를 제대로 배운 적이 없었고, 기초부터 차근차근 학습할 필요가 있었다. 마침 이 책이 유니티 2023 버전에 맞춰 개정되었고, 입문자도 쉽게 따라 할 수 있도록 구성되어 있어 선택하게 되었다. 이 책.. 리뷰/도서, 강의 리뷰 2025. 2. 5. GPU 병렬화 기법 GPU 병렬화 기법GPU 병렬화는 수천 개의 코어를 활용하여 대규모 데이터를 동시에 처리하는 기술로, 딥러닝과 같은 고성능 컴퓨팅에서 필수적인 최적화 방식이다. 특히 LLM(Large Language Models)과 같은 대형 모델을 학습하거나, 방대한 데이터를 처리할 때 필수적인 기술로, 여러 작업을 병렬로 수행함으로써 전체 처리 시간을 크게 단축할 수 있다. 이러한 병렬화 기법에는 데이터 병렬 처리(DP), 모델 병렬 처리(MP), 파이프라인 병렬 처리(PP), 텐서 병렬 처리(TP), 그리고 완전 공유 데이터 병렬 처리(FSDP) 등이 있다. 데이터 병렬 처리데이터 병렬 처리(Data Parallelism, DP)는 대규모 데이터셋을 여러 개의 작은 배치로 나누고, 동일한 모델을 여러 GPU에 복사.. 개인공부&프로젝트 2025. 2. 4. 디퓨전 모델과 ELBO 정리: DDPM 논문을 중심으로 디퓨전 모델과 ELBO 정리: DDPM 논문을 중심으로학교에서 있을 GDGoC 딥러닝 세미나를 준비하면서, 생성형 AI에 대해 다시 공부하게 되었다. 특히, 확률적 생성 모델이 어떻게 최적화되는지를 이해하는 과정에서 디퓨전 모델(Diffusion Model)의 ELBO(Evidence Lower Bound) 유도 방식이 궁금했다. 디퓨전 모델의 핵심 아이디어는 데이터를 점진적으로 노이징 하는 Forward Process(확산 과정)과 이를 복원하는 Reverse Process(역확산 과정, 디노이징 과정)을 학습하는 것이다. 이 과정은 DDPM 논문("Denoising Diffusion Probabilistic Models")에서 수식적으로 체계적으로 정리되어 있다. 논문의 핵심 내용을 정리하면서 ELB.. 개인공부&프로젝트 2025. 2. 1. 이전 1 2 3 4 ··· 12 다음