에이전트5 강화학습 소개 강화학습 소개강화 학습(Reinforcement Learning, RL)은 본디 20세기 행동심리학에서 유래된 개념이다. 행동심리학자 스키너(B.F. Skinner)는 동물 실험을 통해 '강화(Reinforcement)'라는 개념을 처음 제시하였다. 이 개념은 이후 인공지능(AI) 분야에서 기계가 스스로 학습할 수 있도록 하는 중요한 학습 방법으로 발전하였다. 스키너의 강화 연구행동심리학에는 시행착오(Trial and Error) 학습이라는 개념이 있다. 이는 동물들이 다양한 행동을 시도해 보면서 그 결과를 통해 학습하는 것을 의미한다. 스키너는 다음과 같은 쥐 실험을 통해 동물이 행동과 그 결과 사이의 관계를 학습하는 과정을 연구했다. 1. 굶긴 쥐를 지렛대가 있는 상자(Skinner Box)에 넣는.. ML&DL/강화학습 2025. 3. 16. PARA 프레임워크로 생산성 관리하기 (feat. LLM Agent) PARA 프레임워크로 생산성 관리하기 (feat. LLM Agent)대학원 생활을 하다 보면 연구에만 집중하기 어려운 순간이 많다. 실험과 논문 작성도 벅찬데, 수업과 미팅, 각종 행정 업무까지 겹치면 하루가 어떻게 지나가는지도 모를 정도다. 여러 태스크가 뒤섞이고, 급한 일부터 처리하다 보면 정작 중요한 연구는 뒷전으로 밀려버리기 일쑤다. 그때그때 흩어진 생각과 자료를 정리하려 해도, 어디서부터 손을 대야 할지 막막할 때가 많다. 이런 혼란 속에서 PARA 프레임워크를 도입하면 업무를 체계적으로 정리하고, 연구와 기타 업무 사이에서 생각이 분절되는 문제를 해결할 수 있을 것 같았다. 하지만 막상 적용하려니, 이를 효과적으로 구축하는 과정이 또 하나의 부담으로 다가왔다. 그래서 AI의 도움을 받아 나만의.. 개인공부&프로젝트 2025. 2. 15. Message와 Special Token Message와 Special Token이전 글에서 LLM이 어떻게 작동하는지 살펴보았다면, 이제는 이러한 모델이 대화를 구조화하는 방식인 채팅 템플릿(Chat Templates)에 대해 자세히 알아보자. 사용자가 AI 에이전트와 상호 작용하는 주요 방법은 채팅 인터페이스를 통한 대화이다. 하지만 모델은 개별 메시지를 기억하지 않으며, 모든 대화 내역이 하나의 단일 프롬프트로 변환된 후 모델에 전달된다. 이 과정에서 특수 토큰(Special Tokens)이 중요한 역할을 하며, 각 LLM 모델은 고유한 포맷을 요구한다.시스템 메시지와 역할 정의대화는 일반적으로 시스템 메시지(System Message), 사용자 메시지(User Message), 어시스턴트 메시지(Assistant Message)로 구성된.. 개인공부&프로젝트/LLM 에이전트 스터디 2025. 2. 15. Agent의 두뇌, LLM에 대해서 알아보자 Agent의 두뇌, LLM에 대해서 알아보자AI 에이전트의 핵심 구성 요소 중 하나는 AI 모델이며, 가장 일반적으로 사용되는 것이 대규모 언어 모델(LLM, Large Language Model)이다. 이번 글에서는 LLM이 무엇인지, 그리고 어떻게 에이전트를 구동하는지 간단히 살펴보도록 하자. LLM이란 무엇인가?LLM은 방대한 양의 텍스트 데이터를 학습하여 인간의 언어를 이해하고 생성할 수 있는 AI 모델이다. 이 모델들은 수백만에서 수십억 개의 매개변수(parameters)를 가지며, 텍스트의 패턴과 구조를 학습하여 자연스러운 언어 출력을 생성한다. 현대의 LLM은 Transformer 아키텍처를 기반으로 하며, 이 구조는 "Attention" 메커니즘을 활용하여 텍스트의 문맥을 효과적으로 이해하.. 개인공부&프로젝트/LLM 에이전트 스터디 2025. 2. 14. AI 에이전트에 대해서 알아보자 (feat. LLM) AI 에이전트에 대해서 알아보자 (feat. LLM)최근 AI(LLM)의 발전과 함께 '에이전트(Agent)'는 사용자의 목표를 달성하기 위해 환경과 상호 작용하며 추론(reasoning), 계획(planning), 행동(execution) 등의 과정을 수행하는 시스템으로 주목받고 있다. 나 또한 단순 텍스트 응답 외에 다양한 작업을 자유롭게 수행하는 에이전트에 관심이 생겼고, 이를 연구에 활용해보고자 하는 목표를 갖게 되었다. 따라서, 에이전트에 대한 본격적인 공부를 하기 앞서 에이전트가 무엇인지, 어떤 것을 할 수 있는지를 간단하게 알아보고자 한다.에이전트란 무엇인가?에이전트는 AI 모델을 활용하여 주어진 목표를 수행하는 시스템이다. 사용자의 요청을 이해하고, 계획을 세운 후 실행하는 능력을 갖춘 것.. 개인공부&프로젝트/LLM 에이전트 스터디 2025. 2. 13. 이전 1 다음