클라우드 기반 GPU 컴퓨팅 플랫폼, 런팟(RunPod) 사용법
런팟 소개
런팟(RunPod)은 인공지능 및 머신러닝 모델의 개발, 학습, 배포를 위한 클라우드 기반 GPU 플랫폼이다. 사용자는 필요에 따라 GPU 인스턴스를 신속하게 생성하고, 서버리스 환경에서 AI 애플리케이션을 확장할 수 있다.
런팟은 Multi-GPU를 사용할 수 있도록 지원하기 때문에 복잡한 인공지능 모델의 개발이나 대규모 데이터 처리 시 코랩 등에 비해 효율적이고 빠르게 진행할 수 있다는 장점을 가지고 있다. 런팟은 다양한 GPU 옵션을 통해 경제적인 선택이 가능하다. 예를 들어, NVIDIA A100 SXM 80GB GPU를 시간당 $1.89에 이용할 수 있다.
이처럼, 런팟은 리소스를 충분히 확보하지 못한 데이터 엔지니어들에게 큰 힘이 되어주는 효율적이면서 가성비도 좋은 컴퓨팅 플랫폼이다.
이 글에서는 이러한 런팟 플랫폼을 이용하는 방법에 대해서 설명하겠다.
런팟 회원가입과 포드 구성
런팟 이용을 위해서는 먼저 회원가입과 크레딧 구매를 해야한다. 다음 사이트에 접속하여 회원가입을 진행하도록 하자.
https://www.runpod.io/console/pods
www.runpod.io
로그인을 완료하면 다음과 같은 화면을 확인할 수 있다. 화면 왼쪽에서 서비스를 확인할 수 있고, 가운데에서는 일자별 사용량과 요금이 표시된다.
로그인을 완료했다면, 왼쪽 메뉴바에서 [Billing] 탭을 눌러 크레딧을 구매하도록 하자. Billing을 진행하고 나면 다음과 같은 화면을 확인할 수 있다. [Deploy a Pod] 버튼을 클릭해 포드 구성 화면으로 넘어가자.
포드 구성 화면으로 넘어가면 다음처럼 다양한 GPU 옵션과 요금 정보를 확인할 수 있다. 이 중 본인의 요구 사용량에 맞춰서 GPU를 선택하자. 필자는 40GB의 vRAM이 필요하기 때문에 현시점 vRAM 40GB 이상 인스턴스 중 가장 저렴한 RTX 6000 Ada를 선택하겠다.
GPU 인스턴스를 선택하고 나면 사용할 이미지와 GPU 개수 등을 선택할 수 있다. 또한 요금제를 선택할 수 있는데, 각 요금제 아래에 적힌 설명을 잘 읽고 본인에게 맞는 요금제를 선택하면 된다. 만약 본인이 지속적인 사용이 필요하다면, Saving Plan을 선택하는 것을 추천한다. 필자는 필요한 만큼만 사용할 예정이기 때문에 사용량만큼만 가격을 지불하는 On-Demand를 선택하였다.
여기서 이미지 하단의 [Edit Template]를 선택하면 컨테이너 디스크, 볼륨 디스크 용량과 볼륨이 마운트 될 경로 등을 설정할 수 있다. 여기서 Container Disk는 GPU 컨테이너 실행 중 발생하는 데이터를 저장하는 역할을 하며, Volume Disk는 GPU 컨테이너를 사용하지 않을 때 데이터를 저장하는 역할을 한다.
GPU를 사용하지 않는 상황이 하루 이상 지속될 경우 RunPod 측에서 대여한 GPU를 삭제하는 경우가 종종 있기 때문에 데이터 손실을 방지하기 위해 Volume Disk를 충분히 늘려놓도록 하자. 이는 추후에도 변경이 가능하니 필요한 경우 조정하면 된다.
모든 작업이 완료되었다면 하단의 Pricing Summary와 Pod Summary를 확인하고 원하는 스펙이 맞다면 Deploy 버튼을 선택하자. 이때 포드가 Running 될 때까지 약간 시간이 걸린다. Running으로 상태가 변경되고 나면 포드가 실행된다. 옆의 화살표를 눌러 좌측 하단의 [Connect]를 눌러 접속하도록 하자.
포드를 잠시 동안 멈추고 싶다면 정지 버튼을 눌러 불필요한 과금이 발생하지 않도록 하자. 또, 이제 더 이상 필요하지 않은 경우에는 제거 버튼을 클릭하여 인스턴스를 완전히 반납하도록 하자.
끝!
'개인공부&프로젝트' 카테고리의 다른 글
멀티헤드 어텐션 & 피드포워드 (0) | 2025.01.04 |
---|---|
언어 모델 구조 및 셀프 어텐션 메커니즘 이해 (0) | 2024.12.31 |
NLP 이해와 런팟 설치 (0) | 2024.12.31 |
배치 사이즈가 1인 배치 처리와 스트리밍 처리는 같은가? (0) | 2024.12.28 |
OSError: [Errno 28] No space left on device 해결 (2) | 2024.12.05 |
댓글