GPU 비용이 부담되시나요? AWS 구매 옵션별 최대72%
- SmileShark Team
- 1일 전
- 5분 분량

Written by 정연주 | Edited by 윤효정
GPU 인스턴스 비용이 너무 부담스러운데, 절감할 수 있는 방법 없을까요?
p5.48xlarge 인스턴스를 온디맨드로 일주일만 써도 약 $3,600 이상. 예산이 한정된 기업에게 GPU 비용은 프로젝트의 가장 큰 장벽입니다. 이 글에서는 GPU 비용을 최대 72%까지 절감할 수 있는 구매 옵션을 비교하고, 상황별 선택 가이드를 정리했습니다.
✅ GPU 비용, 제대로 관리하고 계신가요?
17개 항목으로 GPU 누수를 점검해보세요 → [ 체크리스트 무료 다운로드 ]
1. GPU 구매 옵션 4가지, 한 눈에 보기
AWS에서는 GPU 인스턴스에 대해 여러 구매 옵션을 제공합니다. 각 옵션의 특징에 대해서 먼저 알아보도록 하겠습니다.
구매 옵션 | 최대 할인율 | 약정 기간 | 용량 보장 | 적합한 워크로드 |
On-Demand | 0%(기준가) | 없음 | 없음 | 단기 테스트, 예측 불가 워크로드 |
Savings Plans | 최대 72% | 1년 또는 3년 | 없음 | 장기적으로 안정적인 사용량 |
Reserved Instance (Zonal) | 최대 72% | 1년 또는 3년 | 보장 | 특정 AZ에서 장기 운영 |
Capacity Blocks | 동적 가격 | 1일 ~ 6개월 | 보장 | 대규모 ML 학습, 마감이 있는 프로젝트 |
💡참고: Spot Instance는 최대 90% 할인이 가능하지만, 2분 전 중단 리스크와 운영 복잡성(체크 포인트 구성, Spot Fleet 관리 등)으로 인해 안정적인 GPU 워크로드에서는 권장하지 않아 본 블로그에서는 다루지 않습니다.
2. 각 옵션 별 상세 분석
1) Savings Plans: 최대 72% 할인으로 유연한 약정
Savings Plans는 1년 또는 3년 동안 일정 금액($/hour)의 컴퓨팅 사용을 약정하는 대신 할인을 받는 방식입니다.
유형 | 할인율 | 유연성 | 적용 범위 |
Compute Savings Plans | 최대 66% | 높음 | EC2, Fargate, Lambda 전체 |
EC2 Savings Plans | 최대 72% | 중간 | 특정 인스턴스 패밀리, 리전 |
SageMaker Savings Plans | 최대 64% | 높음 | SageMaker 전용 |
※ 2025년 6월 업데이트 된 내용: AWS는 P4d, P4de, P5, P5en 인스턴스에 대해 온디맨드 및 Savings Plans 가격을 최대 45% 인하했습니다. P6-B200 인스턴스도 Savings Plans로 구매 가능해졌습니다.
| 출처: AWS Savings Plans , AWS GPU Price Reduction Announcement
[ 장점 ]
약정 금액 초과 사용분은 온디맨드 요금 적용
Compute SP는 인스턴스 패밀리, 리전, OS 변경 가능
자동으로 최적의 할인율 적용
[ 단점 ]
사용량이 약정보다 적어도 약정 금액 지불
구매 후 변경/취소 불가
용량이 보장되지 않음 (할인만 제공)
2) Reserved Instance: Regional VS. Zonal의 핵심 차이
Reserved Instance(RI)는 1년 또는 3년 약정으로 최대 72% 할인을 받는 전통적인 방식입니다. 많은 분들이 놓치는 중요한 차이가 있는데요, Regional RI와 Zonal RI는 용량 보장 여부가 다르다는 점입니다.
구분 | Regional RI | Zonal RI |
용량 보장 | X | O |
할인 적용 범위 | 리전 내 모든 AZ | 지정한 AZ만 |
인스턴스 사이즈 유연성 | O, 같은 패밀리 내 가능 | X, 지정 사이즈만 |
가격 | 동일 | 동일 |
※ AWS 공식 문서에 따르면:
"A regional Reserved Instance does not reserve capacity."
"A zonal Reserved Instance reserves capacity in the specified Availability Zone."
즉, Zonal RI를 구매하면 해당 AZ에서 용량이 보장됩니다.
[ 장점 ]
비용 예측 가능 (월별 출렁임 없이 고정)
Zonal RI는 용량 보장으로 "GPU가 안 뜨는 상황" 방지
최대 72% 할인으로 장기 운영 시 비용 효율적
[ 단점 ]
최소 1년 약정 필수 → 단기 프로젝트에는 부담
원하는 AZ에 쿼타가 없으면 Zonal RI 구매 자체가 어려울 수 있음
대규모 분산 학습에 필요한 UltraCluster 환경 미지원
3) Capacity Blocks for ML: 용량 보장 + 단기 약정의 조합
EC2 Capacity Blocks for ML은 미래 특정 기간 동안 GPU 용량을 예약하는 서비스입니다. 가격은 수요와 공급에 따라 동적으로 결정되며, 용량이 100% 보장됩니다.
[지원 인스턴스 (2025년 1월 기준)]
P6 시리즈 | P6e-GB200, P6-B300, P6-B200 (NVIDIA Blackwell GPU) |
P5 시리즈 | P5en, P5e, P5 (NVIDIA H200/H100 GPU) |
P4 시리즈 | P4d, P4de (NVIDIA A100 GPU) |
Trainium | Trn2, Trn1 |
[ 장점 ]
H100 같은 고성능 GPU를 미리 확보해두고 시작 가능
1년 약정 없이 1일~6개월 단위로 유연하게 사용
UltraCluster 배치로 대규모 분산 학습에 최적화된 네트워킹 제공
당일부터 최대 8주 전까지 예약 가능 → 중요한 학습 일정 확실하게 계획
[ 단점 ]
가격이 수요/공급에 따라 변동 → 이용 시점에 확인 필요
장기 상시 워크로드에는 RI나 Savings Plans보다 비효율적
지원 인스턴스가 ML용 고성능 GPU(P4d, P4de, P5, P6, Trn)로 제한적
기존 RI/SP와 신청 방식이 달라 처음 사용 시 다소 생소할 수 있음
💡 Capacity Blocks 신청이 처음이라면, 스마일샤크에서 예약 타이밍부터 신청 절차까지 지원해 드립니다
[ 비용 절감 예시 ]
p4d.24xlarge 인스턴스 기준으로, 온디맨드 가격이 월 약 $16,029인 반면 Capacity Blocks를 이용하면 약 $8,496 수준으로 약 47% 절감이 가능합니다. (단, 가격은 수요/공급에 따라 변동됩니다.)
[ AWS 공식 사용 사례 ]
기업 | 활용 방식 |
Arcee | SLM(Small Language Model) 학습, 장기 약정 없이 유연한 GPU 확보 |
Dashtoon | Stable Diffusion XL 등 멀티모달 모델 학습, P5로 P4d 대비 3배 성능 구현 |
Leonardo.Ai | 생성형 AI 모델 학습 및 실험, 다양한 인스턴스로 유연하게 전환 |
| 출처: Amazon EC2 Capacity Blocks for ML, EC2 Capacity Blocks Documentation, EC2 Capacity Blocks Pricing
3. 용량 보장이 필요하다면? Zonal RI vs. Capacity Blocks
GPU 인스턴스 구매 시 Zonal RI와 Capacity Blocks 모두 용량을 보장하지만, 적합한 상황이 다릅니다.

구분 | Zonal RI | Capacity Blocks |
용량 보장 | O | O |
약정 기간 | 1년 또는 3년 | 1일 ~ 6개월 |
지원 인스턴스 | 대부분의 EC2 | P4d, P5, P6, Trn 등 ML용 고성능만 |
네트워크 | 일반 | UltraCluster (저지연, 고대역폭) |
가격 구조 | 고정 (최대 72% 할인) | 동적 (수요/공급에 따라 변동) |
이런 경우엔 Zonal RI를 선택하세요!
GPU가 365일 거의 항상 켜져 있음
특정 AZ에서 장기 운영이 확정됨
비용을 매달 예측 가능하게 고정하고 싶음
이런 경우엔 Capacity Blocks를 선택하세요!
1주~수개월짜리 마감이 있는 학습/파인튜닝 프로젝트
H100/H200 등 고성능 GPU를 반드시 확보해야 함
대규모 분산 학습으로 저지연 네트워킹이 필요함
4. GPU 인스턴스 타입 선택 가이드
GPU 인스턴스를 선택할 때 가장 중요한 것은 GPU 메모리(VRAM)와 워크로드 특성입니다.
1) 추론/경량 학습용 - G 시리즈
인스턴스 | GPU | GPU 메모리 | 주요 용도 |
G5 | NVIDIA A10G | 24GB/GPU | ML 추론, 그래픽 렌더링 |
G6 | NVIDIA L4 | 24GB/GPU | 추론, 비디오 처리 |
G6e | NVIDIA L40S | 48GB/GPU | LLM 추론(13B 파라미터), 대규모 그래픽 |
2) 대규모 학습용 - P 시리즈
인스턴스 | GPU | GPU 메모리 | 주요 용도 |
P4d | NVIDIA A100 | 40GB/GPU | 대규모 ML 학습 |
P4de | NVIDIA A100 | 80GB/GPU | 초대형 모델 학습 |
P5 | NVIDIA H100 | 80GB/GPU | 최신 LLM 학습 |
P6-B200 | NVIDIA Blackwell | 192GB/GPU | 최첨단 AI 워크로드 |
※ 주의: 가격은 인스턴스 사이즈에 따라 다르므로 워크로드에 맞는 비교가 필요합니다!
5. 이런 실수, 하고 계시진 않나요?
AWS MSP 파트너로서 고객사 GPU 워크로드를 지원하면서 발견한 흔한 실수들을 공유합니다.
실수 1: GPU 메모리 용량 미확인
문제: 모델 학습 중 CUDA Out of Memory 에러 발생
해결: 인스턴스 선택 전 모델의 GPU 메모리 요구사항을 확인하세요.
G5/G6: 24GB/GPU → 7B 파라미터 모델까지 적합
G6e: 48GB/GPU → 13B 파라미터 모델까지 적합
P5: 80GB/GPU → 70B+ 파라미터 모델 학습 가능
실수 2: 인스턴스 당 GPU 개수 미확인
문제: g5.12xlarge를 주문했는데 예상보다 비용이 높음
해결: 인스턴스 사이즈별 GPU 개수를 확인하세요.
인스턴스 | GPU 개수 | 총 GPU 메모리 |
g5.xlarge | 1 | 24GB |
g5.4xlarge | 1 | 24GB |
g5.12xlarge | 4 | 96GB |
g5.48xlarge | 8 | 192GB |
실수 3: 리전 선택 미고려
문제: 원하는 GPU 인스턴스의 쿼타를 받을 수 없음
해결:
서울 리전(ap-northeast-2)은 GPU 타입이 제한적
지연 시간이 덜 중요한 학습 워크로드는 미국 리전(us-east-1, us-east-2) 활용 권장
Capacity Blocks는 현재 주로 미국 리전에서 사용 가능.
실수 4: Regional RI 와 Zonal RI 혼동
문제: RI를 구매했는데 용량이 보장되지 않음
해결: 용량 보장이 필요하면 반드시 Zonal RI(특정 AZ 지정)로 구매하세요. Regional RI는 할인만 제공하고 용량은 보장하지 않습니다.
6. 우리 회사 상황에 맞는 선택은?

시나리오 A: 스타트업의 초기 모델 실험
추천: Savings Plans (Compute SP) + G5/G6 소규모로 시작
이유: 유연한 약정으로 비용 절감과 안정적 운영 가능
예상 절감: 50~66%
시나리오 B: 프로덕션 추론 서비스
추천: Savings Plans (Compute SP 또는 EC2 Instance SP)
이유: 안정적인 사용량, 장기 비용 최적화
예상 절감: 50~72%
시나리오 C: 대규모 LLM 파인튜닝 (프로젝트 성)
추천: Capacity Blocks (P5 또는 P4d)
이유: 용량 보장, 마감 있는 프로젝트, 1년 약정 부담 없음
예상 절감: 수요/공급에 따라 변동 (약 40-50% 수준)
시나리오 D: 특정 AZ에서 장기 GPU 운영
추천: Zonal Reserved Instance
이유: 용량 보장, 고정된 할인율
예상 절감: 최대 72%
GPU 비용, 체계적으로 점검하고 계신가요?
지금까지 AWS GPU 인스턴스의 주요 구매 옵션(Savings Plans, Reserved Instance, Capacity Blocks)을 비교하고, 상황별 최적의 선택 기준을 살펴봤습니다.
하지만 실제로 우리 팀이 GPU 비용을 잘 관리하고 있는지, 놓치고 있는 부분은 없는지 점검해보신 적 있으신가요?
스마일샤크에서는 AWS MSP 파트너로서 다양한 고객사의 GPU 워크로드를 최적화해온 경험을 바탕으로, GPU 비용 최적화 셀프 체크리스트를 준비했습니다.
✅ 체크리스트에서 확인할 수 있는 내용:
☐ 인스턴스 선택 점검 (GPU 메모리, G vs P 시리즈 등)
☐ 구매 옵션 점검 (Savings Plans, Capacity Blocks 활용 여부)
☐ 운영 최적화 점검
☐ 모니터링 및 비용 관리







