top of page

GPU 비용이 부담되시나요? AWS 구매 옵션별 최대72%

GPU 비용이 부담되시나요? 최대 72% 절감하는 3가지 방법. Savings Plans vs RI vs Capacity Blocks 비교. 스마일샤크.

Written by 정연주 | Edited by 윤효정

GPU 인스턴스 비용이 너무 부담스러운데, 절감할 수 있는 방법 없을까요?

p5.48xlarge 인스턴스를 온디맨드로 일주일만 써도 약 $3,600 이상. 예산이 한정된 기업에게 GPU 비용은 프로젝트의 가장 큰 장벽입니다. 이 글에서는 GPU 비용을 최대 72%까지 절감할 수 있는 구매 옵션을 비교하고, 상황별 선택 가이드를 정리했습니다.


✅ GPU 비용, 제대로 관리하고 계신가요?

17개 항목으로 GPU 누수를 점검해보세요 → [ 체크리스트 무료 다운로드 ]


1. GPU 구매 옵션 4가지, 한 눈에 보기

AWS에서는 GPU 인스턴스에 대해 여러 구매 옵션을 제공합니다. 각 옵션의 특징에 대해서 먼저 알아보도록 하겠습니다.

구매 옵션

최대 할인율

약정 기간

용량 보장

적합한 워크로드

On-Demand

0%(기준가)

없음

없음

단기 테스트, 예측 불가 워크로드

Savings Plans

최대 72%

1년 또는 3년

없음

장기적으로 안정적인 사용량

Reserved Instance (Zonal)

최대 72%

1년 또는 3년

보장

특정 AZ에서 장기 운영

Capacity Blocks

동적 가격

1일 ~ 6개월

보장

대규모 ML 학습, 마감이 있는 프로젝트

💡참고: Spot Instance는 최대 90% 할인이 가능하지만, 2분 전 중단 리스크와 운영 복잡성(체크 포인트 구성, Spot Fleet 관리 등)으로 인해 안정적인 GPU 워크로드에서는 권장하지 않아 본 블로그에서는 다루지 않습니다.




2. 각 옵션 별 상세 분석

1) Savings Plans: 최대 72% 할인으로 유연한 약정

Savings Plans는 1년 또는 3년 동안 일정 금액($/hour)의 컴퓨팅 사용을 약정하는 대신 할인을 받는 방식입니다.

유형

할인율

유연성

적용 범위

Compute Savings Plans

최대 66%

높음

EC2, Fargate, Lambda 전체

EC2 Savings Plans

최대 72%

중간

특정 인스턴스 패밀리, 리전

SageMaker Savings Plans

최대 64%

높음

SageMaker 전용

※ 2025년 6월 업데이트 된 내용: AWS는 P4d, P4de, P5, P5en 인스턴스에 대해 온디맨드 및 Savings Plans 가격을 최대 45% 인하했습니다. P6-B200 인스턴스도 Savings Plans로 구매 가능해졌습니다.

| 출처: AWS Savings Plans , AWS GPU Price Reduction Announcement


[ 장점 ]

  • 약정 금액 초과 사용분은 온디맨드 요금 적용

  • Compute SP는 인스턴스 패밀리, 리전, OS 변경 가능

  • 자동으로 최적의 할인율 적용

[ 단점 ]

  • 사용량이 약정보다 적어도 약정 금액 지불

  • 구매 후 변경/취소 불가

  • 용량이 보장되지 않음 (할인만 제공)

2) Reserved Instance: Regional VS. Zonal의 핵심 차이

Reserved Instance(RI)는 1년 또는 3년 약정으로 최대 72% 할인을 받는 전통적인 방식입니다. 많은 분들이 놓치는 중요한 차이가 있는데요, Regional RI와 Zonal RI는 용량 보장 여부가 다르다는 점입니다.

구분

Regional RI

Zonal RI

용량 보장

X

O

할인 적용 범위

리전 내 모든 AZ

지정한 AZ만

인스턴스 사이즈 유연성

O, 같은 패밀리 내 가능

X, 지정 사이즈만

가격

동일

동일

※ AWS 공식 문서에 따르면: 

  • "A regional Reserved Instance does not reserve capacity."

  • "A zonal Reserved Instance reserves capacity in the specified Availability Zone."

즉, Zonal RI를 구매하면 해당 AZ에서 용량이 보장됩니다.


[ 장점 ]

  • 비용 예측 가능 (월별 출렁임 없이 고정)

  • Zonal RI는 용량 보장으로 "GPU가 안 뜨는 상황" 방지

  • 최대 72% 할인으로 장기 운영 시 비용 효율적

[ 단점 ]

  • 최소 1년 약정 필수 → 단기 프로젝트에는 부담

  • 원하는 AZ에 쿼타가 없으면 Zonal RI 구매 자체가 어려울 수 있음

  • 대규모 분산 학습에 필요한 UltraCluster 환경 미지원

3) Capacity Blocks for ML: 용량 보장 + 단기 약정의 조합

EC2 Capacity Blocks for ML은 미래 특정 기간 동안 GPU 용량을 예약하는 서비스입니다. 가격은 수요와 공급에 따라 동적으로 결정되며, 용량이 100% 보장됩니다.


[지원 인스턴스 (2025년 1월 기준)]

P6 시리즈

P6e-GB200, P6-B300, P6-B200 (NVIDIA Blackwell GPU)

P5 시리즈

P5en, P5e, P5 (NVIDIA H200/H100 GPU)

P4 시리즈

P4d, P4de (NVIDIA A100 GPU)

Trainium

Trn2, Trn1

[ 장점 ]

  • H100 같은 고성능 GPU를 미리 확보해두고 시작 가능

  • 1년 약정 없이 1일~6개월 단위로 유연하게 사용

  • UltraCluster 배치로 대규모 분산 학습에 최적화된 네트워킹 제공

  • 당일부터 최대 8주 전까지 예약 가능 → 중요한 학습 일정 확실하게 계획

[ 단점 ]

  • 가격이 수요/공급에 따라 변동 → 이용 시점에 확인 필요

  • 장기 상시 워크로드에는 RI나 Savings Plans보다 비효율적

  • 지원 인스턴스가 ML용 고성능 GPU(P4d, P4de, P5, P6, Trn)로 제한적

  • 기존 RI/SP와 신청 방식이 달라 처음 사용 시 다소 생소할 수 있음


💡 Capacity Blocks 신청이 처음이라면, 스마일샤크에서 예약 타이밍부터 신청 절차까지 지원해 드립니다


[ 비용 절감 예시 ]

p4d.24xlarge 인스턴스 기준으로, 온디맨드 가격이 월 약 $16,029인 반면 Capacity Blocks를 이용하면 약 $8,496 수준으로 약 47% 절감이 가능합니다. (단, 가격은 수요/공급에 따라 변동됩니다.)


[ AWS 공식 사용 사례 ]

기업

활용 방식

Arcee

SLM(Small Language Model) 학습, 장기 약정 없이 유연한 GPU 확보

Dashtoon

Stable Diffusion XL 등 멀티모달 모델 학습, P5로 P4d 대비 3배 성능 구현

Leonardo.Ai

생성형 AI 모델 학습 및 실험, 다양한 인스턴스로 유연하게 전환



3. 용량 보장이 필요하다면? Zonal RI vs. Capacity Blocks

GPU 인스턴스 구매 시 Zonal RICapacity Blocks 모두 용량을 보장하지만, 적합한 상황이 다릅니다.

Zonal RI vs Capacity Blocks 선택 가이드 플로우차트. 시작에서 '용량 보장이 필요한가요?' 질문으로 분기. No면 Savings Plans 검토, Yes면 '1년 이상 사용 예정인가요?' 질문으로 이동. Yes면 Zonal RI 추천, No면 Capacity Blocks 추천.

구분

Zonal RI

Capacity Blocks

용량 보장

O

O

약정 기간

1년 또는 3년

1일 ~ 6개월

지원 인스턴스

대부분의 EC2

P4d, P5, P6, Trn 등 ML용 고성능만

네트워크

일반

UltraCluster (저지연, 고대역폭)

가격 구조

고정 (최대 72% 할인)

동적 (수요/공급에 따라 변동)

이런 경우엔 Zonal RI를 선택하세요!

  • GPU가 365일 거의 항상 켜져 있음

  • 특정 AZ에서 장기 운영이 확정

  • 비용을 매달 예측 가능하게 고정하고 싶음

이런 경우엔 Capacity Blocks를 선택하세요!

  • 1주~수개월짜리 마감이 있는 학습/파인튜닝 프로젝트

  • H100/H200 등 고성능 GPU를 반드시 확보해야 함

  • 대규모 분산 학습으로 저지연 네트워킹이 필요함



4. GPU 인스턴스 타입 선택 가이드

GPU 인스턴스를 선택할 때 가장 중요한 것은 GPU 메모리(VRAM)와 워크로드 특성입니다.

1) 추론/경량 학습용 - G 시리즈

인스턴스

GPU

GPU 메모리

주요 용도

G5

NVIDIA A10G

24GB/GPU

ML 추론, 그래픽 렌더링

G6

NVIDIA L4

24GB/GPU

추론, 비디오 처리

G6e

NVIDIA L40S

48GB/GPU

LLM 추론(13B 파라미터), 대규모 그래픽

2) 대규모 학습용 - P 시리즈

인스턴스

GPU

GPU 메모리

주요 용도

P4d

NVIDIA A100

40GB/GPU

대규모 ML 학습

P4de

NVIDIA A100

80GB/GPU

초대형 모델 학습

P5

NVIDIA H100

80GB/GPU

최신 LLM 학습

P6-B200

NVIDIA Blackwell

192GB/GPU

최첨단 AI 워크로드

※ 주의: 가격은 인스턴스 사이즈에 따라 다르므로 워크로드에 맞는 비교가 필요합니다!



5. 이런 실수, 하고 계시진 않나요?

AWS MSP 파트너로서 고객사 GPU 워크로드를 지원하면서 발견한 흔한 실수들을 공유합니다.

실수 1: GPU 메모리 용량 미확인

문제: 모델 학습 중 CUDA Out of Memory 에러 발생

해결: 인스턴스 선택 전 모델의 GPU 메모리 요구사항을 확인하세요.

  • G5/G6: 24GB/GPU → 7B 파라미터 모델까지 적합

  • G6e: 48GB/GPU → 13B 파라미터 모델까지 적합

  • P5: 80GB/GPU → 70B+ 파라미터 모델 학습 가능


실수 2: 인스턴스 당 GPU 개수 미확인

문제: g5.12xlarge를 주문했는데 예상보다 비용이 높음

해결: 인스턴스 사이즈별 GPU 개수를 확인하세요.

인스턴스

GPU 개수

총 GPU 메모리

g5.xlarge

1

24GB

g5.4xlarge

1

24GB

g5.12xlarge

4

96GB

g5.48xlarge

8

192GB

실수 3: 리전 선택 미고려

문제: 원하는 GPU 인스턴스의 쿼타를 받을 수 없음

해결: 

  • 서울 리전(ap-northeast-2)은 GPU 타입이 제한적

  • 지연 시간이 덜 중요한 학습 워크로드는 미국 리전(us-east-1, us-east-2) 활용 권장

  • Capacity Blocks는 현재 주로 미국 리전에서 사용 가능.


실수 4: Regional RI 와 Zonal RI 혼동

문제: RI를 구매했는데 용량이 보장되지 않음

해결: 용량 보장이 필요하면 반드시 Zonal RI(특정 AZ 지정)로 구매하세요. Regional RI는 할인만 제공하고 용량은 보장하지 않습니다.



6. 우리 회사 상황에 맞는 선택은?

AWS GPU 상황별 구매 전략 요약. 스타트업 초기 모델은 Savings Plans 추천(50~66% 절감), 프로덕션 추론 서비스는 Savings Plans 추천(50~72% 절감), 단기 LLM 학습은 Capacity Blocks 추천(40~50% 절감), 장기 GPU 운영은 Zonal RI 추천(최대 72% 절감).

시나리오 A: 스타트업의 초기 모델 실험

  • 추천: Savings Plans (Compute SP) + G5/G6 소규모로 시작

  • 이유: 유연한 약정으로 비용 절감과 안정적 운영 가능

  • 예상 절감: 50~66%

시나리오 B: 프로덕션 추론 서비스

  • 추천: Savings Plans (Compute SP 또는 EC2 Instance SP)

  • 이유: 안정적인 사용량, 장기 비용 최적화

  • 예상 절감: 50~72%

시나리오 C: 대규모 LLM 파인튜닝 (프로젝트 성)

  • 추천: Capacity Blocks (P5 또는 P4d)

  • 이유: 용량 보장, 마감 있는 프로젝트, 1년 약정 부담 없음

  • 예상 절감: 수요/공급에 따라 변동 (약 40-50% 수준)

시나리오 D: 특정 AZ에서 장기 GPU 운영

  • 추천: Zonal Reserved Instance

  • 이유: 용량 보장, 고정된 할인율

  • 예상 절감: 최대 72%



GPU 비용, 체계적으로 점검하고 계신가요?

지금까지 AWS GPU 인스턴스의 주요 구매 옵션(Savings Plans, Reserved Instance, Capacity Blocks)을 비교하고, 상황별 최적의 선택 기준을 살펴봤습니다.


하지만 실제로 우리 팀이 GPU 비용을 잘 관리하고 있는지, 놓치고 있는 부분은 없는지 점검해보신 적 있으신가요?


스마일샤크에서는 AWS MSP 파트너로서 다양한 고객사의 GPU 워크로드를 최적화해온 경험을 바탕으로, GPU 비용 최적화 셀프 체크리스트를 준비했습니다.



✅ 체크리스트에서 확인할 수 있는 내용:
☐ 인스턴스 선택 점검 (GPU 메모리, G vs P 시리즈 등)
☐ 구매 옵션 점검 (Savings Plans, Capacity Blocks 활용 여부)
☐ 운영 최적화 점검
☐ 모니터링 및 비용 관리
 

bottom of page