GPU ๋น์ฉ์ด ๋ถ๋ด๋์๋์? AWS ๊ตฌ๋งค ์ต์ ๋ณ ์ต๋ 72% ์ ๊ฐํ๋ 3๊ฐ์ง ๋ฐฉ๋ฒ
- 2์ 4์ผ
- 5๋ถ ๋ถ๋
์ต์ข ์์ ์ผ: 5์ 15์ผ

Written by ์ ์ฐ์ฃผ | Edited by ์คํจ์
GPU ์ธ์คํด์ค ๋น์ฉ์ด ๋๋ฌด ๋ถ๋ด์ค๋ฌ์ด๋ฐ, ์ ๊ฐํ ์ ์๋ ๋ฐฉ๋ฒ ์์๊น์?
p5.48xlarge ์ธ์คํด์ค๋ฅผ ์จ๋๋งจ๋๋ก ์ผ์ฃผ์ผ๋ง ์จ๋ ์ฝ $3,600 ์ด์. ์์ฐ์ด ํ์ ๋ ๊ธฐ์ ์๊ฒ GPU ๋น์ฉ์ ํ๋ก์ ํธ์ ๊ฐ์ฅ ํฐ ์ฅ๋ฒฝ์ ๋๋ค. ์ด ๊ธ์์๋ GPU ๋น์ฉ์ ์ต๋ 72%๊น์ง ์ ๊ฐํ ์ ์๋ ๊ตฌ๋งค ์ต์ ์ ๋น๊ตํ๊ณ , ์ํฉ๋ณ ์ ํ ๊ฐ์ด๋๋ฅผ ์ ๋ฆฌํ์ต๋๋ค.
โ GPU ๋น์ฉ, ์ ๋๋ก ๊ด๋ฆฌํ๊ณ ๊ณ์ ๊ฐ์?
17๊ฐ ํญ๋ชฉ์ผ๋ก GPU ๋์๋ฅผ ์ ๊ฒํด๋ณด์ธ์ โ [ ์ฒดํฌ๋ฆฌ์คํธ ๋ฌด๋ฃ ๋ค์ด๋ก๋ ]
1. GPU ๊ตฌ๋งค ์ต์ 4๊ฐ์ง, ํ ๋์ ๋ณด๊ธฐ
AWS์์๋ GPU ์ธ์คํด์ค์ ๋ํด ์ฌ๋ฌ ๊ตฌ๋งค ์ต์ ์ ์ ๊ณตํฉ๋๋ค. ๊ฐ ์ต์ ์ ํน์ง์ ๋ํด์ ๋จผ์ ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
๊ตฌ๋งค ์ต์ | ์ต๋ ํ ์ธ์จ | ์ฝ์ ๊ธฐ๊ฐ | ์ฉ๋ ๋ณด์ฅ | ์ ํฉํ ์ํฌ๋ก๋ |
On-Demand | 0%(๊ธฐ์ค๊ฐ) | ์์ | ์์ | ๋จ๊ธฐ ํ ์คํธ, ์์ธก ๋ถ๊ฐ ์ํฌ๋ก๋ |
Savings Plans | ์ต๋ 72% | 1๋ ๋๋ 3๋ | ์์ | ์ฅ๊ธฐ์ ์ผ๋ก ์์ ์ ์ธ ์ฌ์ฉ๋ |
Reserved Instance (Zonal) | ์ต๋ 72% | 1๋ ๋๋ 3๋ | ๋ณด์ฅ | ํน์ AZ์์ ์ฅ๊ธฐ ์ด์ |
Capacity Blocks | ๋์ ๊ฐ๊ฒฉ | 1์ผ ~ 6๊ฐ์ | ๋ณด์ฅ | ๋๊ท๋ชจ ML ํ์ต, ๋ง๊ฐ์ด ์๋ ํ๋ก์ ํธ |
๐ก์ฐธ๊ณ : Spot Instance๋ ์ต๋ 90% ํ ์ธ์ด ๊ฐ๋ฅํ์ง๋ง, 2๋ถ ์ ์ค๋จ ๋ฆฌ์คํฌ์ ์ด์ ๋ณต์ก์ฑ(์ฒดํฌ ํฌ์ธํธ ๊ตฌ์ฑ, Spot Fleet ๊ด๋ฆฌ ๋ฑ)์ผ๋ก ์ธํด ์์ ์ ์ธ GPU ์ํฌ๋ก๋์์๋ ๊ถ์ฅํ์ง ์์ ๋ณธ ๋ธ๋ก๊ทธ์์๋ ๋ค๋ฃจ์ง ์์ต๋๋ค.
| ์ถ์ฒ: Amazon EC2 Pricing, EC2 Capacity Blocks for ML
2. ๊ฐ ์ต์ ๋ณ ์์ธ ๋ถ์
1) Savings Plans: ์ต๋ 72% ํ ์ธ์ผ๋ก ์ ์ฐํ ์ฝ์
Savings Plans๋ 1๋ ๋๋ 3๋ ๋์ ์ผ์ ๊ธ์ก($/hour)์ ์ปดํจํ ์ฌ์ฉ์ ์ฝ์ ํ๋ ๋์ ํ ์ธ์ ๋ฐ๋ ๋ฐฉ์์ ๋๋ค.
์ ํ | ํ ์ธ์จ | ์ ์ฐ์ฑ | ์ ์ฉ ๋ฒ์ |
Compute Savings Plans | ์ต๋ 66% | ๋์ | EC2, Fargate, Lambda ์ ์ฒด |
EC2 Savings Plans | ์ต๋ 72% | ์ค๊ฐ | ํน์ ์ธ์คํด์ค ํจ๋ฐ๋ฆฌ, ๋ฆฌ์ |
SageMaker Savings Plans | ์ต๋ 64% | ๋์ | SageMaker ์ ์ฉ |
โป 2025๋ 6์ ์ ๋ฐ์ดํธ ๋ ๋ด์ฉ:ย AWS๋ P4d, P4de, P5, P5en ์ธ์คํด์ค์ ๋ํด ์จ๋๋งจ๋ ๋ฐ Savings Plans ๊ฐ๊ฒฉ์ ์ต๋ 45% ์ธํํ์ต๋๋ค. P6-B200 ์ธ์คํด์ค๋ Savings Plans๋ก ๊ตฌ๋งค ๊ฐ๋ฅํด์ก์ต๋๋ค.
| ์ถ์ฒ: AWS Savings Plans , AWS GPU Price Reduction Announcement
[ ์ฅ์ ]
์ฝ์ ๊ธ์ก ์ด๊ณผ ์ฌ์ฉ๋ถ์ ์จ๋๋งจ๋ ์๊ธ ์ ์ฉ
Compute SP๋ ์ธ์คํด์ค ํจ๋ฐ๋ฆฌ, ๋ฆฌ์ , OS ๋ณ๊ฒฝ ๊ฐ๋ฅ
์๋์ผ๋ก ์ต์ ์ ํ ์ธ์จ ์ ์ฉ
[ ๋จ์ ]
์ฌ์ฉ๋์ด ์ฝ์ ๋ณด๋ค ์ ์ด๋ ์ฝ์ ๊ธ์ก ์ง๋ถ
๊ตฌ๋งค ํ ๋ณ๊ฒฝ/์ทจ์ ๋ถ๊ฐ
์ฉ๋์ด ๋ณด์ฅ๋์ง ์์ย (ํ ์ธ๋ง ์ ๊ณต)
2) Reserved Instance: Regional VS. Zonal์ ํต์ฌ ์ฐจ์ด
Reserved Instance(RI)๋ 1๋ ๋๋ 3๋ ์ฝ์ ์ผ๋ก ์ต๋ 72% ํ ์ธ์ ๋ฐ๋ ์ ํต์ ์ธ ๋ฐฉ์์ ๋๋ค. ๋ง์ ๋ถ๋ค์ด ๋์น๋ ์ค์ํ ์ฐจ์ด๊ฐ ์๋๋ฐ์, Regional RI์ Zonal RI๋ ์ฉ๋ ๋ณด์ฅ ์ฌ๋ถ๊ฐ ๋ค๋ฅด๋ค๋ ์ ์ ๋๋ค.
๊ตฌ๋ถ | Regional RI | Zonal RI |
์ฉ๋ ๋ณด์ฅ | X | O |
ํ ์ธ ์ ์ฉ ๋ฒ์ | ๋ฆฌ์ ๋ด ๋ชจ๋ AZ | ์ง์ ํ AZ๋ง |
์ธ์คํด์ค ์ฌ์ด์ฆ ์ ์ฐ์ฑ | O, ๊ฐ์ ํจ๋ฐ๋ฆฌ ๋ด ๊ฐ๋ฅ | X, ์ง์ ์ฌ์ด์ฆ๋ง |
๊ฐ๊ฒฉ | ๋์ผ | ๋์ผ |
โป AWS ๊ณต์ ๋ฌธ์์ ๋ฐ๋ฅด๋ฉด:ย
"A regional Reserved Instance does notย reserve capacity."
"A zonal Reserved Instance reserves capacity in the specified Availability Zone."
์ฆ, Zonal RI๋ฅผ ๊ตฌ๋งคํ๋ฉด ํด๋น AZ์์ ์ฉ๋์ด ๋ณด์ฅ๋ฉ๋๋ค.
[ ์ฅ์ ]
๋น์ฉ ์์ธก ๊ฐ๋ฅ (์๋ณ ์ถ๋ ์ ์์ด ๊ณ ์ )
Zonal RI๋ ์ฉ๋ ๋ณด์ฅ์ผ๋ก "GPU๊ฐ ์ ๋จ๋ ์ํฉ" ๋ฐฉ์ง
์ต๋ 72% ํ ์ธ์ผ๋ก ์ฅ๊ธฐ ์ด์ ์ ๋น์ฉ ํจ์จ์
[ ๋จ์ ]
์ต์ 1๋ ์ฝ์ ํ์ โ ๋จ๊ธฐ ํ๋ก์ ํธ์๋ ๋ถ๋ด
์ํ๋ AZ์ ์ฟผํ๊ฐ ์์ผ๋ฉด Zonal RI ๊ตฌ๋งค ์์ฒด๊ฐ ์ด๋ ค์ธ ์ ์์
๋๊ท๋ชจ ๋ถ์ฐ ํ์ต์ ํ์ํ UltraCluster ํ๊ฒฝ ๋ฏธ์ง์
3) Capacity Blocks for ML: ์ฉ๋ ๋ณด์ฅ + ๋จ๊ธฐ ์ฝ์ ์ ์กฐํฉ
EC2 Capacity Blocks for ML์ ๋ฏธ๋ ํน์ ๊ธฐ๊ฐ ๋์ GPU ์ฉ๋์ ์์ฝํ๋ ์๋น์ค์ ๋๋ค. ๊ฐ๊ฒฉ์ ์์์ ๊ณต๊ธ์ ๋ฐ๋ผ ๋์ ์ผ๋ก ๊ฒฐ์ ๋๋ฉฐ, ์ฉ๋์ด 100% ๋ณด์ฅ๋ฉ๋๋ค.
[์ง์ ์ธ์คํด์ค (2025๋ 1์ ๊ธฐ์ค)]
P6 ์๋ฆฌ์ฆ | P6e-GB200, P6-B300, P6-B200 (NVIDIA Blackwell GPU) |
P5 ์๋ฆฌ์ฆ | P5en, P5e, P5 (NVIDIA H200/H100 GPU) |
P4 ์๋ฆฌ์ฆ | P4d, P4de (NVIDIA A100 GPU) |
Trainium | Trn2, Trn1 |
[ ์ฅ์ ]
H100 ๊ฐ์ ๊ณ ์ฑ๋ฅ GPU๋ฅผ ๋ฏธ๋ฆฌ ํ๋ณดํด๋๊ณ ์์ย ๊ฐ๋ฅ
1๋ ์ฝ์ ์์ด 1์ผ~6๊ฐ์ย ๋จ์๋ก ์ ์ฐํ๊ฒ ์ฌ์ฉ
UltraCluster ๋ฐฐ์น๋ก ๋๊ท๋ชจ ๋ถ์ฐ ํ์ต์ ์ต์ ํ๋ ๋คํธ์ํน ์ ๊ณต
๋น์ผ๋ถํฐ ์ต๋ 8์ฃผ ์ ๊น์งย ์์ฝ ๊ฐ๋ฅ โ ์ค์ํ ํ์ต ์ผ์ ํ์คํ๊ฒ ๊ณํ
[ ๋จ์ ]
๊ฐ๊ฒฉ์ด ์์/๊ณต๊ธ์ ๋ฐ๋ผ ๋ณ๋ โ ์ด์ฉ ์์ ์ ํ์ธ ํ์
์ฅ๊ธฐ ์์ ์ํฌ๋ก๋์๋ RI๋ Savings Plans๋ณด๋ค ๋นํจ์จ์
์ง์ ์ธ์คํด์ค๊ฐ ML์ฉ ๊ณ ์ฑ๋ฅ GPU(P4d, P4de, P5, P6, Trn)๋ก ์ ํ์
๊ธฐ์กด RI/SP์ ์ ์ฒญ ๋ฐฉ์์ด ๋ฌ๋ผ ์ฒ์ ์ฌ์ฉ ์ ๋ค์ ์์ํ ์ ์์
๐ก Capacity Blocks ์ ์ฒญ์ด ์ฒ์์ด๋ผ๋ฉด, ์ค๋ง์ผ์คํฌ์์ ์์ฝ ํ์ด๋ฐ๋ถํฐ ์ ์ฒญ ์ ์ฐจ๊น์ง ์ง์ํด ๋๋ฆฝ๋๋ค
[ ๋น์ฉ ์ ๊ฐ ์์ ]
p4d.24xlarge ์ธ์คํด์ค ๊ธฐ์ค์ผ๋ก, ์จ๋๋งจ๋ ๊ฐ๊ฒฉ์ด ์ ์ฝ $16,029์ธ ๋ฐ๋ฉด Capacity Blocks๋ฅผ ์ด์ฉํ๋ฉด ์ฝ $8,496 ์์ค์ผ๋ก ์ฝ 47% ์ ๊ฐ์ด ๊ฐ๋ฅํฉ๋๋ค. (๋จ, ๊ฐ๊ฒฉ์ ์์/๊ณต๊ธ์ ๋ฐ๋ผ ๋ณ๋๋ฉ๋๋ค.)
[ AWS ๊ณต์ ์ฌ์ฉ ์ฌ๋ก ]
๊ธฐ์ | ํ์ฉ ๋ฐฉ์ |
Arcee | SLM(Small Language Model) ํ์ต, ์ฅ๊ธฐ ์ฝ์ ์์ด ์ ์ฐํ GPU ํ๋ณด |
Dashtoon | Stable Diffusion XL ๋ฑ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ ํ์ต, P5๋ก P4d ๋๋น 3๋ฐฐ ์ฑ๋ฅ ๊ตฌํ |
Leonardo.Ai | ์์ฑํ AI ๋ชจ๋ธ ํ์ต ๋ฐ ์คํ, ๋ค์ํ ์ธ์คํด์ค๋ก ์ ์ฐํ๊ฒ ์ ํ |
| ์ถ์ฒ: Amazon EC2 Capacity Blocks for ML, EC2 Capacity Blocks Documentation, EC2 Capacity Blocks Pricing
3. ์ฉ๋ ๋ณด์ฅ์ด ํ์ํ๋ค๋ฉด? Zonal RI vs. Capacity Blocks
GPU ์ธ์คํด์ค ๊ตฌ๋งค ์ Zonal RI์ Capacity Blocks ๋ชจ๋ ์ฉ๋์ ๋ณด์ฅํ์ง๋ง, ์ ํฉํ ์ํฉ์ด ๋ค๋ฆ ๋๋ค.

๊ตฌ๋ถ | Zonal RI | Capacity Blocks |
์ฉ๋ ๋ณด์ฅ | O | O |
์ฝ์ ๊ธฐ๊ฐ | 1๋ ๋๋ 3๋ | 1์ผ ~ 6๊ฐ์ |
์ง์ ์ธ์คํด์ค | ๋๋ถ๋ถ์ EC2 | P4d, P5, P6, Trn ๋ฑ ML์ฉ ๊ณ ์ฑ๋ฅ๋ง |
๋คํธ์ํฌ | ์ผ๋ฐ | UltraCluster (์ ์ง์ฐ, ๊ณ ๋์ญํญ) |
๊ฐ๊ฒฉ ๊ตฌ์กฐ | ๊ณ ์ (์ต๋ 72% ํ ์ธ) | ๋์ (์์/๊ณต๊ธ์ ๋ฐ๋ผ ๋ณ๋) |
์ด๋ฐ ๊ฒฝ์ฐ์ Zonal RI๋ฅผ ์ ํํ์ธ์!
GPU๊ฐ 365์ผ ๊ฑฐ์ ํญ์ ์ผ์ ธ ์์
ํน์ AZ์์ ์ฅ๊ธฐ ์ด์์ด ํ์ ๋จ
๋น์ฉ์ ๋งค๋ฌ ์์ธก ๊ฐ๋ฅํ๊ฒ ๊ณ ์ ํ๊ณ ์ถ์
์ด๋ฐ ๊ฒฝ์ฐ์ Capacity Blocks๋ฅผ ์ ํํ์ธ์!
1์ฃผ~์๊ฐ์์ง๋ฆฌย ๋ง๊ฐ์ด ์๋ ํ์ต/ํ์ธํ๋ ํ๋ก์ ํธ
H100/H200 ๋ฑ ๊ณ ์ฑ๋ฅ GPU๋ฅผ ๋ฐ๋์ ํ๋ณดํด์ผ ํจ
๋๊ท๋ชจ ๋ถ์ฐ ํ์ต์ผ๋ก ์ ์ง์ฐ ๋คํธ์ํน์ด ํ์ํจ
4. GPU ์ธ์คํด์ค ํ์ ์ ํ ๊ฐ์ด๋
GPU ์ธ์คํด์ค๋ฅผ ์ ํํ ๋ ๊ฐ์ฅ ์ค์ํ ๊ฒ์ GPU ๋ฉ๋ชจ๋ฆฌ(VRAM)์ ์ํฌ๋ก๋ ํน์ฑ์ ๋๋ค.
1) ์ถ๋ก /๊ฒฝ๋ ํ์ต์ฉ - G ์๋ฆฌ์ฆ
์ธ์คํด์ค | GPU | GPU ๋ฉ๋ชจ๋ฆฌ | ์ฃผ์ ์ฉ๋ |
G5 | NVIDIA A10G | 24GB/GPU | ML ์ถ๋ก , ๊ทธ๋ํฝ ๋ ๋๋ง |
G6 | NVIDIA L4 | 24GB/GPU | ์ถ๋ก , ๋น๋์ค ์ฒ๋ฆฌ |
G6e | NVIDIA L40S | 48GB/GPU | LLM ์ถ๋ก (13B ํ๋ผ๋ฏธํฐ), ๋๊ท๋ชจ ๊ทธ๋ํฝ |
2) ๋๊ท๋ชจ ํ์ต์ฉ - P ์๋ฆฌ์ฆ
์ธ์คํด์ค | GPU | GPU ๋ฉ๋ชจ๋ฆฌ | ์ฃผ์ ์ฉ๋ |
P4d | NVIDIA A100 | 40GB/GPU | ๋๊ท๋ชจ ML ํ์ต |
P4de | NVIDIA A100 | 80GB/GPU | ์ด๋ํ ๋ชจ๋ธ ํ์ต |
P5 | NVIDIA H100 | 80GB/GPU | ์ต์ LLM ํ์ต |
P6-B200 | NVIDIA Blackwell | 192GB/GPU | ์ต์ฒจ๋จ AI ์ํฌ๋ก๋ |
โป ์ฃผ์:ย ๊ฐ๊ฒฉ์ ์ธ์คํด์ค ์ฌ์ด์ฆ์ ๋ฐ๋ผ ๋ค๋ฅด๋ฏ๋ก ์ํฌ๋ก๋์ ๋ง๋ ๋น๊ต๊ฐ ํ์ํฉ๋๋ค!
5. ์ด๋ฐ ์ค์, ํ๊ณ ๊ณ์์ง ์๋์?
AWS MSP ํํธ๋๋ก์ ๊ณ ๊ฐ์ฌ GPU ์ํฌ๋ก๋๋ฅผ ์ง์ํ๋ฉด์ ๋ฐ๊ฒฌํ ํํ ์ค์๋ค์ ๊ณต์ ํฉ๋๋ค.
์ค์ 1: GPU ๋ฉ๋ชจ๋ฆฌ ์ฉ๋ ๋ฏธํ์ธ
๋ฌธ์ : ๋ชจ๋ธ ํ์ต ์ค CUDA Out of Memory ์๋ฌ ๋ฐ์
ํด๊ฒฐ: ์ธ์คํด์ค ์ ํ ์ ๋ชจ๋ธ์ GPU ๋ฉ๋ชจ๋ฆฌ ์๊ตฌ์ฌํญ์ ํ์ธํ์ธ์.
G5/G6: 24GB/GPU โ 7B ํ๋ผ๋ฏธํฐ ๋ชจ๋ธ๊น์ง ์ ํฉ
G6e: 48GB/GPU โ 13B ํ๋ผ๋ฏธํฐ ๋ชจ๋ธ๊น์ง ์ ํฉ
P5: 80GB/GPU โ 70B+ ํ๋ผ๋ฏธํฐ ๋ชจ๋ธ ํ์ต ๊ฐ๋ฅ
์ค์ 2: ์ธ์คํด์ค ๋น GPU ๊ฐ์ ๋ฏธํ์ธ
๋ฌธ์ :ย g5.12xlarge๋ฅผ ์ฃผ๋ฌธํ๋๋ฐ ์์๋ณด๋ค ๋น์ฉ์ด ๋์
ํด๊ฒฐ:ย ์ธ์คํด์ค ์ฌ์ด์ฆ๋ณ GPU ๊ฐ์๋ฅผ ํ์ธํ์ธ์.
์ธ์คํด์ค | GPU ๊ฐ์ | ์ด GPU ๋ฉ๋ชจ๋ฆฌ |
g5.xlarge | 1 | 24GB |
g5.4xlarge | 1 | 24GB |
g5.12xlarge | 4 | 96GB |
g5.48xlarge | 8 | 192GB |
์ค์ 3: ๋ฆฌ์ ์ ํ ๋ฏธ๊ณ ๋ ค
๋ฌธ์ :ย ์ํ๋ GPU ์ธ์คํด์ค์ ์ฟผํ๋ฅผ ๋ฐ์ ์ ์์
ํด๊ฒฐ:ย
์์ธ ๋ฆฌ์ (ap-northeast-2)์ GPU ํ์ ์ด ์ ํ์
์ง์ฐ ์๊ฐ์ด ๋ ์ค์ํ ํ์ต ์ํฌ๋ก๋๋ ๋ฏธ๊ตญ ๋ฆฌ์ (us-east-1, us-east-2) ํ์ฉ ๊ถ์ฅ
Capacity Blocks๋ ํ์ฌ ์ฃผ๋ก ๋ฏธ๊ตญ ๋ฆฌ์ ์์ ์ฌ์ฉ ๊ฐ๋ฅ.
์ค์ 4: Regional RI ์ Zonal RI ํผ๋
๋ฌธ์ :ย RI๋ฅผ ๊ตฌ๋งคํ๋๋ฐ ์ฉ๋์ด ๋ณด์ฅ๋์ง ์์
ํด๊ฒฐ: ์ฉ๋ ๋ณด์ฅ์ด ํ์ํ๋ฉด ๋ฐ๋์ Zonal RI(ํน์ AZ ์ง์ )๋ก ๊ตฌ๋งคํ์ธ์. Regional RI๋ ํ ์ธ๋ง ์ ๊ณตํ๊ณ ์ฉ๋์ ๋ณด์ฅํ์ง ์์ต๋๋ค.
6. ์ฐ๋ฆฌ ํ์ฌ ์ํฉ์ ๋ง๋ ์ ํ์?

์๋๋ฆฌ์ค A: ์คํํธ์ ์ ์ด๊ธฐ ๋ชจ๋ธ ์คํ
์ถ์ฒ: Savings Plans (Compute SP) + G5/G6 ์๊ท๋ชจ๋ก ์์
์ด์ : ์ ์ฐํ ์ฝ์ ์ผ๋ก ๋น์ฉ ์ ๊ฐ๊ณผ ์์ ์ ์ด์ ๊ฐ๋ฅ
์์ ์ ๊ฐ: 50~66%
์๋๋ฆฌ์ค B: ํ๋ก๋์ ์ถ๋ก ์๋น์ค
์ถ์ฒ: Savings Plans (Compute SP ๋๋ EC2 Instance SP)
์ด์ : ์์ ์ ์ธ ์ฌ์ฉ๋, ์ฅ๊ธฐ ๋น์ฉ ์ต์ ํ
์์ ์ ๊ฐ: 50~72%
์๋๋ฆฌ์ค C: ๋๊ท๋ชจ LLM ํ์ธํ๋ (ํ๋ก์ ํธ ์ฑ)
์ถ์ฒ: Capacity Blocks (P5 ๋๋ P4d)
์ด์ : ์ฉ๋ ๋ณด์ฅ, ๋ง๊ฐ ์๋ ํ๋ก์ ํธ, 1๋ ์ฝ์ ๋ถ๋ด ์์
์์ ์ ๊ฐ: ์์/๊ณต๊ธ์ ๋ฐ๋ผ ๋ณ๋ (์ฝ 40-50% ์์ค)
์๋๋ฆฌ์ค D: ํน์ AZ์์ ์ฅ๊ธฐ GPU ์ด์
์ถ์ฒ: Zonal Reserved Instance
์ด์ : ์ฉ๋ ๋ณด์ฅ, ๊ณ ์ ๋ ํ ์ธ์จ
์์ ์ ๊ฐ: ์ต๋ 72%
GPU ๋น์ฉ, ์ฒด๊ณ์ ์ผ๋ก ์ ๊ฒํ๊ณ ๊ณ์ ๊ฐ์?
์ง๊ธ๊น์ง AWS GPU ์ธ์คํด์ค์ ์ฃผ์ ๊ตฌ๋งค ์ต์ (Savings Plans, Reserved Instance, Capacity Blocks)์ ๋น๊ตํ๊ณ , ์ํฉ๋ณ ์ต์ ์ ์ ํ ๊ธฐ์ค์ ์ดํด๋ดค์ต๋๋ค.
ํ์ง๋ง ์ค์ ๋ก ์ฐ๋ฆฌ ํ์ด GPU ๋น์ฉ์ ์ ๊ด๋ฆฌํ๊ณ ์๋์ง, ๋์น๊ณ ์๋ ๋ถ๋ถ์ ์๋์ง ์ ๊ฒํด๋ณด์ ์ ์์ผ์ ๊ฐ์?
์ค๋ง์ผ์คํฌ์์๋ AWS MSP ํํธ๋๋ก์ ๋ค์ํ ๊ณ ๊ฐ์ฌ์ GPU ์ํฌ๋ก๋๋ฅผ ์ต์ ํํด์จ ๊ฒฝํ์ ๋ฐํ์ผ๋ก, GPU ๋น์ฉ ์ต์ ํ ์ ํ ์ฒดํฌ๋ฆฌ์คํธ๋ฅผ ์ค๋นํ์ต๋๋ค.
โ
์ฒดํฌ๋ฆฌ์คํธ์์ ํ์ธํ ์ ์๋ ๋ด์ฉ:
โ ์ธ์คํด์ค ์ ํ ์ ๊ฒ (GPU ๋ฉ๋ชจ๋ฆฌ, G vs P ์๋ฆฌ์ฆ ๋ฑ)
โ ๊ตฌ๋งค ์ต์
์ ๊ฒ (Savings Plans, Capacity Blocks ํ์ฉ ์ฌ๋ถ)
โ ์ด์ ์ต์ ํ ์ ๊ฒ
โ ๋ชจ๋ํฐ๋ง ๋ฐ ๋น์ฉ ๊ด๋ฆฌ





