

AI/GPU/HPC 스토리지 초보자용 설명
GPU 서버, AI 학습, HPC 환경을 다루다 보면 아래와 같은 용어를 자주 보게 됩니다.
VAST 스토리지
Lustre 스토리지
DDN 스토리지
EXAScaler
OST / OSS / MDS / MDT
NFS / S3 / SMB
처음 보면 전부 비슷한 “스토리지 이름”처럼 보이지만, 실제로는 회사 이름, 제품 이름, 파일시스템 기술 이름이 섞여 있습니다.
이번 글에서는 VAST, Lustre, DDN의 차이를 초보자 기준으로 쉽게 정리하겠습니다.
1. 먼저 결론부터 ✅
| 이름 | 정체 | 쉽게 말하면 |
| VAST Data | 회사 이름 | AI용 고성능 스토리지 회사 |
| VAST Storage / VAST DataStore | 제품/플랫폼 | AI·GPU용 통합 스토리지 플랫폼 |
| Lustre | 파일시스템 기술 | HPC용 오픈소스 병렬 파일시스템 |
| DDN | 회사 이름 | 고성능 AI/HPC 스토리지 회사 |
| DDN EXAScaler | DDN 제품 | Lustre 기반 상용 스토리지 제품 |
가장 중요한 핵심은 이것입니다.
VAST = 회사/제품
DDN = 회사
Lustre = 파일시스템 기술
DDN EXAScaler = DDN이 만든 Lustre 기반 제품
즉, VAST와 DDN은 회사 이름에 가깝고, Lustre는 회사 이름이 아니라 파일시스템 기술 이름입니다.
2. VAST 스토리지란? 🧠
VAST 스토리지는 보통 VAST Data라는 회사의 스토리지 플랫폼을 말합니다.
VAST는 AI, HPC, 실시간 분석 같은 대규모 데이터 환경을 위한 고성능 데이터 플랫폼을 강조합니다. 특히 VAST DataStore는 AI, HPC, 실시간 분석을 위한 단일 확장형 데이터 플랫폼으로 소개되어 있습니다.
쉽게 말하면:
VAST 스토리지는 GPU 서버들이 학습 데이터를 빠르게 읽고 쓸 수 있게 해주는 AI 시대용 고성능 공유 스토리지입니다.
예를 들어 H100/H200 GPU 서버가 여러 대 있을 때, 각 서버에 데이터를 따로 복사하지 않고 VAST에 있는 데이터를 여러 GPU 노드가 동시에 접근할 수 있습니다.
GPU 서버들
↓
고속 네트워크
↓
VAST Storage
↓
AI 학습 데이터 / 모델 / 체크포인트 / 로그
3. Lustre는 회사 이름이야? ❌
아닙니다. Lustre는 회사 이름이 아니라 오픈소스 병렬 파일시스템 이름입니다.
Lustre 공식 사이트에서도 Lustre를 오픈소스 병렬 파일시스템이라고 설명하며, HPC 시뮬레이션 환경 요구사항을 지원한다고 소개합니다.
쉽게 말하면:
Lustre = 파일시스템 기술
일반적인 리눅스 파일시스템이 ext4, xfs 같은 것이라면, Lustre는 여러 서버와 여러 디스크를 묶어서 하나의 거대한 고성능 파일시스템처럼 보이게 하는 기술입니다.
4. DDN은 회사 이름이야? ✅
네. DDN은 회사 이름입니다.
DDN의 전체 이름은 DataDirect Networks입니다. DDN은 AI, HPC, 대규모 데이터 워크로드를 위한 고성능 스토리지 회사입니다.
DDN의 대표적인 제품 중 하나가 EXAScaler입니다. DDN은 EXAScaler를 AI, HPC, 데이터 집약 워크로드를 가속하는 고성능 병렬 파일시스템 제품으로 설명합니다.
정리하면:
DDN = 회사 이름
EXAScaler = DDN의 제품
Lustre = EXAScaler 안에서 사용되는 핵심 파일시스템 기술
즉, 현장에서 “DDN 스토리지”라고 하면 보통 이런 의미입니다.
DDN 회사의 스토리지 장비
└─ EXAScaler 제품
└─ Lustre 기반 병렬 파일시스템
5. Lustre 구조 쉽게 이해하기 🧩
Lustre는 보통 아래 구성 요소로 이루어집니다.
| 구성 요소 | 의미 |
| Client | Lustre를 마운트해서 사용하는 서버 |
| MDS | Metadata Server, 파일 이름/디렉터리 정보 처리 |
| MDT | Metadata Target, 메타데이터 저장 공간 |
| OSS | Object Storage Server, 실제 데이터 처리 서버 |
| OST | Object Storage Target, 실제 파일 데이터 저장 공간 |
| LNet | Lustre 네트워크 계층 |
| o2ib | InfiniBand 기반 Lustre 통신 방식 중 하나 |
구조를 아주 쉽게 표현하면:
사용자 / GPU 서버
↓
Lustre Client
↓
MDS / MDT → 파일 이름, 경로, 권한 등 메타데이터 처리
↓
OSS / OST → 실제 파일 데이터 저장
예를 들어 사용자가 /mnt/lustre/dataset/file1을 읽는다면:
1. MDS에게 "file1이 어디 있어?"라고 물어봄
2. MDS가 OST 위치 정보를 알려줌
3. 클라이언트가 여러 OST에서 데이터를 병렬로 읽음
그래서 Lustre는 대규모 병렬 읽기/쓰기에 강합니다. OpenSFS도 Lustre가 POSIX 호환 인터페이스를 제공하고, 수천 클라이언트와 수백 PB급 저장소까지 확장 가능하다고 설명합니다.
6. VAST와 Lustre의 가장 큰 차이 ⚖️
Lustre는 “고성능 병렬 파일시스템”
Lustre는 HPC, 슈퍼컴퓨팅, 시뮬레이션, 대규모 병렬 I/O에 강합니다.
Lustre = 고성능 병렬 파일시스템
대표 사용 예시는:
기상 시뮬레이션
유체 해석
CAE
MPI 병렬 작업
Slurm 기반 HPC 작업
대규모 AI 학습 데이터 읽기
VAST는 “AI 데이터 플랫폼”
VAST는 단순 파일시스템이라기보다 NFS, S3, SMB 등 여러 프로토콜을 통해 데이터를 접근하는 통합 데이터 플랫폼 성격이 강합니다.
VAST는 DataStore에서 파일과 오브젝트를 NFS, S3, SMB로 데이터 이동 없이 접근할 수 있다고 설명합니다.
VAST = AI 시대용 통합 데이터 플랫폼
대표 사용 예시는:
LLM 학습 데이터 저장
RAG 데이터 저장
AI 추론 데이터 저장
Kubernetes + Slurm 혼합 환경
NFS/S3 동시 접근
GPU 클러스터 공유 스토리지
7. VAST가 Lustre보다 더 좋은가? 🤔
정답은:
무조건 VAST가 더 좋다 / Lustre가 더 좋다로 말할 수 없습니다.
워크로드에 따라 다릅니다.
Lustre가 더 적합한 경우
Lustre는 이런 환경에 잘 맞습니다.
전통 HPC 워크로드가 많다
Slurm 기반 대규모 병렬 작업이 많다
POSIX 파일 I/O가 핵심이다
MPI 작업이 많다
기존 DDN/Lustre 운영 경험이 있다
MDS/OSS/OST 구조를 운영할 수 있다
예를 들어:
슈퍼컴퓨터
연구소 HPC
기상/유체/물리 시뮬레이션
대규모 병렬 파일 I/O
이런 경우 Lustre는 여전히 매우 강력한 선택입니다.
VAST가 더 적합한 경우
VAST는 이런 환경에 잘 맞습니다.
AI 학습과 추론이 중심이다
NFS와 S3를 같이 쓰고 싶다
데이터 복사를 줄이고 싶다
Kubernetes, Slurm, AI 플랫폼이 섞여 있다
운영 편의성과 통합 관리가 중요하다
엔터프라이즈 지원이 중요하다
예를 들어:
LLM 학습 플랫폼
RAG 서비스
AI Factory
GPU 클라우드
Kubeflow / Kubernetes 기반 AI 플랫폼
NFS + S3 + SMB 통합 데이터 접근
이런 경우 VAST가 매력적일 수 있습니다.
8. 비교표로 한 번에 보기 📊
| 항목 | Lustre | VAST |
| 정체 | 오픈소스 병렬 파일시스템 | 상용 AI 데이터 플랫폼 |
| 회사 이름 여부 | 아님 | VAST Data 회사 |
| 대표 벤더 | DDN, HPE, AWS 등 | VAST Data |
| 대표 제품 | DDN EXAScaler, FSx for Lustre 등 | VAST DataStore / VAST Platform |
| 주 사용처 | HPC, 슈퍼컴퓨팅, 병렬 I/O | AI 학습/추론, HPC, 실시간 분석 |
| 접근 방식 | Lustre Client | NFS, S3, SMB 등 |
| 강점 | 대규모 병렬 POSIX I/O | 통합 프로토콜, AI 데이터 플랫폼 |
| 운영 관점 | MDS/OSS/OST/LNet 이해 필요 | 제품 플랫폼 중심 관리 |
| GPU 환경 적합성 | 높음 | 높음 |
| 비용 | 구축 방식/벤더에 따라 다름 | 상용 제품으로 비용 고려 필요 |
9. 운영자 관점에서 보는 차이 🛠️
사용자님처럼 GPU/HPC 운영자 입장에서 보면 차이는 더 명확합니다.
Lustre 운영 시 자주 보는 명령어
lfs df -h
lfs osts
lctl dl
mount | grep lustre
dmesg -T | grep -i lustre
journalctl -k | grep -i "lustre\|ptlrpc\|lnet\|o2ib"
Lustre 장애 분석에서는 이런 로그가 중요합니다.
ptlrpc timeout
OST connection lost
MDS unavailable
LNet peer timeout
o2ib reconnect
lmv_statfs error
즉, Lustre는 파일시스템 내부 구조와 네트워크 계층까지 같이 봐야 하는 경우가 많습니다.
VAST 운영 시 보는 관점
VAST는 보통 플랫폼 관리 관점입니다.
VAST Cluster 상태
CNode / DNode 상태
NFS/S3/SMB 서비스 상태
클라이언트 연결 상태
I/O latency
Throughput
GPU Job의 데이터 공급 속도
즉, VAST는 Lustre처럼 MDS/OSS/OST를 직접 깊게 파는 방식보다는, 상용 스토리지 플랫폼의 상태와 프로토콜 서비스를 중심으로 보는 경우가 많습니다.
10. 초보자용 비유 🏭
Lustre 비유
Lustre = 슈퍼컴퓨터용 초고속 고속도로
차가 수천 대 다녀도 빠르게 달릴 수 있습니다.
대신 도로 구조, 차선, 톨게이트, 신호체계, 유지보수를 잘 알아야 합니다.
즉:
빠르다
강력하다
대규모 병렬 처리에 좋다
하지만 운영 이해도가 필요하다
VAST 비유
VAST = AI 데이터센터용 통합 물류센터
트럭도 들어오고, 택배도 처리하고, 창고 관리도 하고, 여러 방식으로 물건을 꺼낼 수 있습니다.
즉:
AI 워크로드에 맞춰져 있다
NFS/S3/SMB 같은 접근 방식이 다양하다
운영 편의성이 좋을 수 있다
상용 제품이라 비용과 벤더 의존성을 고려해야 한다
DDN 비유
DDN = 고속도로와 물류 인프라를 만들어 파는 전문 회사
DDN은 Lustre 기술을 기반으로 EXAScaler 같은 상용 제품을 제공합니다.
즉:
DDN = 회사
EXAScaler = 제품
Lustre = 제품 안에 들어가는 핵심 파일시스템 기술
11. 참고할 사진/이미지 추천 🖼️
블로그에 이미지를 넣는다면 아래 구성이 좋습니다.
1번 이미지: VAST Data Platform 구조 이미지
사용 위치:
“VAST 스토리지란?” 섹션
이미지 설명 문구 예시:
VAST Data는 AI 시대를 위한 데이터 플랫폼을 강조하며, 스토리지뿐 아니라 데이터 처리와 데이터 접근 통합을 목표로 한다.
2번 이미지: Lustre 아키텍처 구조도
사용 위치:
“Lustre 구조 쉽게 이해하기” 섹션
이미지 설명 문구 예시:
Lustre는 MDS/MDT가 메타데이터를 처리하고, OSS/OST가 실제 파일 데이터를 저장하는 병렬 파일시스템 구조를 가진다.
3번 이미지: DDN EXAScaler 제품 이미지 또는 DDN 로고
사용 위치:
“DDN은 회사 이름이야?” 섹션
이미지 설명 문구 예시:
DDN EXAScaler는 AI/HPC 워크로드를 위한 DDN의 Lustre 기반 고성능 스토리지 제품군이다.
4번 이미지: GPU 서버와 스토리지 연결 구조도
직접 만들어 넣으면 가장 좋습니다.
GPU 서버
↓
InfiniBand / Ethernet
↓
VAST 또는 DDN/Lustre
↓
Dataset / Checkpoint / Model
블로그용으로는 이런 간단한 다이어그램도 좋습니다.
[GPU Node 1] ─┐
[GPU Node 2] ─┼── [High Speed Network] ── [Shared Storage]
[GPU Node 3] ─┘ ├─ Dataset
├─ Checkpoint
└─ Model
12. 한 장 요약 📝
| 질문 | 답변 |
| VAST는 뭐야? | VAST Data 회사의 AI/HPC용 고성능 스토리지 플랫폼 |
| Lustre는 회사야? | 아님. 오픈소스 병렬 파일시스템 기술 |
| DDN은 회사야? | 맞음. DataDirect Networks라는 스토리지 회사 |
| DDN과 Lustre 관계는? | DDN EXAScaler 같은 제품이 Lustre 기반 |
| VAST가 Lustre보다 좋아? | 무조건 아님. 워크로드에 따라 다름 |
| HPC에는 뭐가 좋아? | 전통 HPC/병렬 I/O는 Lustre가 강함 |
| AI 플랫폼에는 뭐가 좋아? | NFS/S3 통합, AI 데이터 플랫폼 관점에서는 VAST가 강점 |
| GPU 클러스터에서는? | 둘 다 사용 가능. 데이터 패턴, 운영 방식, 비용, 벤더 지원을 봐야 함 |
13. 최종 결론 🎯
VAST, Lustre, DDN을 헷갈리지 않으려면 아래처럼 기억하면 됩니다.
VAST = AI 시대용 상용 데이터 플랫폼 회사/제품
Lustre = HPC용 오픈소스 병렬 파일시스템 기술
DDN = 고성능 스토리지 회사
DDN EXAScaler = DDN의 Lustre 기반 상용 스토리지 제품
그리고 “VAST가 Lustre보다 더 좋냐?”라는 질문의 답은:
워크로드에 따라 다릅니다.
전통 HPC와 대규모 병렬 POSIX I/O는 Lustre가 강하고, AI 학습/추론, NFS·S3 통합, 운영 편의성 중심의 데이터 플랫폼은 VAST가 강점이 있습니다.
GPU 운영자 관점에서는 이렇게 판단하면 좋습니다.
HPC 시뮬레이션 / Slurm / MPI / 병렬 파일 I/O 중심
→ Lustre / DDN EXAScaler 검토
AI 학습 / 추론 / RAG / Kubernetes / NFS+S3 통합 중심
→ VAST 검토
한 줄로 정리하면:
Lustre는 “고성능 병렬 파일시스템”, DDN은 “그런 스토리지를 만드는 회사”, VAST는 “AI 시대용 통합 스토리지 플랫폼 회사/제품”입니다.
'[GPUaaS] > GPUmgt' 카테고리의 다른 글
| [GPU] KubeRay Operator란? 🚀 (2) | 2026.06.09 |
|---|---|
| [CUDA] NVIDIA GPU를 계산 작업에 사용할 수 있게 해주는 기술!! (1) | 2026.05.31 |
| [GPU] Lustre RDMA Failure 발생 의미 🚨 (0) | 2026.05.23 |
| [🚀 k9s 설치 방법] 실무 단축키 20개 완벽 가이드 (초보자용) (0) | 2026.04.29 |
| [k9s] Kubernetes를 터미널에서 쉽게 관리해주는 UI 도구 !! (0) | 2026.04.29 |
| [🚀 NVIDIA] NCCL, NVLink, InfiniBand 완벽 이해 (초보자용) (0) | 2026.04.29 |
| [🚀 GPU] Fabric Manager란 무엇인가? (1) | 2026.04.26 |
| [🚀 GPU] MLXP vs Run.ai vs Slurm 완전 정리 !! (1) | 2026.04.12 |
댓글