반응형
🧭 k9s란?



k9s는 Kubernetes를 터미널에서 GUI처럼 관리하는 도구입니다.
👉 kubectl 대신 화면 기반으로 빠르게 운영할 수 있는 CLI UI 툴
🛠️ 1. k9s 설치 방법 (OS별 완전 정리)
🐧 Linux 설치
방법 1️⃣ (가장 추천 - 바이너리 설치)
# 최신 버전 다운로드
wget https://github.com/derailed/k9s/releases/latest/download/k9s_Linux_amd64.tar.gz
# 압축 해제
tar -xvf k9s_Linux_amd64.tar.gz
# 실행 파일 이동
sudo mv k9s /usr/local/bin/
# 실행 권한
chmod +x /usr/local/bin/k9s
# 실행
k9s
방법 2️⃣ (패키지 매니저)
# snap
sudo snap install k9s
# 또는
brew install k9s # Linuxbrew 사용 시
🍎 Mac 설치
# Homebrew
brew install k9s
# 실행
k9s
👉 Mac은 거의 무조건 이 방법이 가장 편함
🪟 Windows 설치
방법 1️⃣ (Chocolatey)
choco install k9s
방법 2️⃣ (Scoop)
scoop install k9s
방법 3️⃣ (수동 설치)
- GitHub에서 zip 다운로드
- 압축 해제
- PATH에 추가
✅ 설치 확인
k9s version
👉 정상 출력되면 OK
⚙️ 2. k9s 기본 실행 흐름
k9s
👉 실행하면 바로 Kubernetes 클러스터 접속됨
👉 kubeconfig 기준으로 자동 연결
🎯 3. 실무 단축키 20개 (진짜 중요한 것만 엄선)
🔥 가장 많이 쓰는 핵심 10개
| 단축키 | 기능 |
| : | 명령 모드 진입 |
| q | 종료 |
| l | 로그 보기 |
| d | describe |
| s | shell 접속 |
| r | 리소스 재시작 |
| ctrl+d | 삭제 |
| / | 검색 |
| n | 네임스페이스 변경 |
| esc | 뒤로가기 |
⚡ 운영에서 자주 쓰는 10개
| 단축키 | 기능 |
| 0 | 전체 리소스 보기 |
| 1 | pod 화면 |
| 2 | deploy |
| 3 | service |
| 4 | daemonset |
| 5 | statefulset |
| shift+f | 포트포워딩 |
| shift+l | 로그 전체 보기 |
| ctrl+k | kill |
| y | yaml 보기 |
🧠 실무 활용 예시 (GPU 운영 기준)
🚨 장애 발생 시 (예: NCCL timeout)
1. k9s 실행
2. pod 확인 (1)
3. 문제 pod 선택
4. l → 로그 확인
5. d → 상세 상태 확인
6. s → 내부 진입 후 GPU 상태 확인
👉 kubectl 5~6개 명령어를 한 번에 처리
📊 Job 모니터링
- PyTorchJob 상태 확인
- Pod 분산 상태 확인
- Pending 원인 확인
👉 node affinity / GPU 부족 바로 파악 가능
🔍 로그 분석
- 실시간 로그 스트리밍
- 오류 발생 즉시 확인
👉 kubectl logs -f 필요 없음
💡 초보자가 꼭 알아야 하는 팁
👉 1. 네임스페이스 먼저 확인
:ns
👉 2. Pod 중심으로 보면 됨
- 대부분 문제는 Pod에서 발생
👉 3. 로그 → describe 순서
👉 장애 분석 기본 루틴
⚠️ 자주 하는 실수
- ❌ kubeconfig 안 맞음 → 접속 안됨
- ❌ namespace 잘못 선택
- ❌ GPU Pod인데 CPU 노드 확인
🔥 kubectl vs k9s (실무 기준)
| 항목 | kubectl | k9s |
| 장애 대응 속도 | 느림 | 매우 빠름 |
| 로그 확인 | 번거로움 | 즉시 |
| 학습 난이도 | 높음 | 낮음 |
| 실시간성 | 낮음 | 높음 |
반응형
'[GPUaaS] > GPUmgt' 카테고리의 다른 글
| [k9s] Kubernetes를 터미널에서 쉽게 관리해주는 UI 도구 !! (0) | 2026.04.29 |
|---|---|
| [🚀 NVIDIA] NCCL, NVLink, InfiniBand 완벽 이해 (초보자용) (0) | 2026.04.29 |
| [🚀 GPU] Fabric Manager란 무엇인가? (1) | 2026.04.26 |
| [🚀 GPU] MLXP vs Run.ai vs Slurm 완전 정리 !! (1) | 2026.04.12 |
| [🚀 GPU] FlashAttention 완벽 가이드 (초보자용) (0) | 2026.04.12 |
| [TFLOPS] Floating Point Operations Per Second !! (0) | 2026.04.10 |
| [리벨리온 NPU란?] NPU vs GPU 핵심 차이!! (0) | 2026.04.07 |
| 🚀[GPU] H100 vs H200 vs B200 vs Vera Rubin 완벽 이해 가이드 (초보자용) (0) | 2026.04.06 |
댓글