✅ 1️⃣ Grafana의 Query Builder를 쓰면 PromQL 자동 생성됨
Grafana는 이미 PromQL 생성기를 가지고 있습니다.
Grafana → Explore → Prometheus 선택
이렇게 바꾸면 👇
| 화면 요소 | 역할 |
| Metric | 메트릭 선택 |
| Label | namespace, pod, node 필터 |
| Operator | =, !=, =~ |
| Functions | rate(), sum(), avg() 등 |
→ 이걸 클릭만 하면
👉 PromQL이 자동으로 만들어짐
예시
“노드 CPU 사용률”
1️⃣ Metric 클릭
→ node_cpu_seconds_total
2️⃣ Function
→ rate()
3️⃣ Filter
→ mode!="idle"
4️⃣ Aggregate
→ sum by (instance)
Grafana가 만들어 주는 PromQL:
❗ 이걸 외울 필요가 없습니다.
✅ 2️⃣ Metrics Explorer를 쓰면 Kubernetes 구조 그대로 탐색 가능
Grafana → Explore → Metrics Browser
여기서:
처럼 Kubernetes 트리 구조로 탐색 가능.
PromQL이 아니라
"노드 → CPU → 사용률"
처럼 클릭해서 선택합니다.
✅ 3️⃣ 실무에서 가장 많이 쓰는 PromQL 템플릿
GPUaaS / K8s 운영에서 99% 이거만 씀
| 목적 | PromQL |
| 노드 CPU % | 100 - avg by(instance)(rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100 |
| 노드 메모리 % | (1 - node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes) * 100 |
| 디스크 사용률 | 1 - node_filesystem_avail_bytes / node_filesystem_size_bytes |
| Pod CPU | sum(rate(container_cpu_usage_seconds_total[5m])) by (pod) |
| Pod 메모리 | sum(container_memory_working_set_bytes) by (pod) |
| GPU 사용률 | avg(nvidia_gpu_utilization) by (instance) |
| GPU 메모리 | nvidia_gpu_memory_used_bytes / nvidia_gpu_memory_total_bytes * 100 |
👉 이거 그대로 Grafana에 붙여도 됩니다.
✅ 4️⃣ “PromQL 몰라도 되는” 대시보드 사용
Grafana는 이미 쿠버네티스 전문가들이 만들어 둔 쿼리 세트가 있음.
반드시 설치해야 할 것
| 용도 | Dashboard ID |
| Kubernetes 전체 | 15757 (kube-prometheus-stack) |
| Node 상세 | 1860 |
| Pod / Namespace | 6417 |
| GPU (NVIDIA) | 12239 |
| K8s Capacity | 15038 |
Grafana → Import → ID 입력 → 끝
👉 PromQL 전부 자동으로 들어 있음.
✅ 5️⃣ PromQL을 “AI로 생성”하는 방법 (제일 강력함)
너 지금 이렇게 말하면 됨:
“쿠버네티스 노드별 CPU 사용률 80% 넘으면 알람 쿼리 만들어줘”
“GPU 사용률, GPU 메모리, Pod별 집계 PromQL 만들어줘”
👉 내가 PromQL + AlertRule + Grafana 패널 쿼리까지 만들어 줄 수 있음.
GPUaaS 운영 쪽은
특히 정산·과금·장애탐지용 PromQL 패턴이 따로 있음.
🎯 결론
PromQL은 외우는 게 아니라
Grafana Builder + 템플릿 + AI로 생성해서 쓰는 것
'[GPUaaS] > Grafana' 카테고리의 다른 글
| [NCP 참고] Grafana Alert vs Prometheus Alertmanager 차이 (0) | 2026.01.13 |
|---|---|
| [NCP 실전] 참고 - 그라파나(Grafana) 대시보드 생성 (0) | 2026.01.13 |
| [NCP 실전] Grafana와 Slack 연동하여 Alert 설정하기 (0) | 2026.01.13 |
| [GPUaaS] 운영자 입장에서는 Grafana Alerting이 훨씬 쉽고 빠르다. (0) | 2026.01.13 |
댓글