본문 바로가기
[GPUaaS]/Grafana

[NCP 실전] 실무에서 가장 많이 쓰는 PromQL 템플릿 - Grafana의 Query Builder 쓰면 PromQL 자동 생성

by METAVERSE STORY 2026. 1. 13.
반응형

 

 

✅ 1️⃣ Grafana의 Query Builder를 쓰면 PromQL 자동 생성됨

Grafana는 이미 PromQL 생성기를 가지고 있습니다.

Grafana → Explore → Prometheus 선택

 
Mode: Code → Builder 로 변경

이렇게 바꾸면 👇

 
화면 요소 역할
Metric 메트릭 선택
Label namespace, pod, node 필터
Operator =, !=, =~
Functions rate(), sum(), avg() 등

→ 이걸 클릭만 하면
👉 PromQL이 자동으로 만들어짐

 

 

 


예시

“노드 CPU 사용률”

1️⃣ Metric 클릭
→ node_cpu_seconds_total

2️⃣ Function
→ rate()

3️⃣ Filter
→ mode!="idle"

4️⃣ Aggregate
→ sum by (instance)

Grafana가 만들어 주는 PromQL:

 
sum by (instance) ( rate(node_cpu_seconds_total{mode!="idle"}[5m]) )

❗ 이걸 외울 필요가 없습니다.

 

 

 


✅ 2️⃣ Metrics Explorer를 쓰면 Kubernetes 구조 그대로 탐색 가능

Grafana → Explore → Metrics Browser

여기서:

 
kube → node → cpu → usage kube → pod → memory → working_set kube → namespace → cpu → requests

처럼 Kubernetes 트리 구조로 탐색 가능.

PromQL이 아니라

"노드 → CPU → 사용률"
처럼 클릭해서 선택합니다.

 

 

 


✅ 3️⃣ 실무에서 가장 많이 쓰는 PromQL 템플릿

GPUaaS / K8s 운영에서 99% 이거만 씀

목적 PromQL
노드 CPU % 100 - avg by(instance)(rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100
노드 메모리 % (1 - node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes) * 100
디스크 사용률 1 - node_filesystem_avail_bytes / node_filesystem_size_bytes
Pod CPU sum(rate(container_cpu_usage_seconds_total[5m])) by (pod)
Pod 메모리 sum(container_memory_working_set_bytes) by (pod)
GPU 사용률 avg(nvidia_gpu_utilization) by (instance)
GPU 메모리 nvidia_gpu_memory_used_bytes / nvidia_gpu_memory_total_bytes * 100

👉 이거 그대로 Grafana에 붙여도 됩니다.

 

 

 


✅ 4️⃣ “PromQL 몰라도 되는” 대시보드 사용

Grafana는 이미 쿠버네티스 전문가들이 만들어 둔 쿼리 세트가 있음.

반드시 설치해야 할 것

용도 Dashboard ID
Kubernetes 전체 15757 (kube-prometheus-stack)
Node 상세 1860
Pod / Namespace 6417
GPU (NVIDIA) 12239
K8s Capacity 15038

Grafana → Import → ID 입력 → 끝

👉 PromQL 전부 자동으로 들어 있음.

 

 

 


✅ 5️⃣ PromQL을 “AI로 생성”하는 방법 (제일 강력함)

너 지금 이렇게 말하면 됨:

“쿠버네티스 노드별 CPU 사용률 80% 넘으면 알람 쿼리 만들어줘”
“GPU 사용률, GPU 메모리, Pod별 집계 PromQL 만들어줘”

👉 내가 PromQL + AlertRule + Grafana 패널 쿼리까지 만들어 줄 수 있음.

GPUaaS 운영 쪽은
특히 정산·과금·장애탐지용 PromQL 패턴이 따로 있음.


🎯 결론

PromQL은 외우는 게 아니라
Grafana Builder + 템플릿 + AI로 생성해서 쓰는 것

 

 

 

반응형

댓글