📌 1. Hugging Face란 무엇인가?

👉 Hugging Face는 AI 모델을 모아두고 쉽게 다운로드·사용할 수 있게 해주는 플랫폼

한 줄 정리:

💡 “AI를 직접 만들지 않고, 가져다 쓰게 해주는 곳”

📌 2. 구조를 먼저 이해하자 (중요🔥)

Hugging Face는 3가지로 구성됨:

① Model Hub

수십만 개 AI 모델 저장소

② 라이브러리

Transformers → LLM 실행
Datasets → 데이터셋 관리

③ Hub 다운로드 시스템

Git이 아니라 API 기반 다운로드

📌 3. 모델 다운로드하면 뭐가 생기냐?

👉 YAML ❌
👉 폴더 구조 ✅

gpt2/
 ├── config.json
 ├── pytorch_model.bin 또는 model.safetensors
 ├── tokenizer.json
 ├── vocab.txt

✔ 핵심

.bin / .safetensors → 모델 본체
.json → 설정

📌 4. 모델 다운로드 방법 (실무 기준)

✅ 방법 1. Python (가장 추천🔥)

from huggingface_hub import snapshot_download

snapshot_download(
 repo_id="gpt2",
 local_dir="/mnt/ddn/models/gpt2"
)

✔ 특징:

안정적
전체 파일 자동 다운로드
MLXP에서 표준

✅ 방법 2. CLI

pip install huggingface_hub

huggingface-cli download gpt2 \
 --local-dir /mnt/ddn/models/gpt2

❌ 방법 3. Git clone (비추천)

git clone https://huggingface.co/gpt2

👉 문제:

대용량 파일 누락 가능
느림
git-lfs 필요

📌 5. GPU 서버에서 사용하는 방법

👉 핵심:

“다운로드 → DDN 저장 → 경로로 불러오기”

📦 권장 구조

/mnt/ddn/
 └── models/
 └── gpt2/

🧪 Python에서 사용

from transformers import AutoModel

model = AutoModel.from_pretrained("/mnt/ddn/models/gpt2")

👉 인터넷 필요 없음
👉 로컬에서 바로 로딩

📌 6. MLXP / Kubernetes 기준 전체 흐름

Hugging Face → 모델 다운로드
 ↓
DDN 저장
 ↓
PyTorchJob 실행
 ↓
모델 로딩
 ↓
학습 / 추론
 ↓
KServe 배포

👉 이게 실제 운영 표준 구조

📌 7. 초보가 가장 많이 틀리는 부분 🚨

❌ Git clone 사용

→ 일부 파일 누락

❌ 컨테이너 내부 저장

→ Pod 재시작 시 데이터 날아감

❌ from_pretrained("gpt2")

→ 다시 인터넷 다운로드 발생

📌 8. (중요🔥) 고급 모델은 공개로 받아도 되나?

👉 이건 매우 중요한 포인트다.

🔐 1. 모델은 “라이선스”가 있음

모든 모델이 자유롭게 써도 되는 게 아님

🔑 대표적인 라이선스 유형

유형	설명
Apache 2.0	자유 사용 가능 (상업 OK)
MIT	자유 사용
CreativeML	일부 제한 있음
Custom License	사용 조건 확인 필요
Restricted	승인 받아야 사용

🚨 실제 사례

예:

Meta LLaMA 계열 → 승인 필요
일부 기업 모델 → 상업적 사용 금지

🔒 2. Private 모델도 존재

👉 Hugging Face는 공개/비공개 둘 다 있음

Public → 누구나 다운로드 가능
Private → 인증 필요

🔐 Private 모델 다운로드 방법

huggingface-cli login

snapshot_download(
 repo_id="private/model",
 token="hf_xxx"
)

⚠️ 실무에서 꼭 확인해야 하는 것

👉 모델 사용 전에 반드시 확인:

✔ License
✔ Commercial 사용 가능 여부
✔ Redistribution 가능 여부

📌 9. 실무 기준 Best Practice 🔥

✔ 추천 방식

Hugging Face → snapshot_download
DDN에 저장
PyTorchJob에서 경로 사용
모델 캐시 공유

✔ 고급 팁

/mnt/ddn/models 공용 저장소 운영
모델 버전 관리 (gpt2_v1, gpt2_v2)
캐시 중복 방지

📌 🔥 최종 한 줄 정리

🤗 Hugging Face = AI 모델을 다운로드해서
👉 GPU 서버에서 바로 실행할 수 있게 해주는 플랫폼

저작자표시 비영리 변경금지 (새창열림)

'[GPUaaS] > HuggingFace' 카테고리의 다른 글

[🤗 Hugging Face] 한 번에 이해하기!! (초보자용) (1)	2026.04.24

[🤗 Hugging Face] 완전 정복 가이드 (중급자용)

📌 1. Hugging Face란 무엇인가?

📌 2. 구조를 먼저 이해하자 (중요🔥)

① Model Hub

② 라이브러리

③ Hub 다운로드 시스템

📌 3. 모델 다운로드하면 뭐가 생기냐?

📌 4. 모델 다운로드 방법 (실무 기준)

✅ 방법 1. Python (가장 추천🔥)

✅ 방법 2. CLI

❌ 방법 3. Git clone (비추천)

📌 5. GPU 서버에서 사용하는 방법

📦 권장 구조

🧪 Python에서 사용

📌 6. MLXP / Kubernetes 기준 전체 흐름

📌 7. 초보가 가장 많이 틀리는 부분 🚨

❌ Git clone 사용

❌ 컨테이너 내부 저장

❌ from_pretrained("gpt2")

📌 8. (중요🔥) 고급 모델은 공개로 받아도 되나?

🔐 1. 모델은 “라이선스”가 있음

🔑 대표적인 라이선스 유형

🚨 실제 사례

🔒 2. Private 모델도 존재

🔐 Private 모델 다운로드 방법

⚠️ 실무에서 꼭 확인해야 하는 것

📌 9. 실무 기준 Best Practice 🔥

✔ 추천 방식

✔ 고급 팁

📌 🔥 최종 한 줄 정리

'[GPUaaS] > HuggingFace' 카테고리의 다른 글

댓글

티스토리툴바

[🤗 Hugging Face] 완전 정복 가이드 (중급자용)

📌 1. Hugging Face란 무엇인가?

📌 2. 구조를 먼저 이해하자 (중요🔥)

① Model Hub

② 라이브러리

③ Hub 다운로드 시스템

📌 3. 모델 다운로드하면 뭐가 생기냐?

📌 4. 모델 다운로드 방법 (실무 기준)

✅ 방법 1. Python (가장 추천🔥)

✅ 방법 2. CLI

❌ 방법 3. Git clone (비추천)

📌 5. GPU 서버에서 사용하는 방법

📦 권장 구조

🧪 Python에서 사용

📌 6. MLXP / Kubernetes 기준 전체 흐름

📌 7. 초보가 가장 많이 틀리는 부분 🚨

❌ Git clone 사용

❌ 컨테이너 내부 저장

❌ from_pretrained("gpt2")

📌 8. (중요🔥) 고급 모델은 공개로 받아도 되나?

🔐 1. 모델은 “라이선스”가 있음

🔑 대표적인 라이선스 유형

🚨 실제 사례

🔒 2. Private 모델도 존재

🔐 Private 모델 다운로드 방법

⚠️ 실무에서 꼭 확인해야 하는 것

📌 9. 실무 기준 Best Practice 🔥

✔ 추천 방식

✔ 고급 팁

📌 🔥 최종 한 줄 정리

'[GPUaaS] > HuggingFace' 카테고리의 다른 글

관련글

댓글

티스토리툴바