OrbStack 라이선스 만료로 Mac mini Docker 서비스를 GPU 서버로 통합. nginx → Caddy 전환, 12개 서브도메인 자동 HTTPS, fail2ban Caddy JSON 연동. 주요 변경: - home-caddy: Caddy 리버스 프록시 (Let's Encrypt 자동 HTTPS) - home-fail2ban: Caddy JSON 로그 기반 보안 모니터링 - home-ddns: Cloudflare DDNS (API 키 .env 분리) - gpu-hub-api/web: AI 백엔드 라우터 + 웹 UI (gpu-services에서 이전) - AI 런타임(Ollama) 내부망 전용, 외부는 gpu-hub 인증 게이트웨이 경유 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
32 lines
795 B
Python
32 lines
795 B
Python
from fastapi import APIRouter
|
|
|
|
from services.gpu_monitor import get_gpu_info
|
|
from services.registry import registry
|
|
|
|
router = APIRouter(tags=["health"])
|
|
|
|
|
|
@router.get("/health")
|
|
async def health():
|
|
gpu = await get_gpu_info()
|
|
return {
|
|
"status": "ok",
|
|
"backends": registry.get_health_summary(),
|
|
"gpu": gpu,
|
|
}
|
|
|
|
|
|
@router.get("/health/{backend_id}")
|
|
async def backend_health(backend_id: str):
|
|
backend = registry.backends.get(backend_id)
|
|
if not backend:
|
|
return {"error": {"message": f"Backend '{backend_id}' not found"}}
|
|
|
|
return {
|
|
"id": backend.id,
|
|
"type": backend.type,
|
|
"status": "healthy" if backend.healthy else "down",
|
|
"models": [m.id for m in backend.models],
|
|
"latency_ms": backend.latency_ms,
|
|
}
|