hyungi_document_server/gpu-server/docker-compose.yml

# ═══════════════════════════════════════════════════
# 이 파일은 더 이상 사용하지 않음.
# 루트 docker-compose.yml로 통합됨 (2026-04-03).
# ═══════════════════════════════════════════════════

services:
  ollama:
    image: ollama/ollama
    volumes:
      - ollama_data:/root/.ollama
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: 1
              capabilities: [gpu]
    ports:
      - "11434:11434"
    restart: unless-stopped

  ai-gateway:
    build: ./services/ai-gateway
    ports:
      - "8080:8080"
    environment:
      - PRIMARY_ENDPOINT=${PRIMARY_ENDPOINT:-http://mac-mini:8800/v1/chat/completions}
      - FALLBACK_ENDPOINT=http://ollama:11434/v1/chat/completions
      - CLAUDE_API_KEY=${CLAUDE_API_KEY:-}
      - DAILY_BUDGET_USD=${DAILY_BUDGET_USD:-5.00}
    depends_on:
      - ollama
    restart: unless-stopped

volumes:
  ollama_data: