gpu-services/nanoclaude/config.py

from pydantic_settings import BaseSettings


class Settings(BaseSettings):
    # EXAONE (rewriter) via Ollama
    exaone_base_url: str = "http://localhost:11434"
    exaone_model: str = "exaone3.5:7.8b-instruct-q8_0"
    exaone_temperature: float = 0.7
    exaone_timeout: float = 30.0  # rewrite는 짧아야 함

    # Gemma 4 (reasoner) via MLX on Mac mini
    reasoning_base_url: str = "http://192.168.1.122:8800"
    reasoning_model: str = "mlx-community/gemma-4-26b-a4b-it-8bit"
    reasoning_temperature: float = 0.7
    reasoning_timeout: float = 180.0

    # Pipeline
    pipeline_enabled: bool = True  # False = EXAONE 단독 모드 (Phase 1 fallback)

    # Queue
    max_concurrent_jobs: int = 3

    # Health check
    health_check_interval: float = 30.0

    # Server
    host: str = "0.0.0.0"
    port: int = 8100

    # DB
    db_path: str = "/app/data/nanoclaude.db"

    # Optional API key (empty = disabled)
    api_key: str = ""

    model_config = {"env_file": ".env", "extra": "ignore"}


settings = Settings()