diff --git a/config.yaml b/config.yaml index e56e55e..29bce37 100644 --- a/config.yaml +++ b/config.yaml @@ -44,8 +44,16 @@ ai: rerank: endpoint: "http://ollama:11434/api/rerank" model: "bge-reranker-v2-m3" - # 제거: classifier (Phase 3.5a exaone 흔적 — classifier_service 가 hasattr 로 optional - # 처리하므로 제거 안전) / vision (미사용) + + # Phase 3.5a answerability classifier. 모델은 gemma4:e4b 로 통일 (exaone 제거 반영). + # classifier_service 가 hasattr 체크로 optional 이므로 이 섹션 제거 시 classifier gate + # 는 자동 skip (score-only). 지금은 의도적으로 유지. + classifier: + endpoint: "http://ollama:11434/v1/chat/completions" + model: "gemma4:e4b-it-q8_0" + max_tokens: 512 + timeout: 10 + # 제거: vision (미사용) # ─── deep_summary enqueue 폭발 억제 (B-1 R2) ─── # 초기 튜닝 전 deep_summary 큐에 soft escalate 가 과발생하면 MLX 26B 가 포화된다. diff --git a/docker-compose.yml b/docker-compose.yml index 0195397..5d66999 100644 --- a/docker-compose.yml +++ b/docker-compose.yml @@ -55,6 +55,11 @@ services: restart: unless-stopped stt-service: + # 2026-04-24: STT 가 Mac mini (faster-whisper, 192.168.1.122:8804 / 100.76.254.116:8804) + # 로 이전됨. GPU 에서 컨테이너는 더 이상 기동하지 않는다. 복원이 필요하면 + # `docker compose --profile legacy up -d stt-service` 로 legacy 프로파일 활성화. + # fastapi 의 STT_ENDPOINT 도 Mac mini 주소를 가리킴 (아래 environment 참고). + profiles: [legacy] build: ./services/stt expose: - "3300" @@ -154,7 +159,9 @@ services: - DATABASE_URL=postgresql+asyncpg://pkm:${POSTGRES_PASSWORD}@postgres:5432/pkm - KORDOC_ENDPOINT=http://kordoc-service:3100 - OCR_ENDPOINT=http://ocr-service:3200 - - STT_ENDPOINT=http://stt-service:3300 + # 2026-04-24 STT Mac mini 이전: 기본값 100.76.254.116:8804 (Tailscale), 필요 시 + # MAC_MINI_HOST env 로 192.168.1.122 등 LAN IP 주입. + - STT_ENDPOINT=http://${MAC_MINI_HOST:-100.76.254.116}:8804 restart: unless-stopped frontend: