From 18d684b501fded5a36040b28978d96fbbf1c4a14 Mon Sep 17 00:00:00 2001 From: Hyungi Ahn Date: Fri, 24 Apr 2026 10:08:00 +0900 Subject: [PATCH] =?UTF-8?q?ops(infra):=20STT=20Mac=20mini=20=EC=9D=B4?= =?UTF-8?q?=EC=A0=84=20+=20classifier=20=EC=84=B9=EC=85=98=20=EB=B3=B5?= =?UTF-8?q?=EC=9B=90=20(gemma4:e4b)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - docker-compose.yml stt-service 를 profiles:[legacy] 로 이동. GPU 의 stt-service 는 더 이상 기동하지 않고, fastapi STT_ENDPOINT 가 Mac mini (기본 100.76.254.116:8804 Tailscale, MAC_MINI_HOST env 로 LAN IP 주입) 를 바라보도록 변경. 복원 필요 시 `docker compose --profile legacy up -d stt-service`. - config.yaml: classifier 섹션을 gemma4:e4b-it-q8_0 으로 복원. 이전 B-0 커밋이 classifier 를 주석 처리했는데, 실제로는 classifier_service 가 쓰고 있어 gate 유효. exaone 은 이미 제거됐으니 모델만 gemma4 로 통일. classifier_service 의 hasattr 체크는 유지되어 fallback 안전. D13 (STT 이전) drift 를 main 으로 승격. inventory 갱신은 B-3 마감 단계에서 3-tier + STT 경로 묶어서 일괄. Co-Authored-By: Claude Opus 4.7 (1M context) --- config.yaml | 12 ++++++++++-- docker-compose.yml | 9 ++++++++- 2 files changed, 18 insertions(+), 3 deletions(-) diff --git a/config.yaml b/config.yaml index e56e55e..29bce37 100644 --- a/config.yaml +++ b/config.yaml @@ -44,8 +44,16 @@ ai: rerank: endpoint: "http://ollama:11434/api/rerank" model: "bge-reranker-v2-m3" - # 제거: classifier (Phase 3.5a exaone 흔적 — classifier_service 가 hasattr 로 optional - # 처리하므로 제거 안전) / vision (미사용) + + # Phase 3.5a answerability classifier. 모델은 gemma4:e4b 로 통일 (exaone 제거 반영). + # classifier_service 가 hasattr 체크로 optional 이므로 이 섹션 제거 시 classifier gate + # 는 자동 skip (score-only). 지금은 의도적으로 유지. + classifier: + endpoint: "http://ollama:11434/v1/chat/completions" + model: "gemma4:e4b-it-q8_0" + max_tokens: 512 + timeout: 10 + # 제거: vision (미사용) # ─── deep_summary enqueue 폭발 억제 (B-1 R2) ─── # 초기 튜닝 전 deep_summary 큐에 soft escalate 가 과발생하면 MLX 26B 가 포화된다. diff --git a/docker-compose.yml b/docker-compose.yml index 0195397..5d66999 100644 --- a/docker-compose.yml +++ b/docker-compose.yml @@ -55,6 +55,11 @@ services: restart: unless-stopped stt-service: + # 2026-04-24: STT 가 Mac mini (faster-whisper, 192.168.1.122:8804 / 100.76.254.116:8804) + # 로 이전됨. GPU 에서 컨테이너는 더 이상 기동하지 않는다. 복원이 필요하면 + # `docker compose --profile legacy up -d stt-service` 로 legacy 프로파일 활성화. + # fastapi 의 STT_ENDPOINT 도 Mac mini 주소를 가리킴 (아래 environment 참고). + profiles: [legacy] build: ./services/stt expose: - "3300" @@ -154,7 +159,9 @@ services: - DATABASE_URL=postgresql+asyncpg://pkm:${POSTGRES_PASSWORD}@postgres:5432/pkm - KORDOC_ENDPOINT=http://kordoc-service:3100 - OCR_ENDPOINT=http://ocr-service:3200 - - STT_ENDPOINT=http://stt-service:3300 + # 2026-04-24 STT Mac mini 이전: 기본값 100.76.254.116:8804 (Tailscale), 필요 시 + # MAC_MINI_HOST env 로 192.168.1.122 등 LAN IP 주입. + - STT_ENDPOINT=http://${MAC_MINI_HOST:-100.76.254.116}:8804 restart: unless-stopped frontend: