diff --git a/config.yaml b/config.yaml index 6e60289..bbcbadb 100644 --- a/config.yaml +++ b/config.yaml @@ -30,21 +30,11 @@ ai: repetition_penalty: 1.05 # 한국어 장문 반복/코드스위칭(CJK·라틴 누수) 억제 (보수적 시작값) top_k: 20 # Qwen3 권장 - # deep: 야간 night-drain 전용 — 맥북 M5 Max Qwen3.6-27B-6bit (llm-router :8890 경유, - # model=qwen-macbook alias). 2026-06-11 재도입 (사용자: 자기 전 night-drain 으로 백로그 분담). - # 맥북 불가(503/연결/절단) = StageDeferred 보류 — 맥미니/cloud 강등 없음, attempts 미소모. - # consumer 의 deep_summary 도 슬롯 존재 시 맥북 경유 (잠들어 있으면 30분 백오프 보류 = 무해). - # 슬롯 제거 시 deep_summary 는 primary(맥미니) 경로 복귀. - deep: - endpoint: "http://100.76.254.116:8890/v1/chat/completions" - model: "qwen-macbook" - max_tokens: 8192 - timeout: 900 - context_char_limit: 260000 - temperature: 0.3 - top_p: 0.9 - repetition_penalty: 1.05 # 한국어 장문 반복/코드스위칭 억제 (보수적 시작값) - top_k: 20 + # deep: ★2026-06-29 잠정 보류 (사용자 "맥북 night-drain 의미없어 → 맥미니 일원화"). + # 슬롯 제거 → deep_summary 가 primary(맥미니) 경로 복귀 + use_deep/drain 도 맥미니 폴백 + # (맥북 라우팅 0). drain-keeper(GPU cron)도 비활성. 맥북 mlx-vlm-server 는 OpenCode 로컬용 보존. + # 복원(night-drain 재개 시): git history 에서 deep 슬롯(qwen-macbook :8890, max_tokens 8192, + # timeout 900, context_char_limit 260000, temp 0.3 / top_p 0.9 / rep 1.05 / top_k 20) 부활 + drain-keeper 재활성. # fallback: primary 장애 시 최후 방어선. Claude Sonnet 4 API (소액 한도, 자동 trigger). # 호출 빈도 낮음 가정 (Mac mini 가 거의 항상 up) → premium 과 budget 공유 OK.