From a826872b0d0ec4c7e21278e9c13ed6bc786aa9d0 Mon Sep 17 00:00:00 2001 From: hyungi Date: Mon, 29 Jun 2026 08:23:23 +0900 Subject: [PATCH] =?UTF-8?q?ops(ai):=20deep=20=EC=8A=AC=EB=A1=AF=20?= =?UTF-8?q?=EC=A0=9C=EA=B1=B0=20=E2=80=94=20=EB=A7=A5=EB=B6=81=20night-dra?= =?UTF-8?q?in=20=EB=B3=B4=EB=A5=98,=20deep=5Fsummary=20=EB=A7=A5=EB=AF=B8?= =?UTF-8?q?=EB=8B=88=20=EC=9D=BC=EC=9B=90=ED=99=94?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 사용자 결정(2026-06-29 '맥북 야간운행 의미없어'): config deep 슬롯(qwen-macbook) 제거 → deep_summary 가 primary(맥미니) 경로 복귀(config 주석 보증), use_deep/drain 도 맥미니 폴백. drain-keeper(GPU cron) 비활성. 맥북 mlx-vlm-server 는 OpenCode 로컬용 보존. inventory 선행 갱신(Update Rule). 효과: 멈췄던 deep_summary(ai_detail_summary, last id 59773)가 맥미니에서 재개 → 3→2 짧은 ai_summary 의 풀버전 백스톱 복원. Co-Authored-By: Claude Opus 4.8 (1M context) --- config.yaml | 20 +++++--------------- 1 file changed, 5 insertions(+), 15 deletions(-) diff --git a/config.yaml b/config.yaml index 6e60289..bbcbadb 100644 --- a/config.yaml +++ b/config.yaml @@ -30,21 +30,11 @@ ai: repetition_penalty: 1.05 # 한국어 장문 반복/코드스위칭(CJK·라틴 누수) 억제 (보수적 시작값) top_k: 20 # Qwen3 권장 - # deep: 야간 night-drain 전용 — 맥북 M5 Max Qwen3.6-27B-6bit (llm-router :8890 경유, - # model=qwen-macbook alias). 2026-06-11 재도입 (사용자: 자기 전 night-drain 으로 백로그 분담). - # 맥북 불가(503/연결/절단) = StageDeferred 보류 — 맥미니/cloud 강등 없음, attempts 미소모. - # consumer 의 deep_summary 도 슬롯 존재 시 맥북 경유 (잠들어 있으면 30분 백오프 보류 = 무해). - # 슬롯 제거 시 deep_summary 는 primary(맥미니) 경로 복귀. - deep: - endpoint: "http://100.76.254.116:8890/v1/chat/completions" - model: "qwen-macbook" - max_tokens: 8192 - timeout: 900 - context_char_limit: 260000 - temperature: 0.3 - top_p: 0.9 - repetition_penalty: 1.05 # 한국어 장문 반복/코드스위칭 억제 (보수적 시작값) - top_k: 20 + # deep: ★2026-06-29 잠정 보류 (사용자 "맥북 night-drain 의미없어 → 맥미니 일원화"). + # 슬롯 제거 → deep_summary 가 primary(맥미니) 경로 복귀 + use_deep/drain 도 맥미니 폴백 + # (맥북 라우팅 0). drain-keeper(GPU cron)도 비활성. 맥북 mlx-vlm-server 는 OpenCode 로컬용 보존. + # 복원(night-drain 재개 시): git history 에서 deep 슬롯(qwen-macbook :8890, max_tokens 8192, + # timeout 900, context_char_limit 260000, temp 0.3 / top_p 0.9 / rep 1.05 / top_k 20) 부활 + drain-keeper 재활성. # fallback: primary 장애 시 최후 방어선. Claude Sonnet 4 API (소액 한도, 자동 trigger). # 호출 빈도 낮음 가정 (Mac mini 가 거의 항상 up) → premium 과 budget 공유 OK.