From 2bbdf63d86437ab5ebb58624379a2cb8685bc450 Mon Sep 17 00:00:00 2001 From: hyungi Date: Fri, 12 Jun 2026 11:17:42 +0900 Subject: [PATCH] =?UTF-8?q?ops(eval):=20Phase=202A=20eval=20=EB=8F=99?= =?UTF-8?q?=EA=B2=B0=20=E2=80=94=20embed/chunk=20=EC=9D=BC=EC=8B=9C=20hold?= =?UTF-8?q?=20(eval=20=ED=9B=84=20=EB=B3=B5=EC=9B=90)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Fable 5 --- config.yaml | 4 +++- 1 file changed, 3 insertions(+), 1 deletion(-) diff --git a/config.yaml b/config.yaml index 0d9afa3..803fe7d 100644 --- a/config.yaml +++ b/config.yaml @@ -198,7 +198,9 @@ schedule: # 그 외 문자열은 무동작(오타 주의). 적용/해제 = 리스트 수정 후 fastapi 재기동. # 이력: 2026-06-11 맥미니 모델 확정까지 8키 홀드 → 同日 Qwen3.6-27B-6bit 전환과 함께 해제([]). pipeline: - held_stages: [] + # Phase 2A eval 코퍼스 동결 (2026-06-12, 일시): embed/chunk 만 보류 — 동결셋(id<=41944/104140) + # 위 베이스라인 코퍼스가 eval 도중 자라지 않게. eval 종료 즉시 [] 복원 커밋. + held_stages: ["embed", "chunk"] # mlx gate 동시 실행 상한 (2026-06-12 fair-share): 구 "1 고정" 룰의 전제(single-inference # 서버)가 소멸 — 현 mlx_vlm 은 continuous batching (2026-06-11 밤 6~8 concurrent 실측 정상). # 2 = 워커 LLM 호출과 인터랙티브(ask/eid)가 서로 안 막힘 + 집계 throughput ~1.8배.