diff --git a/app/services/briefing/clustering.py b/app/services/briefing/clustering.py index 2b62569..6896f6e 100644 --- a/app/services/briefing/clustering.py +++ b/app/services/briefing/clustering.py @@ -5,7 +5,7 @@ Phase 4 와 axis 반대: country 별 cluster 가 아닌 **전체 doc 합쳐서 t 파라미터 (5h 윈도우용): - LAMBDA = ln(2)/2h ≈ 0.347 (2시간 반감기, 야간 5h 윈도우라 빠른 감쇠) -- threshold = 0.78 고정 (Phase 4 0.75~0.80 중간값) +- threshold = 0.70 (2026-05-13 조정 — 0.78 에서 spread case kept=1 발생 후 완화) - MIN_ARTICLES_PER_TOPIC = 2 (야간 sparse 대비 완화) - MIN_COUNTRIES_PER_TOPIC = 2 (cross-country 가치 핵심) - MAX_TOPICS = 7 (1페이지 분량) @@ -22,7 +22,7 @@ from services.clustering_common import ( logger = setup_logger("briefing_clustering") LAMBDA = math.log(2) / (2.0 / 24.0) # 2시간 반감기 (단위: 일) -THRESHOLD = 0.78 +THRESHOLD = 0.70 CENTROID_ALPHA = 0.7 MIN_ARTICLES_PER_TOPIC = 2 MIN_COUNTRIES_PER_TOPIC = 2