Hyungi Ahn
e595283e27
fix(search): Phase 2.2 multilingual 활성 조건을 news/global 한정으로 좁힘
## 1차 측정 결과
| metric | Phase 1.3 | Phase 2.2 (all domains) | Δ |
|---|---|---|---|
| Recall@10 | 0.730 | 0.683 | -0.047 ❌ |
| natural_language_ko NDCG | 0.73 | 0.63 | -0.10 ❌ |
| news_crosslingual NDCG | 0.27 | 0.37 | +0.10 ✓ |
| crosslingual_ko_en NDCG | 0.53 | 0.50 | -0.03 ❌ |
document 도메인에서 ko→en 번역 쿼리가 한국어 법령 검색에 noise로 작용.
"기계 사고 관련 법령" → "machinery accident laws" 영어 embedding이
한국어 법령 문서와 매칭 약해서 ko 결과를 오히려 밀어냄.
## 수정
use_multilingual 조건 강화:
- 기존: analyzer_tier == "analyzed" + normalized_queries >= 2
- 추가: domain_hint == "news" OR language_scope == "global"
즉 document 도메인은 기존 single-query 경로 유지 → 회귀 복구.
news / global 영역만 multilingual → news_crosslingual 개선 유지.
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-04-08 15:20:05 +09:00
..
2026-04-08 12:41:47 +09:00
2026-04-08 15:20:05 +09:00
2026-04-06 07:15:13 +09:00
2026-04-07 13:26:37 +09:00
2026-04-08 14:47:09 +09:00
2026-04-08 15:12:13 +09:00
2026-04-02 13:21:45 +09:00
2026-04-08 13:08:23 +09:00
2026-04-03 12:45:02 +09:00
2026-04-08 14:47:09 +09:00
2026-04-06 13:38:07 +09:00