Files
hyungi_document_server/app/services/prompt_versions.py
T
Hyungi Ahn eb9dc94604 feat(search): E.3 — ask synthesis prompt v2-600char bump
한도 400 → 600 자. baseline 관찰(partial avg 168자 / full 10%)에서
길이 제약이 실제 출력 제약이 되는 현상 확인, 절차·비교 카테고리
답변 깊이 확보 목적.

변경 4 라인:
- search_synthesis.txt:17  answer 400→600 characters max
- prompt_versions.py:20    v1-400char → v2-600char (telemetry)
- synthesis_service.py:42  PROMPT_VERSION v1→v2 (cache key 의미론 동기화)
- synthesis_service.py:46  MAX_ANSWER_CHARS 400→600 (hard clip 동기화)

v1 post-tier0 baseline: 225 rows, partial 51% / insufficient 49% / full 0%
(Tier 0 fix 로 full+refused=True 모순 0 건). E.6 는 이 clean baseline 을
compare-against 로 사용.

향후 티켓: PROMPT_VERSION 과 ASK_PROMPT_VERSION 단일 소스 통합.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-04-17 12:02:51 +09:00

41 lines
1.7 KiB
Python

"""프롬프트/모델 버전 상수 — telemetry 기록용 (Phase E.1)
목적: ask_events / analyze_events 에 prompt_version 과 model_name 을 기록해서
튜닝 전/후 비교와 실험 분기를 식별 가능하게 함.
규칙:
- 프롬프트 파일이 의미 있게 바뀌면 해당 상수 문자열을 bump (예: v1-400char → v2-600char)
- 하드코딩 금지. 파이프라인은 여기 상수만 참조.
- 모델명은 런타임 config(settings.ai.primary.model)에서 읽어서 resolve_primary_model() 사용.
E.3 배포 타임라인:
- v1-400char → 현재 (search_synthesis.txt 17행 "400 characters max")
- v2-600char → E.3 배포 시 bump (동일 파일 "600 characters max")
"""
from __future__ import annotations
# ─── ask (/search/ask) 프롬프트 버전 ─────────────────────────
# synthesis_service.py 가 로드하는 app/prompts/search_synthesis.txt 기준
ASK_PROMPT_VERSION: str = "search_synthesis.v2-600char"
# ─── /analyze 프롬프트 버전 ──────────────────────────────────
# documents.py analyze 라우트가 로드하는 app/prompts/document_analyze.txt 기준
ANALYZE_PROMPT_VERSION: str = "document_analyze.v1"
def resolve_primary_model() -> str | None:
"""런타임 config에서 primary 모델명을 resolve.
settings.ai 가 미구성이면 None.
telemetry 기록은 None 허용 (측정 필드는 nullable).
"""
try:
from core.config import settings
if settings.ai and settings.ai.primary:
return settings.ai.primary.model
except Exception:
pass
return None