hyungi_document_server

hyungi/hyungi_document_server

Fork 0

Commit Graph

Author	SHA1	Message	Date
Hyungi Ahn	c9f766512d	feat(eval): run_eval_ask runner 에 X-Eval-Token/X-Eval-Case-Id 전파 추가 배경: Phase 3.5 fix2 로 서버 /ask 는 X-Source=eval 을 받아들이려면 X-Eval-Token 이 EVAL_RUNNER_TOKEN 와 일치해야 함. runner 에 해당 헤더 주입 경로가 없어 eval 호출이 전부 source='document_server' 로 강등됐음. 변경: - call_ask / call_analyze: eval_token, eval_case_id 인자 추가. 조건부 헤더 주입 - run_eval: eval_token 파라미터 추가 - CLI: --eval-token 플래그 추가 (env EVAL_RUNNER_TOKEN 자동 fallback) - main(): --source=eval + --eval-token 미지정 조합에 warning 출력 - eval_case_id 는 item id 자동 전달 → ask_events.eval_case_id join 키로 활용 E.6 재측정의 source='eval' 정확 기록 선결 조건. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-17 09:12:24 +09:00
Hyungi Ahn	c82d52e73f	feat(eval): E.6 runner + 평가셋 main 복원 (from feat/eval-infra) selective checkout (not cherry-pick): - scripts/run_eval_ask.py (RESULT_FIELDS 21 고정, X-Source:eval 헤더) - evals/ask_analyze_v1.jsonl (300 case = ask 220 + analyze 80) E.3/E.6 측정 진입점. feat/eval-infra 의 원본은 유지. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-17 09:10:18 +09:00

Author

SHA1

Message

Date

Hyungi Ahn

c9f766512d

feat(eval): run_eval_ask runner 에 X-Eval-Token/X-Eval-Case-Id 전파 추가

배경: Phase 3.5 fix2 로 서버 /ask 는 X-Source=eval 을 받아들이려면
X-Eval-Token 이 EVAL_RUNNER_TOKEN 와 일치해야 함. runner 에 해당 헤더
주입 경로가 없어 eval 호출이 전부 source='document_server' 로 강등됐음.

변경:
- call_ask / call_analyze: eval_token, eval_case_id 인자 추가. 조건부 헤더 주입
- run_eval: eval_token 파라미터 추가
- CLI: --eval-token 플래그 추가 (env EVAL_RUNNER_TOKEN 자동 fallback)
- main(): --source=eval + --eval-token 미지정 조합에 warning 출력
- eval_case_id 는 item id 자동 전달 → ask_events.eval_case_id join 키로 활용

E.6 재측정의 source='eval' 정확 기록 선결 조건.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

2026-04-17 09:12:24 +09:00

Hyungi Ahn

c82d52e73f

feat(eval): E.6 runner + 평가셋 main 복원 (from feat/eval-infra)

selective checkout (not cherry-pick):
- scripts/run_eval_ask.py (RESULT_FIELDS 21 고정, X-Source:eval 헤더)
- evals/ask_analyze_v1.jsonl (300 case = ask 220 + analyze 80)

E.3/E.6 측정 진입점. feat/eval-infra 의 원본은 유지.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

2026-04-17 09:10:18 +09:00

2 Commits