feat(auth): JWT iat + users.password_changed_at invalidation (PR-Docsrv-JWT-Invalidation-1)

PR-Infra-Sec-1H Phase 0 audit 에서 DS jwt invalidation 정책 부재 확정. password rotation 으로 구 365d JWT (voice-memo-bot 등) invalidate 안 되는 hard gate STOP 진입 → 선행 PR 분리. - migration 269: users.password_changed_at timestamptz NULL (legacy 호환) - create_access_token / create_refresh_token: payload 에 iat (int 초) 추가 - verify_password_changed_at helper: int(password_changed_at.timestamp()) > int(iat) 시 401 - get_current_user + refresh_token route: verify helper 호출 - change_password / setup signup / seed_admin INSERT+UPDATE: password_changed_at 갱신 NULL = 검증 skip (migration 직후 운영 영향 0). 첫 password 변경 후만 iat 검증 활성. Sec-1H 의 G-token-old hard gate 통과 path 확보.
refactor(search): swap 10 call sites to acquire_mlx_gate(Priority.*) (B-1)
2026-05-17 06:20:18 +00:00 · 2026-05-17 08:51:57 +09:00 · 2026-05-17 08:42:58 +09:00 · 2026-05-17 08:07:51 +09:00 · 2026-05-17 08:01:22 +09:00 · 2026-05-17 07:51:02 +09:00
533 changed files with 67219 additions and 1769 deletions
@@ -17,6 +17,11 @@ logs/
 # 데이터 (법령 다운로드 등)
 data/

+# eval/calibration 실행 결과 (baseline jsonl 등)
+# reports/ 는 이미 tracked 파일 있음 → 전체 ignore 하지 않음
+results/
+artifacts/
+
 # macOS
 .DS_Store
 ._*
@@ -32,3 +37,13 @@ node_modules/
 # Docker volumes
 pgdata/
 caddy_data/
+
+# Host venv (run_eval 등 host에서 실행)
+.venv/
+
+# 작업 전 백업 / 롤백 스냅샷 (working tree only, git history 보존이 source of truth)
+*.bak
+*.bak-*
+*.bak_*
+*.pre-*
+.pre-*/
@@ -1,113 +1,73 @@
 # hyungi_Document_Server — Claude Code 작업 가이드

+## Infrastructure Reference 📌
+
+운영 사실 (모델명 / 엔드포인트 / IP / 컨테이너 / 포트 / drift) 의 단일 진실 소스(SSOT):
+
+**`~/.claude/projects/-Users-hyungiahn/memory/infra_inventory.md`**
+
+이 파일과 inventory 가 충돌하면 **inventory 가 정답**. 본 CLAUDE.md 는 코딩 규칙·워크플로우·코드 구조에 집중하고 운영 값은 박지 않는다.
+
+운영 변경 정책 (inventory → config → deploy → verify):
+1. `infra_inventory.md` 먼저 갱신
+2. `config.yaml` / `credentials.env` 갱신
+3. deploy (commit → push → GPU pull → `docker compose up -d --build`)
+4. verify (smoke endpoint, postgres count, 모니터링)
+
+순서 어기면 drift. 발견 시 inventory `Drift Log` 등록.
+
+**Search experiment soft lock**: Phase 2 search refactor / QueryAnalyzer / run_eval 진행 중일 때 GPU 서버의 `docker compose restart`, `config.yaml` 수정, Ollama pull 금지. flag = `~/.claude/.search-experiment-active`.
+
+---
+
 ## 프로젝트 개요

-Self-hosted PKM(Personal Knowledge Management) 웹 애플리케이션.
-FastAPI + PostgreSQL(pgvector) + SvelteKit + Docker Compose 기반.
-GPU 서버를 메인 서버, Mac mini를 AI 추론, Synology NAS를 파일 저장소로 사용.
+Self-hosted PKM(Personal Knowledge Management) + 다국 뉴스 비교 분석 웹 애플리케이션.
+GPU 서버가 메인 (Docker Compose / DB / 검색 / OCR / 마커), Mac mini = MLX 추론 + Whisper STT, Synology NAS = 파일 원본.

 ## 핵심 문서

-1. `docs/architecture.md` — 전체 시스템 아키텍처 (DB 스키마, AI 전략, 인프라, UI 설계)
-2. `docs/deploy.md` — Docker Compose 배포 가이드
-3. `docs/development-stages.md` — Phase 0~5 개발 단계별 가이드
+1. `README.md` — 외부 소개 (기술 스택 / 주요 기능 / Quick Start)
+2. `docs/architecture.md` — 전체 시스템 아키텍처
+3. `docs/deploy.md` — Docker Compose 배포 가이드
+4. `docs/development-stages.md` — Phase roadmap (역사적 맥락)

 ## 기술 스택

 | 영역 | 기술 |
 |------|------|
-| 백엔드 | FastAPI (Python 3.11+) |
-| 데이터베이스 | PostgreSQL 16 + pgvector + pg_trgm |
+| 백엔드 | FastAPI (Python 3.11+), SQLAlchemy 2.0 async, APScheduler |
+| DB | PostgreSQL 16 + pgvector + pg_trgm (단일 `pkm` DB) |
 | 프론트엔드 | SvelteKit 5 (runes mode) + Tailwind CSS 4 |
-| 문서 파싱 | kordoc (HWP/HWPX/PDF → Markdown) + LibreOffice (오피스 → 텍스트/PDF) |
-| 리버스 프록시 | Caddy (HTTP only, 앞단 프록시에서 HTTPS 처리) |
-| 인증 | JWT + TOTP 2FA |
+| 문서 파싱 | kordoc (HWP/HWPX/PDF → MD), LibreOffice headless (오피스), marker (PDF → markdown) |
+| OCR | Surya OCR (docker compose `ocr-service`, GPU) |
+| STT | MLX Whisper (Mac mini), GPU faster-whisper 는 legacy profile |
+| 리버스 프록시 | Caddy (HTTP only, 앞단 home-caddy 가 HTTPS 종료) |
+| 인증 | JWT (access) + HttpOnly cookie (refresh) + TOTP 2FA |
 | 컨테이너 | Docker Compose |

-## 네트워크 환경
+## 머신 역할 (자세한 IP / 포트 → inventory)

-```
-GPU 서버 (RTX 4070 Ti Super, Ubuntu, 메인 서버):
-  - Docker Compose: FastAPI(:8000), PostgreSQL(:5432), kordoc(:3100),
-    Caddy(:8080 HTTP only), Ollama(127.0.0.1:11434), AI Gateway(127.0.0.1:8081), frontend(:3000)
-  - NFS 마운트: /mnt/nas/Document_Server → NAS /volume4/Document_Server
-  - 외부 접근: document.hyungi.net (Mac mini nginx → Caddy)
-  - 로컬 IP: 192.168.1.186
+| 머신 | 역할 |
+|------|------|
+| GPU 서버 | Docker Compose 메인: fastapi · frontend · postgres `pkm` · kordoc · ocr-service · marker-service · reranker (TEI) · caddy. Ollama (embedding / 4B 추론). home-gateway 별 compose (ingress + 나노클로 + searxng) |
+| Mac mini | MLX 26B 추론 endpoint + MLX Whisper STT. ingress 역할 0 |
+| Synology NAS | 파일 원본 (`/volume4/Document_Server/PKM/` → GPU `/mnt/nas/Document_Server` NFS), Synology Office/Drive/Calendar/MailPlus |
+| VPS-2 (OVH) | 메일 relay (`relay.hyungi.net:587`), Gitea bare mirror, Secondary MX |

-Mac mini M4 Pro (AI 서버 + 앞단 프록시):
-  - MLX Server: http://100.76.254.116:8800/v1/chat/completions (Qwen3.5-35B-A3B)
-  - nginx: HTTPS 종료 → GPU 서버 Caddy(:8080)로 프록시
-  - Tailscale IP: 100.76.254.116
+## AI 파이프라인 (역할 기준 — 실제 모델 매핑은 inventory)

-Synology NAS (DS1525+):
-  - LAN IP: 192.168.1.227
-  - Tailscale IP: 100.101.79.37
-  - 파일 원본: /volume4/Document_Server/PKM/
-  - NFS export → GPU 서버
-  - Synology Drive: https://link.hyungi.net (문서 편집)
-  - Synology Calendar: CalDAV 태스크 관리
-  - MailPlus: IMAP(993) + SMTP(465)
-```
+| 역할 | 위치 |
+|------|------|
+| 분류/심층 요약 primary | Mac mini MLX 26B |
+| Triage (1차 분류) / Fallback / Chat | GPU Ollama 4B |
+| Embedding | GPU Ollama (1024d, 다국어) |
+| Reranker | GPU TEI 컨테이너 |
+| OCR | docker compose `ocr-service` (Surya OCR GPU) — `ai.models.vision` 미사용 |
+| STT | Mac mini MLX Whisper large-v3 |
+| Premium (수동 trigger) | Anthropic API (`require_explicit_trigger`, 일일 한도) |

-## 인증 정보
-
- 위치: `credentials.env` (프로젝트 루트, .gitignore에 포함)
- 템플릿: `credentials.env.example`
- 스크립트에서 python-dotenv 또는 Docker env_file로 로딩
-
-## AI 모델 구성
-
-```
-Primary (Mac mini MLX, Tailscale 경유, 상시, 무료):
-  mlx-community/Qwen3.5-35B-A3B-4bit — 분류, 태그, 요약
-  → http://100.76.254.116:8800/v1/chat/completions
-
-Fallback (GPU Ollama, 같은 Docker 네트워크, MLX 장애 시):
-  qwen3.5:35b-a3b
-  → http://ollama:11434/v1/chat/completions
-
-Premium (Claude API, 종량제, 수동 트리거만):
-  claude-sonnet — 복잡한 분석, 장문 처리
-  → 일일 한도 $5, require_explicit_trigger: true
-
-Embedding (GPU Ollama, 같은 Docker 네트워크):
-  nomic-embed-text → 벡터 임베딩
-  Qwen2.5-VL-7B → 이미지/도면 OCR
-  bge-reranker-v2-m3 → RAG 리랭킹
-```
-
-## 프로젝트 구조
-
-```
-hyungi_Document_Server/
-├── docker-compose.yml
-├── Caddyfile                    ← HTTP only, auto_https off
-├── config.yaml                  ← AI 엔드포인트, NAS 경로, 스케줄
-├── credentials.env.example
-├── app/                         ← FastAPI 백엔드
-│   ├── main.py                  ← 엔트리포인트 + APScheduler (watcher/consumer 포함)
-│   ├── Dockerfile               ← LibreOffice headless 포함
-│   ├── core/   (config, database, auth, utils)
-│   ├── models/ (document, task, queue)
-│   ├── api/    (documents, search, dashboard, auth, setup)
-│   ├── workers/ (file_watcher, extract, classify, embed, preview, law_monitor, mailplus, digest, queue_consumer)
-│   ├── prompts/classify.txt
-│   └── ai/client.py             ← AIClient + parse_json_response (Qwen3.5 thinking 처리)
-├── services/kordoc/             ← Node.js 마이크로서비스 (HWP/PDF 파싱)
-├── gpu-server/                  ← AI Gateway (deprecated, 통합됨)
-├── frontend/                    ← SvelteKit 5
-│   └── src/
-│       ├── routes/              ← 페이지 (documents, inbox, settings, login)
-│       └── lib/
-│           ├── components/      ← Sidebar, DocumentCard, DocumentViewer, PreviewPanel,
-│           │                      TagPill, FormatIcon, UploadDropzone
-│           ├── stores/          ← auth, ui
-│           └── api.ts           ← fetch wrapper (JWT 토큰 관리)
-├── migrations/                  ← PostgreSQL 스키마 (schema_migrations로 추적)
-├── scripts/
-├── docs/
-└── tests/
-```
+호출 시 반드시 `app/ai/client.py` 의 `AIClient` 사용 (`call_triage` / `call_primary` / `call_fallback`). 직접 HTTP 호출 금지.

 ## 문서 처리 파이프라인

@@ -115,82 +75,77 @@ hyungi_Document_Server/
 파일 업로드 (드래그 앤 드롭 or file_watcher)
    ↓
 extract (텍스트 추출)
-  - kordoc: HWP, HWPX, PDF → Markdown
-  - LibreOffice: xlsx, docx, pptx, odt 등 → txt/csv
-  - 직접 읽기: md, txt, csv, json, xml, html
-    ↓                    ↓
-classify (AI 분류)    preview (PDF 미리보기 생성)
-  - Qwen3.5 → domain     - LibreOffice → PDF 변환
-  - tags, summary         - 캐시: PKM/.preview/{id}.pdf
+  - kordoc:       HWP, HWPX, PDF → Markdown
+  - LibreOffice:  xlsx, docx, pptx 등 → txt/csv
+  - 직접 읽기:    md, txt, csv, json, xml, html
+    ↓                                    ↓
+classify_worker (tier triage)        preview / marker
+  - 4B Ollama → TriageOutput              - LibreOffice → PDF 변환
+  - escalate_to_26b 시 deep_summary       - marker → PDF → markdown
+  - ai_tldr / ai_bullets / inconsistencies
    ↓
-embed (벡터 임베딩)
-  - nomic-embed-text (768차원)
+embed_worker (bge-m3 1024d, doc-level)
+chunk_worker (문서 유형별 chunking)
 ```

-**핵심 원칙:**
+핵심 원칙:
 - 파일은 업로드 위치에 그대로 유지 (물리적 이동 없음)
- 분류(domain/sub_group/tags)는 DB 메타데이터로만 관리
- preview는 classify와 병렬로 실행 (AI 결과 불필요)
+- 분류 (`ai_domain` / `ai_sub_group` / `ai_tags` / `category` / `tier`) 는 DB 메타데이터로만 관리
+- preview / marker 는 classify 와 병렬

-## UI 구조
+## 워커 / 스케줄러 (`app/main.py` 의 scheduler.add_job)

-```
-┌──────────────────────────────────────────────────┐
-│ [☰ 사이드바] [PKM / 문서]           [ℹ 정보] 버튼│  ← 상단 nav
-├──────────────────────────────────────────────────┤
-│ [검색바] [모드] [ℹ]                               │
-│ 문서 목록 (30%) — 드래그 업로드 지원               │  ← 상단 영역
-│   █ 문서카드 (domain 색상 바 + 포맷 아이콘)        │
-├──────────────────────────────────────────────────┤
-│ 하단 뷰어/편집 (70%) — 전체 너비                   │  ← 하단 영역
-│   Markdown: split editor (textarea + preview)    │
-│   PDF: 브라우저 내장 뷰어                          │
-│   오피스: PDF 변환 미리보기 + [편집] 새 탭 버튼     │
-│   이미지: img 태그                                │
-└──────────────────────────────────────────────────┘
+- queue_consumer (interval 1m), file_watcher (5m), upload_cleanup (10m)
+- study_q_embed (1m), study_q_related_refresh (1m), study_queue (1m), study_session_queue (1m)
+- tier_backfill (30m)
+- law_monitor (07:00 KST), mailplus_archive (07/18:00 KST)
+- daily_digest (20:00 KST)
+- **global_digest** (04:00 KST) — Phase 4 country×topic 7일 rolling
+- **morning_briefing** (05:10 KST) — 야간 KST 0~5h 수집 뉴스 topic×country 비교

-사이드바: 평소 접힘, ☰로 오버레이 (domain 트리 + 스마트 그룹 + Inbox)
-정보 패널: ℹ 버튼 → 우측 전체 높이 drawer (메모/태그 편집/메타/처리상태/편집 URL)
-```
+scheduler timezone = `Asia/Seoul`.

 ## 데이터 계층

-1. **원본 파일** (NAS `/volume4/Document_Server/PKM/`) — 유일한 원본, 위치 변경 없음
-2. **가공 데이터** (PostgreSQL) — 텍스트 추출, AI 분류, 검색 인덱스, 메모, 태그
-3. **파생물** — 벡터 임베딩 (pgvector), PDF 미리보기 캐시 (`.preview/`)
+1. **원본 파일** — NAS `/volume4/Document_Server/PKM/`. 유일한 원본, 위치 변경 없음
+2. **가공 데이터** — PostgreSQL `pkm` (텍스트, AI 분류, 검색 인덱스, 메모, 태그, briefing, digest, …)
+3. **파생물** — pgvector embedding, PDF preview 캐시 (`.preview/`), marker 결과 (markdown + extracted_images NAS 저장)

 ## 코딩 규칙

 - Python 3.11+, asyncio, type hints
 - SQLAlchemy 2.0+ async 세션
- Svelte 5 runes mode ($state, $derived, $effect — $: 사용 금지)
- 인증 정보는 credentials.env에서 로딩 (하드코딩 금지)
- 로그는 `logs/`에 저장 (Docker 볼륨)
- AI 호출은 반드시 `app/ai/client.py`의 `AIClient`를 통해 (직접 HTTP 호출 금지)
+- Svelte 5 runes mode (`$state`, `$derived`, `$effect` — `$:` 금지)
+- 인증 정보는 `credentials.env` 에서 로딩 (하드코딩 금지)
+- 로그는 `logs/` (Docker 볼륨)
+- AI 호출은 반드시 `app/ai/client.py` 의 `AIClient` 경유
 - 한글 주석 사용
- Migration: `migrations/*.sql`에 작성, `init_db()`가 자동 실행 (schema_migrations 추적)
-  - SQL에 BEGIN/COMMIT 금지 (외부 트랜잭션 깨짐)
-  - 기존 DB에서는 schema_migrations에 수동 이력 등록 필요할 수 있음
+- Migration: `migrations/NNN_*.sql`, `init_db()` 자동 실행 (`schema_migrations` 추적)
+  - SQL 에 `BEGIN/COMMIT` 금지 (외부 트랜잭션 깨짐)
+  - asyncpg `prepared statement` 가 multi-statement 불허 → 1 statement 1 파일 분리
+  - 기존 DB 에서는 `schema_migrations` 수동 이력 등록 필요할 수 있음
+- 디자인 시스템 토큰 only (`bg-surface`, `text-dim`, `border-default`, `text-accent`, …). `bg-[var(--*)]` 금지 (`lint:tokens` 차단)
+- 커밋 메시지: `type(scope): summary` (`feat` / `fix` / `refactor` / `ops` / `incident` / `docs`)

-## 개발/배포 워크플로우
+## 개발 / 배포 워크플로우

+```bash
+# 개발 (MacBook Pro)
+cd ~/Documents/code/hyungi_Document_Server/
+# 코드 작성 → git commit → push (Gitea)
+
+# 배포 (GPU 서버)
+ssh gpu
+cd ~/Documents/code/hyungi_Document_Server/
+git pull
+docker compose up -d --build fastapi frontend
 ```
-MacBook Pro (개발) → Gitea push → GPU 서버에서 pull

-개발:
-  cd ~/Documents/code/hyungi_Document_Server/
-  # 코드 작성 → git commit & push
-
-GPU 서버 배포 (메인):
-  ssh hyungi@100.111.160.84
-  cd ~/Documents/code/hyungi_Document_Server/
-  git pull
-  docker compose up -d --build fastapi frontend
-```
+PR 머지는 Gitea UI **Rebase and merge** 기본 (선형 히스토리 + force-push 충돌 회피). 단독 작업 확증 시만 로컬 rebase+FF.

 ## v1 코드 참조

-v1(DEVONthink 기반) 코드는 `v1-final` 태그로 보존:
+v1 (DEVONthink 기반) 코드는 `v1-final` 태그로 보존:
 ```bash
 git show v1-final:scripts/law_monitor.py
 git show v1-final:scripts/pkm_utils.py
@@ -198,10 +153,10 @@ git show v1-final:scripts/pkm_utils.py

 ## 주의사항

- credentials.env는 git에 올리지 않음 (.gitignore)
- NAS NFS 마운트 경로: Docker 컨테이너 내 `/documents`
- FastAPI 시작 시 `/documents/PKM` 존재 확인 (NFS 미마운트 방지)
- 법령 API (LAW_OC)는 승인 대기 중
- Ollama/AI Gateway 포트는 127.0.0.1 바인딩 (외부 접근 차단)
- Caddy는 `auto_https off` + `http://` only (HTTPS는 Mac mini nginx에서 처리)
- Synology Office 편집은 새 탭 열기 방식 (iframe 미사용, edit_url 수동 등록)
+- `credentials.env` 는 git 에 올리지 않음 (`.gitignore`)
+- NAS NFS 마운트: Docker 컨테이너 내 `/documents`. FastAPI 시작 시 `/documents/PKM` 존재 확인
+- 법령 API (LAW_OC) 는 승인 대기 중
+- Ollama 는 127.0.0.1 바인딩 (외부 접근 차단)
+- Caddy 는 `auto_https off` + `http://` only (HTTPS 종료는 앞단 home-caddy 가 처리)
+- Synology Office 편집은 새 탭 열기 방식 (iframe 미사용, `edit_url` 수동 등록)
+- 한국어 NFS 경로는 NFC↔NFD 비대칭 — 경로 수신 시 NFC→NFD→parent glob fallback 필수
@@ -1,5 +1,11 @@
 {
    auto_https off
+    # home-caddy (docker bridge 사설망) 가 TLS 를 종단하고 X-Forwarded-Proto: https
+    # 를 전달. trusted_proxies 없으면 Caddy 가 incoming scheme (http) 로 덮어써
+    # FastAPI 307 redirect 의 Location 헤더가 http:// 로 나가 mixed-content block.
+    servers {
+        trusted_proxies static private_ranges
+    }
 }

 http://document.hyungi.net {
@@ -1,64 +1,108 @@
 # hyungi_Document_Server

-Self-hosted 개인 지식관리(PKM) 웹 애플리케이션
+Self-hosted 개인 지식관리(PKM) + 다국 뉴스 비교 분석 웹 애플리케이션.
+
+> 모델 이름·엔드포인트·머신 정보는 운영 상태에 따라 변하므로 README 에 박지 않습니다.
+> 운영 단일 진실 소스(SSOT): `~/.claude/projects/-Users-hyungiahn/memory/infra_inventory.md`.
+> 모델/엔드포인트/포트/SSH 어디서든 README 와 inventory 가 충돌하면 **inventory 가 정답**입니다.

 ## 기술 스택

- **백엔드**: FastAPI + SQLAlchemy (async)
- **데이터베이스**: PostgreSQL 16 + pgvector + pg_trgm
- **프론트엔드**: SvelteKit
- **문서 파싱**: kordoc (HWP/HWPX/PDF → Markdown)
- **AI**: Qwen3.5-35B-A3B (MLX), nomic-embed-text, Claude API (폴백)
- **인프라**: Docker Compose, Caddy, Synology NAS
+- **백엔드**: FastAPI + SQLAlchemy 2.0 async, APScheduler cron
+- **DB**: PostgreSQL 16 + pgvector + pg_trgm (단일 `pkm` DB)
+- **프론트엔드**: SvelteKit 5 (runes mode) + Tailwind CSS 4
+- **문서 파싱**: kordoc 마이크로서비스 (HWP/HWPX/PDF → Markdown), LibreOffice headless (오피스), marker (PDF → markdown Phase 1B)
+- **AI 파이프라인** (역할별, 자세한 모델 매핑은 inventory):
+  - 분류/요약 본체: Mac mini MLX 26B (primary)
+  - Triage / fallback / chat: GPU Ollama 4B
+  - Embedding: GPU Ollama `bge-m3` (1024d)
+  - Reranker: GPU TEI 컨테이너 `bge-reranker-v2-m3`
+  - OCR: docker compose `ocr-service` (Surya OCR GPU)
+  - STT: Mac mini MLX Whisper large-v3
+  - Premium (수동 trigger): Anthropic Claude (`require_explicit_trigger`)
+- **인증**: JWT (access) + HttpOnly cookie (refresh) + TOTP 2FA
+- **인프라**: Docker Compose, Caddy (HTTP only, 앞단 home-caddy 가 HTTPS 종료), Synology NAS NFS

 ## 주요 기능

- 문서 자동 분류/태그/요약 (AI 기반)
- 전문검색 + 벡터 유사도 검색
- HWP/PDF/Markdown 문서 뷰어
- 법령 변경 모니터링 (산업안전보건법 등)
- 이메일 자동 수집 (MailPlus IMAP)
- 일일 다이제스트
- CalDAV 태스크 연동 (Synology Calendar)
+- **문서 자동 분류/태그/요약** — Triage(4B) → Deep summary(26B) tier 분리, 백로그 guard / 텍스트 슬라이스 / inconsistency 감지
+- **하이브리드 검색** — pgvector 벡터 + pg_trgm 전문검색 + reranker (bge-reranker-v2-m3) + Ask pipeline (HyDE / evidence_service)
+- **다국어 OCR** — Surya OCR GPU (한/영/일/중/독/불 등), NFC/NFD 경로 정규화
+- **음성/영상 전사** — MLX Whisper large-v3, `/audio` `/video` 라우트 + direct play
+- **법령 변경 모니터링** — `law_monitor` cron, freshness decay (365일 반감기)
+- **이메일 자동 수집** — MailPlus IMAP, NFS 저장
+- **Phase 4 Global Digest** — 매일 04:00 KST 7일 rolling 뉴스 country×topic 2-level 비교 (`/digest`)
+- **야간 뉴스 브리핑** — 매일 05:10 KST KST 자정~05:00 5시간 윈도우, topic×country 비교 분석 1페이지 카드 (`/news`)
+- **자료실 (Library)** — 카테고리 facet 분류 + AI 제안 1-click 승인
+- **메모/이벤트/공부** — 5초 행동 기록 메모, 일정/할 일/회고 events 도메인, 가스기사 학습 워크스페이스 (274 개념 + 2,100 기출)
+- **마크다운 canonical layer** — extracted_images NAS 저장 + `document_images` 메타 + 단기 토큰 인증 (`?token=`)

 ## Quick Start

 ```bash
-git clone https://git.hyungi.net/hyungi/hyungi_document_server.git hyungi_Document_Server
-cd hyungi_Document_Server
+git clone https://git.hyungi.net/hyungi/hyungi_document_server.git
+cd hyungi_document_server

-# 인증 정보 설정
+# 인증 정보 (DB 비밀번호, JWT secret, Claude API key 등)
 cp credentials.env.example credentials.env
-nano credentials.env  # 실제 값 입력
+$EDITOR credentials.env

-# 실행
-docker compose up -d
+# AI 모델 / 엔드포인트 / 경로
+$EDITOR config.yaml      # inventory 참조하면서 채움
+$EDITOR .env             # POSTGRES_PASSWORD, MAC_MINI_HOST, NAS_NFS_PATH 등
+
+docker compose up -d --build
 ```

-`http://localhost:8000/docs` 에서 API 문서 확인
+운영 도메인 (GPU 서버 배포 기준): `https://document.hyungi.net`
+API 문서: `https://document.hyungi.net/docs`

 ## 디렉토리 구조

 ```
-├── app/              FastAPI 백엔드 (API, 워커, AI 클라이언트)
-├── frontend/         SvelteKit 프론트엔드
-├── services/kordoc/  문서 파싱 마이크로서비스 (Node.js)
-├── gpu-server/       GPU 서버 배포 (AI Gateway)
-├── migrations/       PostgreSQL 스키마
-├── docs/             설계 문서, 배포 가이드
-└── tests/            테스트 코드
+├── app/                FastAPI 백엔드
+│   ├── api/              라우터 (documents, search, briefing, digest, memos, events, study, …)
+│   ├── workers/          APScheduler / queue (briefing_worker, digest_worker, classify_worker, …)
+│   ├── services/         도메인 로직 (briefing/, digest/, search/, clustering_common, …)
+│   ├── ai/client.py      AIClient (call_triage / call_primary / call_fallback, parse_json_response)
+│   ├── prompts/          *.txt 프롬프트 (분류, 요약, briefing_comparative, digest_topic, …)
+│   ├── policy/           AI envelope + prompt_render
+│   └── models/           SQLAlchemy ORM
+├── frontend/           SvelteKit 5 (runes mode) + Tailwind
+│   └── src/routes/       /news (아침 브리핑) /library /memos /audio /video /study /digest /ask …
+├── services/
+│   ├── kordoc/           HWP/HWPX/PDF 파싱 (Node.js)
+│   ├── ocr/              Surya OCR GPU 서비스 (FastAPI)
+│   └── marker/           PDF → markdown Phase 1B
+├── migrations/         255+ SQL migrations (schema_migrations 추적)
+├── docs/               설계 문서
+└── tests/              pytest
 ```

-## 인프라 구성
+`gpu-server/` 폴더는 v1 잔재로 deprecated (현재 AI Gateway 는 `~/home-gateway/` 별 repo).

-| 서버 | 역할 |
-|------|------|
-| Mac mini M4 Pro | Docker Compose (FastAPI, PostgreSQL, kordoc, Caddy) + MLX AI |
-| Synology NAS | 파일 원본 저장, Synology Office/Drive/Calendar/MailPlus |
-| GPU 서버 | AI Gateway, 벡터 임베딩, OCR, 리랭킹 |
+## 인프라 구성 (운영 기준)
+
+| 머신 | 역할 |
+|---|---|
+| **GPU 서버** (메인) | Docker Compose (fastapi, frontend, postgres pkm, kordoc, ocr-service, marker-service, reranker(TEI), caddy), Ollama (`bge-m3`, 4B chat), home-gateway 별 compose |
+| **Mac mini** | MLX 26B primary 추론 + MLX Whisper STT (HTTP 추론 endpoint only, ingress 역할 0) |
+| **Synology NAS** | 파일 원본 (`/volume4/Document_Server/PKM/`), Synology Office/Drive/Calendar/MailPlus, NFS export → GPU |
+| **VPS-2** (OVH) | 메일 relay (`relay.hyungi.net:587` SASL+TLS+DKIM+LE), Gitea bare mirror, Secondary MX |
+
+상세 IP / 모델 / 컨테이너 / drift / verify 명령은 `infra_inventory.md` 참조.
+
+## 운영 변경 정책
+
+1. inventory 먼저 갱신
+2. `config.yaml` / `credentials.env` 갱신
+3. deploy (commit → push Gitea → GPU `git pull && docker compose up -d --build`)
+4. verify (smoke endpoints, postgres count, 모니터링)
+
+순서를 어기면 drift. drift 발견 시 `infra_inventory.md` 의 Drift Log 에 등록 후 정정.

 ## 문서

- [아키텍처](docs/architecture.md) — 전체 시스템 설계
- [배포 가이드](docs/deploy.md) — Docker Compose 배포 방법
- [개발 단계](docs/development-stages.md) — Phase 0~5 개발 계획
+- [아키텍처](docs/architecture.md) — DB 스키마, AI 전략, UI 설계
+- [배포 가이드](docs/deploy.md) — Docker Compose 배포
+- [개발 단계](docs/development-stages.md) — Phase 별 roadmap (Phase 4 Global Digest / 야간 브리핑 등 신규 phase 는 inventory + plan 파일 우선)
@@ -0,0 +1,34 @@
+# Third Party Licenses
+
+본 프로젝트는 다음 오픈소스를 사용합니다.
+
+## perfect-freehand
+
+- License: **MIT**
+- Repository: https://github.com/steveruizok/perfect-freehand
+- Used by: `frontend/src/lib/components/HandwriteCanvas.svelte` — Apple Pencil 압력/tilt
+  를 반영한 손글씨 stroke 렌더링.
+
+```
+MIT License
+
+Copyright (c) 2021 Stephen Ruiz Ltd
+
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+
+The above copyright notice and this permission notice shall be included in all
+copies or substantial portions of the Software.
+
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+SOFTWARE.
+```
@@ -2,12 +2,13 @@ FROM python:3.11-slim

 WORKDIR /app

-# LibreOffice headless (PDF 변환용) + 한글/CJK 폰트
+# LibreOffice headless (PDF 변환용) + 한글/CJK 폰트 + ffmpeg (비디오 썸네일)
 RUN apt-get update && \
    apt-get install -y --no-install-recommends \
      libreoffice-core libreoffice-calc libreoffice-writer libreoffice-impress \
      fonts-noto-cjk fonts-noto-cjk-extra fonts-nanum \
-      fonts-noto-core fonts-noto-extra && \
+      fonts-noto-core fonts-noto-extra \
+      ffmpeg && \
    apt-get clean && rm -rf /var/lib/apt/lists/*

 COPY requirements.txt .
@@ -15,4 +16,4 @@ RUN pip install --no-cache-dir -r requirements.txt

 COPY . .

-CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000"]
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000", "--proxy-headers", "--forwarded-allow-ips", "*"]
@@ -21,25 +21,119 @@ def strip_thinking(text: str) -> str:


 def parse_json_response(raw: str) -> dict | None:
-    """AI 응답에서 JSON 객체 추출 (think 태그, 코드블록 등 제거)"""
+    """AI 응답에서 JSON 객체 추출 (think 태그, 코드블록 등 제거).
+
+    파싱 시도 순서 (앞 단계가 성공하면 즉시 반환):
+      1. ``` json fenced 블록 안의 첫 ``{...}`` (DOTALL)
+      2. balanced 정규식 finditer 의 마지막 매치
+      3. 전체 cleaned 그대로 json.loads
+      4. (Phase 4-A 후속) "first ``{`` ~ last ``}``" greedy slice — envelope JSON 안에
+         내부 따옴표/백틱/뉴라인 때문에 balanced 정규식이 못 잡는 케이스 방어.
+         raw text 의 첫 ``{`` 부터 마지막 ``}`` 까지 잘라 json.loads. 모델이 JSON 앞뒤
+         자유 텍스트 섞어도 본체만 추출.
+    """
    cleaned = strip_thinking(raw)
-    # 코드블록 내부 JSON 추출
+    # 1. 코드블록 내부 JSON 추출
    code_match = re.search(r"```(?:json)?\s*(\{.*?\})\s*```", cleaned, re.DOTALL)
    if code_match:
        cleaned = code_match.group(1)
-    # 마지막 유효 JSON 객체 찾기
+    # 2. 마지막 유효 JSON 객체 찾기 (balanced 1단계)
    matches = list(re.finditer(r"\{[^{}]*(?:\{[^{}]*\}[^{}]*)*\}", cleaned, re.DOTALL))
    for m in reversed(matches):
        try:
            return json.loads(m.group())
        except json.JSONDecodeError:
            continue
-    # 최후 시도: 전체 텍스트를 JSON으로
+    # 3. 전체 cleaned
    try:
-        return json.loads(cleaned)
+        result = json.loads(cleaned)
+        if isinstance(result, dict):
+            return result
+    except json.JSONDecodeError:
+        pass
+    # 4. greedy slice fallback — first '{' ~ last '}' 까지
+    first = cleaned.find("{")
+    last = cleaned.rfind("}")
+    if first < 0 or last <= first:
+        return None
+    candidate = cleaned[first : last + 1]
+    try:
+        obj = json.loads(candidate)
+        return obj if isinstance(obj, dict) else None
+    except json.JSONDecodeError:
+        pass
+    # 5. (Phase 4-A 후속) Markdown 줄바꿈 + LaTeX 수식이 JSON string literal 안에
+    #    raw 로 들어간 케이스 방어. 두 가지 invalid:
+    #      - raw newline (LF/CR/TAB) — JSON 표준 string 안 control char 금지
+    #      - invalid backslash — `\circ`, `\text`, `\,` 같은 LaTeX. JSON valid escape
+    #        은 `\"`, `\\`, `\/`, `\b`, `\f`, `\n`, `\r`, `\t`, `\uXXXX` 만.
+    #    stateful walker — string literal 안에서만 fix. 외부 (object 구조) 의 newline
+    #    은 valid whitespace 라 보존.
+    escaped = _fix_json_string_escapes(candidate)
+    try:
+        obj = json.loads(escaped)
+        return obj if isinstance(obj, dict) else None
    except json.JSONDecodeError:
        return None

+
+_VALID_JSON_ESCAPES = set('"\\/bfnrtu')
+
+
+def _fix_json_string_escapes(s: str) -> str:
+    """JSON string literal 안의 raw newline + invalid backslash 만 escape.
+
+    state machine: in_string 토글 (`"` 마주침). string 안에서만:
+      - raw LF/CR/TAB → ``\\n``/``\\r``/``\\t`` 로 변환
+      - 백슬래시 다음에 valid escape char (`"\\/bfnrtu`) 면 그대로
+      - 백슬래시 다음에 invalid char (`\\c`, `\\,`) 면 백슬래시 자체를 ``\\\\`` 로 escape
+    string 외부 (`{` `,` `:` 사이) 의 raw newline 등은 JSON whitespace 라 보존.
+    """
+    out: list[str] = []
+    i = 0
+    n = len(s)
+    in_string = False
+    while i < n:
+        ch = s[i]
+        if not in_string:
+            if ch == '"':
+                in_string = True
+            out.append(ch)
+            i += 1
+            continue
+        # in_string
+        if ch == "\\":
+            nxt = s[i + 1] if i + 1 < n else ""
+            if nxt in _VALID_JSON_ESCAPES:
+                out.append(ch)
+                out.append(nxt)
+                i += 2
+                continue
+            # invalid escape — backslash 자체를 escape
+            out.append("\\\\")
+            i += 1
+            continue
+        if ch == '"':
+            in_string = False
+            out.append(ch)
+            i += 1
+            continue
+        if ch == "\n":
+            out.append("\\n")
+            i += 1
+            continue
+        if ch == "\r":
+            out.append("\\r")
+            i += 1
+            continue
+        if ch == "\t":
+            out.append("\\t")
+            i += 1
+            continue
+        out.append(ch)
+        i += 1
+    return "".join(out)
+
 # 프롬프트 로딩
 PROMPTS_DIR = Path(__file__).parent.parent / "prompts"

@@ -52,24 +146,59 @@ CLASSIFY_PROMPT = _load_prompt("classify.txt") if (PROMPTS_DIR / "classify.txt")


 class AIClient:
-    """AI Gateway를 통한 통합 클라이언트. 기본값은 항상 Qwen3.5."""
+    """AI 모델 통합 클라이언트.
+
+    B-0 3-tier routing:
+      - call_triage(): Mac mini 26B MLX, 상시 호출 (llm_gate 외부 — concurrent 안전성 별 검토)
+      - call_primary(): Mac mini 26B MLX, 에스컬레이션 전용 (llm_gate Semaphore(1) 는 **caller 책임**)
+      - call_fallback(): triage/primary 실패 시 최후 방어선. Claude Sonnet 4 API (PR #20 swap 완료)
+
+    Legacy: classify() / summarize() 는 기존 호출부(tests/eval runner)를 위해 남겨둠.
+    신규 worker 경로는 전부 call_triage / call_primary 사용.
+    """

    def __init__(self):
        self.ai = settings.ai
        self._http = httpx.AsyncClient(timeout=120)

+    # ─── 3-tier routing (B-0) ───────────────────────────────────────────────
+
+    async def call_triage(self, prompt: str) -> str:
+        """Mac mini 26B MLX 직접 호출 (config.yaml ai.models.triage). llm_gate 외부 실행 — PR #20 이후 triage/primary 동일 endpoint 라 concurrent 안전성 별 검토.
+
+        timeout 은 config.yaml ai.models.triage.timeout (기본 30s).
+        실패 시 caller 가 에스컬레이션 또는 fallback 판단.
+        """
+        return await self._request(self.ai.triage, prompt)
+
+    async def call_primary(self, prompt: str) -> str:
+        """26B MLX 호출. 에스컬레이션 전용.
+
+        **caller 가 반드시 `async with get_mlx_gate():` 블록 안에서 호출해야 한다.**
+        Semaphore(1) 로 동시 호출이 1건으로 제한되어 있고, gate 는 primary 전용.
+        """
+        return await self._request(self.ai.primary, prompt)
+
+    async def call_fallback(self, prompt: str) -> str:
+        """triage/primary 실패 시 최후 방어선. Claude Sonnet 4 API (config.yaml ai.models.fallback) — PR #20 이후 swap 완료."""
+        return await self._request(self.ai.fallback, prompt)
+
+    # ─── Legacy API (classify_worker 교체 시 제거 예정) ───────────────────
+
    async def classify(self, text: str) -> dict:
-        """문서 분류 — 항상 primary(Qwen3.5) 사용"""
+        """[DEPRECATED] 기존 classify_worker 전용. B-1 에서 summary_triage 로 대체.
+
+        호출부 정리 전 존속. 신규 코드는 call_triage + prompt_render 를 쓸 것.
+        """
        prompt = CLASSIFY_PROMPT.replace("{document_text}", text)
        response = await self._call_chat(self.ai.primary, prompt)
        return response

    async def summarize(self, text: str, force_premium: bool = False) -> str:
-        """문서 요약 — 기본 Qwen3.5, 장문이거나 명시적 요청 시만 Claude"""
-        model = self.ai.primary
-        if force_premium or len(text) > 15000:
-            model = self.ai.premium
-        return await self._call_chat(model, f"다음 문서를 500자 이내로 요약해주세요:\n\n{text}")
+        """[DEPRECATED] 기존 호출부용. B-1 에서 summary_triage 가 tldr 대체."""
+        if force_premium:
+            return await self._call_chat(self.ai.premium, f"다음 문서를 500자 이내로 요약해주세요:\n\n{text}")
+        return await self._call_chat(self.ai.primary, f"다음 문서를 500자 이내로 요약해주세요:\n\n{text}")

    async def embed(self, text: str) -> list[float]:
        """벡터 임베딩 — GPU 서버 전용"""
@@ -80,10 +209,24 @@ class AIClient:
        response.raise_for_status()
        return response.json()["embedding"]

-    async def ocr(self, image_bytes: bytes) -> str:
-        """이미지 OCR — GPU 서버 전용"""
-        # TODO: Qwen2.5-VL-7B 비전 모델 호출 구현
-        raise NotImplementedError("OCR는 Phase 1에서 구현")
+    async def rerank(self, query: str, texts: list[str]) -> list[dict]:
+        """TEI bge-reranker-v2-m3 호출 (Phase 1.3).
+
+        TEI POST /rerank API:
+            request:  {"query": str, "texts": [str, ...]}
+            response: [{"index": int, "score": float}, ...] (정렬됨)
+
+        timeout은 self.ai.rerank.timeout (config.yaml).
+        호출자(rerank_service)가 asyncio.Semaphore + try/except로 감쌈.
+        """
+        timeout = float(self.ai.rerank.timeout) if self.ai.rerank.timeout else 5.0
+        response = await self._http.post(
+            self.ai.rerank.endpoint,
+            json={"query": query, "texts": texts},
+            timeout=timeout,
+        )
+        response.raise_for_status()
+        return response.json()

    async def _call_chat(self, model_config, prompt: str) -> str:
        """OpenAI 호환 API 호출 + 자동 폴백"""
@@ -0,0 +1,97 @@
+"""EscalationEnvelope — 4B → 26B 핸드오프 계약.
+
+4B 가 "자신이 처리 못한다" 고 판단했을 때 26B 에게 전달하는 구조화 메시지.
+26B 는 distilled_context 로 방향을 잡고 original_pointers 로 필요한 원문만 재조회.
+
+PR-A 는 dataclass 계약만 정의. 실제 생성/소비는 PR-B 의 escalation_service 가 담당.
+"""
+
+from __future__ import annotations
+
+import json
+from dataclasses import asdict, dataclass, field
+from typing import Any
+
+
+ValidFromStage = {
+    "triage",
+    "classify",
+    "summarize_short",
+    "advice_trigger",
+    "night_sweep",
+    "ask_pre",
+    "unknown",  # 호환성용
+}
+
+
+@dataclass(frozen=True)
+class EscalationEnvelope:
+    from_stage: str
+    escalation_reasons: tuple[str, ...]
+    risk_flags: tuple[str, ...]
+    distilled_context: str
+    original_pointers: dict[str, Any] = field(default_factory=dict)
+    synthesis_directives: tuple[str, ...] = ()
+    user_intent: str | None = None
+    draft_hint: str | None = None
+
+    def __post_init__(self) -> None:
+        if self.from_stage not in ValidFromStage:
+            raise ValueError(
+                f"from_stage '{self.from_stage}' not in {ValidFromStage}"
+            )
+        if not isinstance(self.escalation_reasons, tuple):
+            raise TypeError("escalation_reasons must be tuple (for hashability)")
+        if not isinstance(self.risk_flags, tuple):
+            raise TypeError("risk_flags must be tuple (for hashability)")
+        if not isinstance(self.synthesis_directives, tuple):
+            raise TypeError("synthesis_directives must be tuple (for hashability)")
+
+    # -- 26B system prompt 주입용 텍스트 -----------------------------------
+    def to_system_injection(self) -> str:
+        lines = [
+            "=== ESCALATION ENVELOPE (from 4B) ===",
+            f"from_stage: {self.from_stage}",
+            f"reasons: {', '.join(self.escalation_reasons) or '(none)'}",
+            f"risk_flags: {', '.join(self.risk_flags) or '(none)'}",
+        ]
+        if self.user_intent:
+            lines.append(f"user_intent: {self.user_intent}")
+        if self.draft_hint:
+            lines.append(f"draft_hint: {self.draft_hint}")
+
+        if self.synthesis_directives:
+            lines.append("")
+            lines.append("synthesis_directives (각 risk_flag 별 지시사항, 반드시 준수):")
+            for d in self.synthesis_directives:
+                lines.append(f"  - {d}")
+
+        if self.distilled_context:
+            lines.append("")
+            lines.append("distilled_context (4B 가 압축한 요지 — 참고용, 숫자·인용은 원문 재확인 필수):")
+            lines.append(self.distilled_context)
+
+        if self.original_pointers:
+            lines.append("")
+            lines.append("original_pointers (필요 시 재조회):")
+            lines.append(json.dumps(self.original_pointers, ensure_ascii=False, indent=2))
+
+        return "\n".join(lines)
+
+    # -- JSON round-trip ---------------------------------------------------
+    def to_json(self) -> str:
+        return json.dumps(asdict(self), ensure_ascii=False)
+
+    @classmethod
+    def from_json(cls, s: str) -> EscalationEnvelope:
+        raw = json.loads(s)
+        return cls(
+            from_stage=raw["from_stage"],
+            escalation_reasons=tuple(raw.get("escalation_reasons", ())),
+            risk_flags=tuple(raw.get("risk_flags", ())),
+            distilled_context=raw.get("distilled_context", ""),
+            original_pointers=raw.get("original_pointers", {}) or {},
+            synthesis_directives=tuple(raw.get("synthesis_directives", ())),
+            user_intent=raw.get("user_intent"),
+            draft_hint=raw.get("draft_hint"),
+        )
@@ -0,0 +1,72 @@
+"""오디오 전사(STT) 조회 API — /api/audio
+
+AudioPlayer 가 줄 단위로 렌더하고 클릭 시 audio.currentTime 으로 점프한다.
+"""
+
+from typing import Annotated
+
+from fastapi import APIRouter, Depends, HTTPException
+from pydantic import BaseModel
+from sqlalchemy import select
+from sqlalchemy.ext.asyncio import AsyncSession
+
+from core.auth import get_current_user
+from core.database import get_session
+from models.audio_segment import AudioSegment
+from models.document import Document
+from models.user import User
+
+router = APIRouter()
+
+
+class AudioSegmentResponse(BaseModel):
+    start: float
+    end: float
+    text: str
+
+    model_config = {"from_attributes": True}
+
+
+class AudioSegmentsResponse(BaseModel):
+    document_id: int
+    language: str | None
+    duration: float | None
+    segments: list[AudioSegmentResponse]
+
+
+@router.get("/{doc_id}/segments", response_model=AudioSegmentsResponse)
+async def get_audio_segments(
+    doc_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """audio 문서의 전사 세그먼트 조회.
+
+    category='audio' 가 아닌 문서는 404. 세그먼트가 아직 없는 경우 빈 배열 반환.
+    language / duration 은 현재 ORM 에 별도 컬럼이 없어 None (필요 시 후속 확장).
+    """
+    doc = await session.get(Document, doc_id)
+    if not doc or doc.deleted_at is not None:
+        raise HTTPException(status_code=404, detail="문서를 찾을 수 없습니다")
+
+    if getattr(doc, "category", None) != "audio":
+        raise HTTPException(status_code=404, detail="오디오 문서가 아닙니다")
+
+    result = await session.execute(
+        select(AudioSegment)
+        .where(AudioSegment.document_id == doc_id)
+        .order_by(AudioSegment.start_s.asc())
+    )
+    rows = result.scalars().all()
+
+    segments = [
+        AudioSegmentResponse(start=r.start_s, end=r.end_s, text=r.text)
+        for r in rows
+    ]
+
+    return AudioSegmentsResponse(
+        document_id=doc_id,
+        language=None,
+        duration=None,
+        segments=segments,
+    )
@@ -16,8 +16,10 @@ from core.auth import (
    REFRESH_TOKEN_EXPIRE_DAYS,
    create_access_token,
    create_refresh_token,
+    create_voice_memo_bot_token,
    decode_token,
    get_current_user,
+    verify_password_changed_at,
    hash_password,
    verify_password,
    verify_totp,
@@ -117,6 +119,11 @@ async def login(
    user.last_login_at = datetime.now(timezone.utc)
    await session.commit()

+    # Voice Memo PoC v1 — bot 계정 한정 long-expiry token (env gate). 일반 사용자 흐름 영향 0.
+    bot_token = create_voice_memo_bot_token(user.username)
+    if bot_token is not None:
+        return AccessTokenResponse(access_token=bot_token)
+
    # refresh token → HttpOnly cookie
    _set_refresh_cookie(response, create_refresh_token(user.username))

@@ -155,6 +162,7 @@ async def refresh_token(
            status_code=status.HTTP_401_UNAUTHORIZED,
            detail="유저를 찾을 수 없음",
        )
+    verify_password_changed_at(payload, user)

    # 새 refresh token → cookie
    _set_refresh_cookie(response, create_refresh_token(user.username))
@@ -197,5 +205,6 @@ async def change_password(
        )

    user.password_hash = hash_password(body.new_password)
+    user.password_changed_at = datetime.now(timezone.utc)
    await session.commit()
    return {"message": "비밀번호가 변경되었습니다"}
@@ -0,0 +1,323 @@
+"""Morning Briefing API — read-only + 수동 regenerate.
+
+엔드포인트:
+- GET  /api/briefing/latest                : 가장 최근 briefing
+- GET  /api/briefing?date=YYYY-MM-DD       : 특정 날짜 briefing
+- POST /api/briefing/regenerate?date=...   : 동기 워커 트리거 (admin), DELETE+INSERT tx
+
+응답은 topic 평면 list (axis 반대 — Phase 4 와 달리 country 그룹 X).
+각 topic 안에 country_perspectives JSONB 가 들어있어 cross-country 비교 분석을 표현.
+"""
+
+from datetime import date as date_type
+from datetime import datetime
+from typing import Annotated
+
+from fastapi import APIRouter, Depends, HTTPException, Query
+from pydantic import BaseModel
+from sqlalchemy import select
+from sqlalchemy.ext.asyncio import AsyncSession
+from sqlalchemy.orm import selectinload
+
+from core.auth import get_current_user, require_admin
+from core.database import get_session
+from models.briefing import BriefingTopic, MorningBriefing
+from models.user import User
+
+router = APIRouter()
+
+
+# ─── Pydantic 응답 모델 ───
+
+
+class CountryPerspective(BaseModel):
+    country: str
+    summary: str
+    article_ids: list[int] = []
+
+
+class KeyQuote(BaseModel):
+    country: str = ""
+    source: str = ""
+    quote: str
+
+
+class TopicResponse(BaseModel):
+    id: int  # 2026-05-13 카드 액션 (read/highlight) 호출용 식별자
+    topic_rank: int
+    topic_label: str
+    headline: str
+    country_perspectives: list[CountryPerspective]
+    divergences: list[str]
+    convergences: list[str]
+    key_quotes: list[KeyQuote]
+    historical_context: str | None = None
+    cluster_members: list[int] = []
+    article_count: int
+    country_count: int
+    importance_score: float
+    llm_fallback_used: bool
+    # 2026-05-13 사용자 액션 — UI 의 카드별 토글
+    is_read: bool = False
+    read_at: datetime | None = None
+    highlighted: bool = False
+    highlighted_at: datetime | None = None
+
+
+class BriefingResponse(BaseModel):
+    briefing_date: date_type
+    window_start: datetime
+    window_end: datetime
+    decay_lambda: float
+    total_articles: int
+    total_countries: int
+    total_topics: int
+    generation_ms: int | None
+    llm_calls: int
+    llm_failures: int
+    status: str
+    headline_oneliner: str | None = None
+    topics: list[TopicResponse]
+
+
+class RegenerateResponse(BaseModel):
+    status: str
+    briefing_id: int | None
+    briefing_date: date_type
+    total_topics: int
+    total_articles: int
+    llm_calls: int
+    llm_failures: int
+    generation_ms: int
+    regenerated: bool
+
+
+# ─── helpers ───
+
+
+def _build_response(b: MorningBriefing) -> BriefingResponse:
+    topics = []
+    for t in sorted(b.topics, key=lambda x: x.topic_rank):
+        topics.append(
+            TopicResponse(
+                id=t.id,
+                topic_rank=t.topic_rank,
+                topic_label=t.topic_label,
+                headline=t.headline,
+                country_perspectives=[
+                    CountryPerspective(**cp) for cp in (t.country_perspectives or [])
+                ],
+                divergences=list(t.divergences or []),
+                convergences=list(t.convergences or []),
+                key_quotes=[KeyQuote(**q) for q in (t.key_quotes or [])],
+                historical_context=t.historical_context,
+                cluster_members=list(t.cluster_members or []),
+                article_count=t.article_count,
+                country_count=t.country_count,
+                importance_score=t.importance_score,
+                llm_fallback_used=t.llm_fallback_used,
+                is_read=t.is_read,
+                read_at=t.read_at,
+                highlighted=t.highlighted,
+                highlighted_at=t.highlighted_at,
+            )
+        )
+
+    return BriefingResponse(
+        briefing_date=b.briefing_date,
+        window_start=b.window_start,
+        window_end=b.window_end,
+        decay_lambda=b.decay_lambda,
+        total_articles=b.total_articles,
+        total_countries=b.total_countries,
+        total_topics=b.total_topics,
+        generation_ms=b.generation_ms,
+        llm_calls=b.llm_calls,
+        llm_failures=b.llm_failures,
+        status=b.status,
+        headline_oneliner=b.headline_oneliner,
+        topics=topics,
+    )
+
+
+async def _load_briefing(
+    session: AsyncSession,
+    target_date: date_type | None,
+) -> MorningBriefing | None:
+    query = select(MorningBriefing).options(selectinload(MorningBriefing.topics))
+    if target_date is not None:
+        query = query.where(MorningBriefing.briefing_date == target_date)
+    else:
+        query = query.order_by(MorningBriefing.briefing_date.desc())
+    query = query.limit(1)
+    result = await session.execute(query)
+    return result.scalar_one_or_none()
+
+
+# ─── Routes ───
+
+
+@router.get("/latest", response_model=BriefingResponse)
+async def get_latest(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """가장 최근 morning briefing."""
+    b = await _load_briefing(session, target_date=None)
+    if b is None:
+        raise HTTPException(status_code=404, detail="아직 생성된 briefing 없음")
+    return _build_response(b)
+
+
+@router.get("", response_model=BriefingResponse)
+async def get_briefing(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    date: date_type | None = Query(default=None, description="YYYY-MM-DD (KST briefing_date)"),
+):
+    """특정 날짜 briefing (date 미지정 시 최신)."""
+    b = await _load_briefing(session, target_date=date)
+    if b is None:
+        raise HTTPException(
+            status_code=404,
+            detail=f"briefing 없음 (date={date})" if date else "아직 생성된 briefing 없음",
+        )
+    return _build_response(b)
+
+
+@router.post("/regenerate", response_model=RegenerateResponse)
+async def regenerate(
+    user: Annotated[User, Depends(require_admin)],
+    date: date_type | None = Query(default=None, description="YYYY-MM-DD KST 기준 briefing_date"),
+):
+    """수동 트리거 (admin). 동기 실행 — delete+insert transaction.
+
+    date 미지정 시 오늘 KST. 같은 날 row 존재 시 transaction 안에서 삭제 후 신규 생성.
+    응답 status='success' | 'partial' | 'failed' | 'empty'.
+    """
+    from workers.briefing_worker import run
+
+    result = await run(target_date=date)
+    if result is None:
+        raise HTTPException(status_code=500, detail="briefing 워커 실행 실패 (로그 확인)")
+
+    return RegenerateResponse(
+        status=result["status"],
+        briefing_id=result.get("briefing_id"),
+        briefing_date=date or datetime.now().date(),
+        total_topics=result["total_topics"],
+        total_articles=result["total_articles"],
+        llm_calls=result["llm_calls"],
+        llm_failures=result["llm_failures"],
+        generation_ms=result["generation_ms"],
+        regenerated=result.get("regenerated", True),
+    )
+
+
+# ─── 2026-05-13 신규: 날짜 선택 + 카드 액션 ───
+
+
+class BriefingDateSummary(BaseModel):
+    briefing_date: date_type
+    total_topics: int
+    total_articles: int
+    status: str
+    read_count: int      # 사용자가 읽음 처리한 토픽 수
+    highlighted_count: int
+
+
+class TopicActionRequest(BaseModel):
+    value: bool
+
+
+class TopicActionResponse(BaseModel):
+    id: int
+    is_read: bool
+    read_at: datetime | None
+    highlighted: bool
+    highlighted_at: datetime | None
+
+
+@router.get("/dates", response_model=list[BriefingDateSummary])
+async def list_dates(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    limit: int = Query(default=60, ge=1, le=365),
+):
+    """사용 가능한 briefing 날짜 목록 (최신 desc). UI date picker 의 데이터 소스."""
+    from sqlalchemy import func, case
+
+    stmt = (
+        select(
+            MorningBriefing.briefing_date,
+            MorningBriefing.total_topics,
+            MorningBriefing.total_articles,
+            MorningBriefing.status,
+            func.count(case((BriefingTopic.is_read.is_(True), 1))).label("read_count"),
+            func.count(case((BriefingTopic.highlighted.is_(True), 1))).label("highlighted_count"),
+        )
+        .outerjoin(BriefingTopic, BriefingTopic.briefing_id == MorningBriefing.id)
+        .group_by(MorningBriefing.id)
+        .order_by(MorningBriefing.briefing_date.desc())
+        .limit(limit)
+    )
+    rows = (await session.execute(stmt)).all()
+    return [
+        BriefingDateSummary(
+            briefing_date=r.briefing_date,
+            total_topics=r.total_topics,
+            total_articles=r.total_articles,
+            status=r.status,
+            read_count=r.read_count or 0,
+            highlighted_count=r.highlighted_count or 0,
+        )
+        for r in rows
+    ]
+
+
+@router.patch("/topics/{topic_id}/read", response_model=TopicActionResponse)
+async def set_topic_read(
+    topic_id: int,
+    body: TopicActionRequest,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """토픽 카드 읽음 토글. value=true → 읽음 + read_at=now / false → 해제 + read_at=NULL."""
+    topic = await session.get(BriefingTopic, topic_id)
+    if topic is None:
+        raise HTTPException(status_code=404, detail=f"topic 없음 id={topic_id}")
+    topic.is_read = body.value
+    topic.read_at = datetime.now() if body.value else None
+    await session.commit()
+    await session.refresh(topic)
+    return TopicActionResponse(
+        id=topic.id,
+        is_read=topic.is_read,
+        read_at=topic.read_at,
+        highlighted=topic.highlighted,
+        highlighted_at=topic.highlighted_at,
+    )
+
+
+@router.patch("/topics/{topic_id}/highlight", response_model=TopicActionResponse)
+async def set_topic_highlight(
+    topic_id: int,
+    body: TopicActionRequest,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """토픽 카드 하이라이트 토글. value=true → highlighted + highlighted_at=now / false → 해제."""
+    topic = await session.get(BriefingTopic, topic_id)
+    if topic is None:
+        raise HTTPException(status_code=404, detail=f"topic 없음 id={topic_id}")
+    topic.highlighted = body.value
+    topic.highlighted_at = datetime.now() if body.value else None
+    await session.commit()
+    await session.refresh(topic)
+    return TopicActionResponse(
+        id=topic.id,
+        is_read=topic.is_read,
+        read_at=topic.read_at,
+        highlighted=topic.highlighted,
+        highlighted_at=topic.highlighted_at,
+    )
@@ -0,0 +1,34 @@
+"""공개 설정 엔드포인트
+
+이 엔드포인트의 scope:
+- 민감정보 없는, 프론트 동작에 필수인 최소 공개 설정만 제공.
+- 임의의 서버 설정을 프론트에 노출하는 범용 창구가 아님.
+- 필드 추가 시 "민감정보 여부 + 프론트 필수 여부" 2가지 기준 통과 필요.
+"""
+
+from fastapi import APIRouter
+from pydantic import BaseModel
+
+from core.config import settings
+
+router = APIRouter()
+
+
+class UploadPublicConfig(BaseModel):
+    max_bytes: int
+
+
+class PublicConfigResponse(BaseModel):
+    upload: UploadPublicConfig
+
+
+@router.get("/public", response_model=PublicConfigResponse)
+async def get_public_config() -> PublicConfigResponse:
+    """프론트가 초기 로드 시 조회하는 공개 설정.
+
+    현재 제공: upload.max_bytes (업로드 pre-check UX 용도).
+    slack_ratio, stream_chunk_bytes 등 서버 내부 정책은 노출하지 않음.
+    """
+    return PublicConfigResponse(
+        upload=UploadPublicConfig(max_bytes=settings.upload.max_bytes),
+    )
@@ -35,6 +35,42 @@ class PipelineStatus(BaseModel):
    count: int


+class QueueLag(BaseModel):
+    """파이프라인 stage 별 처리 지연 — 운영 카드용.
+
+    pipeline_status 는 24h 누적 통계라 현재 적체 신호로 부족.
+    queue_lag 는 현재 시점 pending/processing/failed + oldest pending age 로
+    "지금 막힌 게 있는가" 를 보여준다.
+    """
+    stage: str
+    pending: int
+    processing: int
+    failed: int
+    oldest_pending_age_sec: int | None  # 가장 오래된 pending 의 created_at 기준 경과 (초)
+
+
+class TierHealthStack(BaseModel):
+    """PR-B B-3 — tier 관측성 카드 소스 (24h 윈도우).
+
+    대시보드 카드 (Day 4 튜닝 — 2026-04-27 임계치 재조정):
+      - "에스컬레이션 비율": escalated_total / triage_total
+        · <80% 적색 (정책 매칭 실패 증가 — 진짜 튜닝 필요)
+        · 80~99% 정상 (safety/health 정책 의도)
+      - "triage JSON 건강도": triage_json_invalid / triage_total (>5% 적색)
+      - "Backlog Suppression": suppressed_total / triage_total (>10% 주황)
+      - "Deep summary 안정성": deep_err_total / deep_total (>5% 적색)
+    """
+    triage_total: int = 0
+    escalated_total: int = 0
+    escalation_by_reason: dict[str, int] = {}     # long_context / low_confidence / deep_requested / self_declare
+    escalation_by_domain: dict[str, int] = {}     # safety_reference / news_item / ...
+    triage_json_invalid: int = 0                  # error_code='triage_json_invalid'
+    suppressed_total: int = 0                     # suppressed_reason IS NOT NULL
+    # Day 4 튜닝 신규 — deep_summary 호출 안정성
+    deep_total: int = 0                           # mode='summary_deep' 전체
+    deep_err_total: int = 0                       # error_code IS NOT NULL (call_failed / parse:*)
+
+
 class DashboardResponse(BaseModel):
    today_added: int
    today_by_domain: list[DomainCount]
@@ -44,6 +80,16 @@ class DashboardResponse(BaseModel):
    pipeline_status: list[PipelineStatus]
    failed_count: int
    total_documents: int
+    # 카운트 분리: 문서함(비-note/비-news) / 메모(memo+note) / 뉴스(news)
+    documents_count: int = 0
+    memos_count: int = 0
+    news_count: int = 0
+    # §4 — category 기반 카드 + 승인 pending + queue lag
+    category_counts: dict[str, int] = {}
+    library_pending_suggestions: int = 0
+    queue_lag: list[QueueLag] = []
+    # PR-B B-3 — tier 관측성
+    tier_health: TierHealthStack = TierHealthStack()


@router.get("/", response_model=DashboardResponse)
@@ -82,11 +128,11 @@ async def get_dashboard(
    )
    law_alerts = law_result.scalar() or 0

-    # 최근 문서 5건
+    # 최근 문서 7건
    recent_result = await session.execute(
        select(Document)
        .order_by(Document.created_at.desc())
-        .limit(5)
+        .limit(7)
    )
    recent_docs = recent_result.scalars().all()

@@ -108,9 +154,118 @@ async def get_dashboard(
    )
    failed_count = failed_result.scalar() or 0

-    # 전체 문서 수
-    total_result = await session.execute(select(func.count(Document.id)))
-    total_documents = total_result.scalar() or 0
+    # 전체 문서 수 + 카테고리별 분리 (단일 쿼리)
+    # 문서함: 비-note, 비-news / 메모: memo+note / 뉴스: news 유입 경로 기준
+    count_result = await session.execute(
+        text("""
+            SELECT
+                COUNT(*) AS total,
+                COUNT(*) FILTER (WHERE source_channel NOT IN ('news', 'law_monitor') AND file_type != 'note') AS documents,
+                COUNT(*) FILTER (WHERE source_channel = 'memo' AND file_type = 'note') AS memos,
+                COUNT(*) FILTER (WHERE source_channel = 'news') AS news
+            FROM documents WHERE deleted_at IS NULL
+        """)
+    )
+    counts = count_result.one()
+    total_documents = counts[0]
+    documents_count = counts[1]
+    memos_count = counts[2]
+    news_count = counts[3]
+
+    # §4 — 카테고리별 count (§1 documents.category enum)
+    cat_result = await session.execute(
+        text("""
+            SELECT category, COUNT(*)
+            FROM documents
+            WHERE deleted_at IS NULL AND category IS NOT NULL
+            GROUP BY category
+        """)
+    )
+    category_counts = {row[0]: row[1] for row in cat_result.all()}
+
+    # §4 — 승인 대기 (library 제안)
+    pending_result = await session.execute(
+        text("""
+            SELECT COUNT(*)
+            FROM documents
+            WHERE deleted_at IS NULL
+              AND ai_suggestion IS NOT NULL
+              AND ai_suggestion->>'proposed_category' = 'library'
+        """)
+    )
+    library_pending_suggestions = pending_result.scalar() or 0
+
+    # §4 — queue lag (현재 시점 stage 별 적체 신호)
+    # extract/classify/embed 외에 stt/thumbnail (§3) 도 자동 포함.
+    lag_result = await session.execute(
+        text("""
+            SELECT
+                stage,
+                COUNT(*) FILTER (WHERE status='pending')        AS pending,
+                COUNT(*) FILTER (WHERE status='processing')     AS processing,
+                COUNT(*) FILTER (WHERE status='failed')         AS failed,
+                EXTRACT(EPOCH FROM (NOW() - MIN(created_at) FILTER (WHERE status='pending')))::int
+                                                                AS oldest_pending_age_sec
+            FROM processing_queue
+            GROUP BY stage
+            ORDER BY stage
+        """)
+    )
+    queue_lag = [
+        QueueLag(
+            stage=row[0],
+            pending=row[1] or 0,
+            processing=row[2] or 0,
+            failed=row[3] or 0,
+            oldest_pending_age_sec=row[4],
+        )
+        for row in lag_result.all()
+    ]
+
+    # ─── PR-B B-3 — tier 관측성 (24h) + Day 4 deep_err 추가 ───
+    tier_rows = (await session.execute(text("""
+        SELECT
+          COUNT(*) FILTER (WHERE mode = 'summary_triage')                                   AS triage_total,
+          COUNT(*) FILTER (WHERE mode = 'summary_triage' AND escalated_to_26b = true)       AS escalated_total,
+          COUNT(*) FILTER (WHERE mode = 'summary_triage' AND error_code = 'triage_json_invalid') AS json_invalid,
+          COUNT(*) FILTER (WHERE mode = 'summary_triage' AND suppressed_reason IS NOT NULL) AS suppressed_total,
+          COUNT(*) FILTER (WHERE mode = 'summary_deep')                                     AS deep_total,
+          COUNT(*) FILTER (WHERE mode = 'summary_deep' AND error_code IS NOT NULL)          AS deep_err_total
+        FROM analyze_events
+        WHERE created_at > NOW() - INTERVAL '24 hours'
+    """))).one()
+
+    reason_rows = await session.execute(text("""
+        SELECT unnest(escalation_reasons) AS reason, COUNT(*) AS n
+        FROM analyze_events
+        WHERE created_at > NOW() - INTERVAL '24 hours'
+          AND mode = 'summary_triage'
+          AND escalated_to_26b = true
+        GROUP BY 1 ORDER BY 2 DESC
+    """))
+    escalation_by_reason = {r[0]: r[1] for r in reason_rows if r[0]}
+
+    domain_rows = await session.execute(text("""
+        SELECT subject_domain, COUNT(*) AS n
+        FROM analyze_events
+        WHERE created_at > NOW() - INTERVAL '24 hours'
+          AND mode = 'summary_triage'
+          AND escalated_to_26b = true
+          AND subject_domain IS NOT NULL
+        GROUP BY 1 ORDER BY 2 DESC
+    """))
+    escalation_by_domain = {r[0]: r[1] for r in domain_rows}
+
+    tier_health = TierHealthStack(
+        triage_total=int(tier_rows.triage_total or 0),
+        escalated_total=int(tier_rows.escalated_total or 0),
+        triage_json_invalid=int(tier_rows.json_invalid or 0),
+        suppressed_total=int(tier_rows.suppressed_total or 0),
+        deep_total=int(tier_rows.deep_total or 0),
+        deep_err_total=int(tier_rows.deep_err_total or 0),
+        escalation_by_reason=escalation_by_reason,
+        escalation_by_domain=escalation_by_domain,
+    )

    return DashboardResponse(
        today_added=today_added,
@@ -135,4 +290,11 @@ async def get_dashboard(
        ],
        failed_count=failed_count,
        total_documents=total_documents,
+        documents_count=documents_count,
+        memos_count=memos_count,
+        news_count=news_count,
+        category_counts=category_counts,
+        library_pending_suggestions=library_pending_suggestions,
+        queue_lag=queue_lag,
+        tier_health=tier_health,
    )
@@ -0,0 +1,164 @@
+"""Phase 4 Global Digest API — read-only + 디버그 regenerate.
+
+엔드포인트:
+- GET  /api/digest/latest                 : 가장 최근 digest
+- GET  /api/digest?date=YYYY-MM-DD         : 특정 날짜 digest
+- GET  /api/digest?country=KR              : 특정 국가만
+- POST /api/digest/regenerate              : 백그라운드 digest 워커 트리거 (auth 필요)
+
+응답은 country → topic 2-level 구조. country 가 비어있는 경우 응답에서 자동 생략.
+"""
+
+import asyncio
+from datetime import date as date_type
+from datetime import datetime
+from typing import Annotated
+
+from fastapi import APIRouter, Depends, HTTPException, Query
+from pydantic import BaseModel
+from sqlalchemy import select
+from sqlalchemy.ext.asyncio import AsyncSession
+from sqlalchemy.orm import selectinload
+
+from core.auth import get_current_user, require_admin
+from core.database import get_session
+from models.digest import DigestTopic, GlobalDigest
+from models.user import User
+
+router = APIRouter()
+
+
+# ─── Pydantic 응답 모델 (schemas/ 디렉토리 미사용 → inline 정의) ───
+
+
+class TopicResponse(BaseModel):
+    topic_rank: int
+    topic_label: str
+    summary: str
+    article_ids: list[int]
+    article_count: int
+    importance_score: float
+    raw_weight_sum: float
+    llm_fallback_used: bool
+
+
+class CountryGroup(BaseModel):
+    country: str
+    topics: list[TopicResponse]
+
+
+class DigestResponse(BaseModel):
+    digest_date: date_type
+    window_start: datetime
+    window_end: datetime
+    decay_lambda: float
+    total_articles: int
+    total_countries: int
+    total_topics: int
+    generation_ms: int | None
+    llm_calls: int
+    llm_failures: int
+    status: str
+    countries: list[CountryGroup]
+
+
+# ─── helpers ───
+
+
+def _build_response(digest: GlobalDigest, country_filter: str | None = None) -> DigestResponse:
+    """ORM 객체 → DigestResponse. country_filter 가 주어지면 해당 국가만."""
+    topics_by_country: dict[str, list[TopicResponse]] = {}
+    for t in sorted(digest.topics, key=lambda x: (x.country, x.topic_rank)):
+        if country_filter and t.country != country_filter:
+            continue
+        topics_by_country.setdefault(t.country, []).append(
+            TopicResponse(
+                topic_rank=t.topic_rank,
+                topic_label=t.topic_label,
+                summary=t.summary,
+                article_ids=list(t.article_ids or []),
+                article_count=t.article_count,
+                importance_score=t.importance_score,
+                raw_weight_sum=t.raw_weight_sum,
+                llm_fallback_used=t.llm_fallback_used,
+            )
+        )
+
+    countries = [
+        CountryGroup(country=c, topics=topics_by_country[c])
+        for c in sorted(topics_by_country.keys())
+    ]
+
+    return DigestResponse(
+        digest_date=digest.digest_date,
+        window_start=digest.window_start,
+        window_end=digest.window_end,
+        decay_lambda=digest.decay_lambda,
+        total_articles=digest.total_articles,
+        total_countries=digest.total_countries,
+        total_topics=digest.total_topics,
+        generation_ms=digest.generation_ms,
+        llm_calls=digest.llm_calls,
+        llm_failures=digest.llm_failures,
+        status=digest.status,
+        countries=countries,
+    )
+
+
+async def _load_digest(
+    session: AsyncSession,
+    target_date: date_type | None,
+) -> GlobalDigest | None:
+    """date 가 주어지면 해당 날짜, 아니면 최신 digest 1건."""
+    query = select(GlobalDigest).options(selectinload(GlobalDigest.topics))
+    if target_date is not None:
+        query = query.where(GlobalDigest.digest_date == target_date)
+    else:
+        query = query.order_by(GlobalDigest.digest_date.desc())
+    query = query.limit(1)
+    result = await session.execute(query)
+    return result.scalar_one_or_none()
+
+
+# ─── Routes ───
+
+
+@router.get("/latest", response_model=DigestResponse)
+async def get_latest(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """가장 최근 생성된 global digest."""
+    digest = await _load_digest(session, target_date=None)
+    if digest is None:
+        raise HTTPException(status_code=404, detail="아직 생성된 digest 없음")
+    return _build_response(digest)
+
+
+@router.get("", response_model=DigestResponse)
+async def get_digest(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    date: date_type | None = Query(default=None, description="YYYY-MM-DD (KST)"),
+    country: str | None = Query(default=None, description="국가 코드 (예: KR)"),
+):
+    """특정 날짜 또는 국가 필터링된 digest. date 미지정 시 최신."""
+    digest = await _load_digest(session, target_date=date)
+    if digest is None:
+        raise HTTPException(
+            status_code=404,
+            detail=f"digest 없음 (date={date})" if date else "아직 생성된 digest 없음",
+        )
+    country_filter = country.upper() if country else None
+    return _build_response(digest, country_filter=country_filter)
+
+
+@router.post("/regenerate")
+async def regenerate(
+    user: Annotated[User, Depends(require_admin)],
+):
+    """수동 트리거 — 백그라운드 태스크로 워커 실행 (admin 필요)."""
+    from workers.digest_worker import run
+
+    asyncio.create_task(run())
+    return {"status": "started", "message": "global_digest 워커 백그라운드 실행 시작"}
@@ -0,0 +1,151 @@
+"""자료별 손글씨 노트 API.
+
+흐름:
+  GET    /api/documents/{id}/note  → 단건 조회 (없으면 strokes_json=None)
+  PUT    /api/documents/{id}/note  → upsert (strokes_json + canvas 크기)
+  DELETE /api/documents/{id}/note  → 노트 삭제
+
+ownership:
+  - documents 에 user_id 부재 (single-user). document_notes.user_id 만으로 분리.
+  - GET/PUT/DELETE 모두 WHERE user_id=current_user.id AND document_id=:doc_id.
+"""
+
+import logging
+from datetime import datetime
+from typing import Annotated, Any
+
+from fastapi import APIRouter, Depends, HTTPException
+from pydantic import BaseModel
+from sqlalchemy import select
+from sqlalchemy.dialects.postgresql import insert as pg_insert
+from sqlalchemy.ext.asyncio import AsyncSession
+
+from core.auth import get_current_user
+from core.database import get_session
+from models.document import Document
+from models.document_note import DocumentNote
+from models.user import User
+
+logger = logging.getLogger(__name__)
+router = APIRouter()
+
+
+class NoteResponse(BaseModel):
+    document_id: int
+    strokes_json: dict[str, Any] | None
+    canvas_width: int | None
+    canvas_height: int | None
+    schema_version: int
+    updated_at: datetime | None
+    created_at: datetime | None
+
+
+class NoteUpdate(BaseModel):
+    strokes_json: dict[str, Any] | None = None
+    canvas_width: int | None = None
+    canvas_height: int | None = None
+
+
+async def _verify_document(session: AsyncSession, document_id: int) -> Document:
+    doc = await session.get(Document, document_id)
+    if doc is None or getattr(doc, "deleted_at", None) is not None:
+        raise HTTPException(status_code=404, detail="문서를 찾을 수 없습니다")
+    return doc
+
+
+def _empty_response(document_id: int) -> NoteResponse:
+    return NoteResponse(
+        document_id=document_id,
+        strokes_json=None,
+        canvas_width=None,
+        canvas_height=None,
+        schema_version=1,
+        updated_at=None,
+        created_at=None,
+    )
+
+
+def _to_response(note: DocumentNote) -> NoteResponse:
+    return NoteResponse(
+        document_id=note.document_id,
+        strokes_json=note.strokes_json,
+        canvas_width=note.canvas_width,
+        canvas_height=note.canvas_height,
+        schema_version=note.schema_version,
+        updated_at=note.updated_at,
+        created_at=note.created_at,
+    )
+
+
+@router.get("/{document_id}/note", response_model=NoteResponse)
+async def get_note(
+    document_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    await _verify_document(session, document_id)
+    res = await session.execute(
+        select(DocumentNote).where(
+            DocumentNote.user_id == user.id,
+            DocumentNote.document_id == document_id,
+        )
+    )
+    note = res.scalar_one_or_none()
+    if note is None:
+        return _empty_response(document_id)
+    return _to_response(note)
+
+
+@router.put("/{document_id}/note", response_model=NoteResponse)
+async def upsert_note(
+    document_id: int,
+    body: NoteUpdate,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """upsert — 같은 (user, document) 면 update, 없으면 insert. PostgreSQL ON CONFLICT."""
+    await _verify_document(session, document_id)
+    values: dict[str, Any] = {
+        "user_id": user.id,
+        "document_id": document_id,
+        "strokes_json": body.strokes_json,
+        "canvas_width": body.canvas_width,
+        "canvas_height": body.canvas_height,
+    }
+    stmt = (
+        pg_insert(DocumentNote)
+        .values(**values)
+        .on_conflict_do_update(
+            index_elements=["user_id", "document_id"],
+            set_={
+                "strokes_json": body.strokes_json,
+                "canvas_width": body.canvas_width,
+                "canvas_height": body.canvas_height,
+                "updated_at": datetime.now(),
+            },
+        )
+        .returning(DocumentNote)
+    )
+    result = await session.execute(stmt)
+    note = result.scalar_one()
+    await session.commit()
+    return _to_response(note)
+
+
+@router.delete("/{document_id}/note", status_code=204)
+async def delete_note(
+    document_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    await _verify_document(session, document_id)
+    res = await session.execute(
+        select(DocumentNote).where(
+            DocumentNote.user_id == user.id,
+            DocumentNote.document_id == document_id,
+        )
+    )
+    note = res.scalar_one_or_none()
+    if note is not None:
+        await session.delete(note)
+        await session.commit()
@@ -0,0 +1,112 @@
+"""자료실 회독 카운트 API — append-only 로그 기반.
+
+동작 규칙 (사용자 명시):
+  - detail 페이지 진입만으로 자동 +1 금지. 명시 클릭 시에만 호출.
+  - POST /api/documents/{id}/read       → row 1개 insert (회독 +1)
+  - GET  /api/documents/{id}/read-stats → {read_count, last_read_at}
+  - DELETE /api/documents/{id}/read/last → 현재 사용자의 그 문서 마지막 row 1개만 삭제
+
+ownership:
+  - documents 테이블에 user_id 없음 (single-user). document_reads.user_id 로
+    사용자 분리. multi-user 전환 시 documents.user_id 추가 후 ownership check 필요.
+"""
+
+import logging
+from datetime import datetime
+from typing import Annotated
+
+from fastapi import APIRouter, Depends, HTTPException
+from pydantic import BaseModel
+from sqlalchemy import delete, func, select
+from sqlalchemy.ext.asyncio import AsyncSession
+
+from core.auth import get_current_user
+from core.database import get_session
+from models.document import Document
+from models.document_read import DocumentRead
+from models.user import User
+
+logger = logging.getLogger(__name__)
+router = APIRouter()
+
+
+class ReadStats(BaseModel):
+    read_count: int
+    last_read_at: datetime | None
+
+
+async def _get_stats(
+    session: AsyncSession, user_id: int, document_id: int
+) -> ReadStats:
+    row = await session.execute(
+        select(
+            func.count(DocumentRead.id),
+            func.max(DocumentRead.read_at),
+        ).where(
+            DocumentRead.user_id == user_id,
+            DocumentRead.document_id == document_id,
+        )
+    )
+    count, last = row.one()
+    return ReadStats(read_count=int(count or 0), last_read_at=last)
+
+
+async def _verify_document_visible(
+    session: AsyncSession, document_id: int
+) -> Document:
+    """문서 존재 + 미삭제 확인. ownership 은 single-user 가정으로 통과."""
+    doc = await session.get(Document, document_id)
+    if doc is None or getattr(doc, "deleted_at", None) is not None:
+        raise HTTPException(status_code=404, detail="문서를 찾을 수 없습니다")
+    return doc
+
+
+@router.post("/{document_id}/read", response_model=ReadStats, status_code=201)
+async def add_read(
+    document_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """회독 +1 — 사용자 명시 클릭. 같은 날 여러 번 호출 가능 (각각 별개 회독)."""
+    await _verify_document_visible(session, document_id)
+    session.add(DocumentRead(user_id=user.id, document_id=document_id))
+    await session.commit()
+    return await _get_stats(session, user.id, document_id)
+
+
+@router.get("/{document_id}/read-stats", response_model=ReadStats)
+async def get_read_stats(
+    document_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """현재 사용자의 그 문서 회독 통계."""
+    await _verify_document_visible(session, document_id)
+    return await _get_stats(session, user.id, document_id)
+
+
+@router.delete("/{document_id}/read/last", response_model=ReadStats)
+async def delete_last_read(
+    document_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """현재 사용자의 그 문서 마지막 회독 row 1개만 삭제 (실수 클릭 취소)."""
+    await _verify_document_visible(session, document_id)
+    # 현재 사용자 + 해당 문서의 가장 최근 row 1건만.
+    last = await session.execute(
+        select(DocumentRead.id)
+        .where(
+            DocumentRead.user_id == user.id,
+            DocumentRead.document_id == document_id,
+        )
+        .order_by(DocumentRead.read_at.desc(), DocumentRead.id.desc())
+        .limit(1)
+    )
+    last_id = last.scalar_one_or_none()
+    if last_id is not None:
+        await session.execute(
+            delete(DocumentRead).where(DocumentRead.id == last_id)
+        )
+        await session.commit()
+    return await _get_stats(session, user.id, document_id)
@@ -0,0 +1,680 @@
+"""events API — 개인 운영 로그 / 일정 / 할 일 / 회고 (PR-1).
+
+PR-1 scope (plan beszel-tingly-sloth.md v6):
+- POST /api/events (kind=task/calendar_event/activity_log)
+- GET /api/events/{id}
+- GET /api/events?kind&status&from&to&project_tag&source
+- PATCH /api/events/{id}  (허용 필드만, 시간 필드 변경 시 reschedule history)
+- POST /api/events/{id}/complete | /cancel | /defer | /reactivate
+- GET /api/events/today  (timezone 정책 적용)
+- GET /api/events/inbox
+- GET /api/events/activity?from&to
+
+PR-1 제외: DELETE / log shortcut / upcoming / ingest / iCal / ntfy.
+"""
+
+import json
+import logging
+from datetime import date, datetime, timedelta, timezone
+from typing import Annotated, Any
+from zoneinfo import ZoneInfo
+
+from fastapi import APIRouter, Body, Depends, HTTPException, Query
+from pydantic import BaseModel, Field
+from sqlalchemy import and_, or_, select
+from sqlalchemy.ext.asyncio import AsyncSession
+
+from core.auth import get_current_user
+from core.database import get_session
+from models.event import Event
+from models.event_history import EventHistory
+from models.user import User
+
+logger = logging.getLogger(__name__)
+
+router = APIRouter()
+
+DEFAULT_TIMEZONE = "Asia/Seoul"
+
+# PATCH 허용 필드 — status/completed_at/cancelled_at/defer_until/source/source_ref/
+# raw_metadata/user_id/created_by 는 lifecycle endpoint 또는 시스템 결정.
+PATCH_ALLOWED_FIELDS = {
+    "title",
+    "description",
+    "due_at",
+    "start_at",
+    "end_at",
+    "started_at",
+    "ended_at",
+    "all_day",
+    "timezone",
+    "priority",
+    "project_tag",
+    "tags",
+    "memo_document_id",
+}
+# 시간 필드 변경 시 reschedule history 1건 자동 기록 (defer_until 은 /defer 전용).
+RESCHEDULE_TIME_FIELDS = {
+    "due_at",
+    "start_at",
+    "end_at",
+    "started_at",
+    "ended_at",
+    "all_day",
+    "timezone",
+}
+
+
+# ─── 스키마 ───
+
+
+class EventCreate(BaseModel):
+    title: str
+    description: str | None = None
+    kind: str  # task | calendar_event | activity_log
+    status: str | None = None  # 미지정 시 kind 별 default
+    due_at: datetime | None = None
+    start_at: datetime | None = None
+    end_at: datetime | None = None
+    started_at: datetime | None = None
+    ended_at: datetime | None = None
+    all_day: bool = False
+    timezone: str | None = None
+    priority: int | None = None
+    project_tag: str | None = None
+    tags: list[Any] = Field(default_factory=list)
+    memo_document_id: int | None = None
+    source: str = "manual"
+    source_ref: str | None = None
+    raw_metadata: dict[str, Any] = Field(default_factory=dict)
+
+
+class EventPatch(BaseModel):
+    """PATCH 허용 필드만. status/completed_at 등 lifecycle 필드는 명시 거부."""
+
+    title: str | None = None
+    description: str | None = None
+    due_at: datetime | None = None
+    start_at: datetime | None = None
+    end_at: datetime | None = None
+    started_at: datetime | None = None
+    ended_at: datetime | None = None
+    all_day: bool | None = None
+    timezone: str | None = None
+    priority: int | None = None
+    project_tag: str | None = None
+    tags: list[Any] | None = None
+    memo_document_id: int | None = None
+
+    model_config = {"extra": "forbid"}  # 허용 외 필드 → 422
+
+
+class DeferRequest(BaseModel):
+    defer_until: datetime
+
+
+class EventResponse(BaseModel):
+    id: int
+    title: str
+    description: str | None
+    kind: str
+    status: str
+    due_at: datetime | None
+    start_at: datetime | None
+    end_at: datetime | None
+    started_at: datetime | None
+    ended_at: datetime | None
+    all_day: bool
+    timezone: str | None
+    defer_until: datetime | None
+    completed_at: datetime | None
+    cancelled_at: datetime | None
+    priority: int | None
+    project_tag: str | None
+    tags: list[Any]
+    source: str
+    source_ref: str | None
+    raw_metadata: dict[str, Any]
+    memo_document_id: int | None
+    user_id: int
+    created_by: str
+    created_at: datetime
+    updated_at: datetime
+
+
+class EventListResponse(BaseModel):
+    items: list[EventResponse]
+    total: int
+
+
+class EventHistoryResponse(BaseModel):
+    id: int
+    event_id: int
+    changed_at: datetime
+    changed_by: str
+    change_kind: str
+    before: dict[str, Any] | None
+    after: dict[str, Any]
+
+
+class EventHistoryListResponse(BaseModel):
+    items: list[EventHistoryResponse]
+
+
+# ─── 헬퍼 ───
+
+
+def _to_response(ev: Event) -> EventResponse:
+    return EventResponse.model_validate(ev, from_attributes=True)
+
+
+def _serialize_for_history(ev: Event) -> dict[str, Any]:
+    """events_history.before/after 용 dict snapshot (JSON 친화)."""
+    payload: dict[str, Any] = {}
+    for col in (
+        "id",
+        "title",
+        "description",
+        "kind",
+        "status",
+        "due_at",
+        "start_at",
+        "end_at",
+        "started_at",
+        "ended_at",
+        "all_day",
+        "timezone",
+        "defer_until",
+        "completed_at",
+        "cancelled_at",
+        "priority",
+        "project_tag",
+        "tags",
+        "source",
+        "source_ref",
+        "raw_metadata",
+        "memo_document_id",
+        "user_id",
+        "created_by",
+    ):
+        v = getattr(ev, col, None)
+        if isinstance(v, datetime):
+            payload[col] = v.isoformat()
+        else:
+            payload[col] = v
+    return payload
+
+
+def _actor_for_user(user: User) -> str:
+    """사용자 직접 호출 = manual. 향후 이드/email_ingest 는 service token 분기 (PR-3)."""
+    return "manual"
+
+
+async def _record_history(
+    session: AsyncSession,
+    *,
+    event: Event,
+    change_kind: str,
+    changed_by: str,
+    before: dict[str, Any] | None,
+    after: dict[str, Any],
+) -> None:
+    history = EventHistory(
+        event_id=event.id,
+        changed_by=changed_by,
+        change_kind=change_kind,
+        before=before,
+        after=after,
+    )
+    session.add(history)
+
+
+async def _load_owned(
+    session: AsyncSession, event_id: int, user: User
+) -> Event:
+    ev = await session.get(Event, event_id)
+    if ev is None or ev.user_id != user.id:
+        raise HTTPException(status_code=404, detail="event not found")
+    return ev
+
+
+def _resolve_timezone(tz_name: str | None) -> ZoneInfo:
+    try:
+        return ZoneInfo(tz_name or DEFAULT_TIMEZONE)
+    except Exception:
+        raise HTTPException(status_code=400, detail=f"invalid timezone: {tz_name}")
+
+
+def _local_day_bounds(tz_name: str | None) -> tuple[datetime, datetime, datetime]:
+    """today 의 [start_utc, end_utc) + now_utc 반환."""
+    tz = _resolve_timezone(tz_name)
+    now_local = datetime.now(tz)
+    today_local = now_local.replace(hour=0, minute=0, second=0, microsecond=0)
+    tomorrow_local = today_local + timedelta(days=1)
+    return (
+        today_local.astimezone(timezone.utc),
+        tomorrow_local.astimezone(timezone.utc),
+        now_local.astimezone(timezone.utc),
+    )
+
+
+def _apply_activity_log_defaults(payload: dict[str, Any]) -> None:
+    """빠른 행동 기록 5초 UX — kind=activity_log 시 status/시간 default."""
+    if payload.get("kind") != "activity_log":
+        return
+    now = datetime.now(timezone.utc)
+    if not payload.get("status"):
+        payload["status"] = "done"
+    if payload.get("ended_at") is None:
+        payload["ended_at"] = now
+    if payload.get("started_at") is None:
+        payload["started_at"] = payload["ended_at"]
+    if payload.get("status") == "done":
+        payload.setdefault("completed_at", now)
+
+
+def _apply_kind_default_status(payload: dict[str, Any]) -> None:
+    """kind 별 status default 보정."""
+    if payload.get("status"):
+        return
+    kind = payload.get("kind")
+    if kind == "calendar_event":
+        payload["status"] = "scheduled"
+    elif kind == "task":
+        payload["status"] = "inbox"
+
+
+# ─── Create ───
+
+
+@router.post("/", response_model=EventResponse, status_code=201)
+async def create_event(
+    body: EventCreate,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """events 생성. kind=activity_log 면 status=done/ended_at=now() default."""
+    payload = body.model_dump(exclude_none=False)
+    _apply_activity_log_defaults(payload)
+    _apply_kind_default_status(payload)
+
+    if payload["kind"] not in ("task", "calendar_event", "activity_log"):
+        raise HTTPException(status_code=400, detail="invalid kind")
+
+    actor = _actor_for_user(user)
+    ev = Event(
+        title=payload["title"],
+        description=payload.get("description"),
+        kind=payload["kind"],
+        status=payload.get("status") or "inbox",
+        due_at=payload.get("due_at"),
+        start_at=payload.get("start_at"),
+        end_at=payload.get("end_at"),
+        started_at=payload.get("started_at"),
+        ended_at=payload.get("ended_at"),
+        all_day=payload.get("all_day") or False,
+        timezone=payload.get("timezone"),
+        completed_at=payload.get("completed_at"),
+        priority=payload.get("priority"),
+        project_tag=payload.get("project_tag"),
+        tags=payload.get("tags") or [],
+        source=payload.get("source") or "manual",
+        source_ref=payload.get("source_ref"),
+        raw_metadata=payload.get("raw_metadata") or {},
+        memo_document_id=payload.get("memo_document_id"),
+        user_id=user.id,
+        created_by=actor,
+    )
+    session.add(ev)
+    await session.flush()
+
+    await _record_history(
+        session,
+        event=ev,
+        change_kind="create",
+        changed_by=actor,
+        before=None,
+        after=_serialize_for_history(ev),
+    )
+    await session.commit()
+    await session.refresh(ev)
+    return _to_response(ev)
+
+
+# ─── List / Get ───
+
+
+@router.get("/", response_model=EventListResponse)
+async def list_events(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    kind: str | None = Query(None),
+    status: str | None = Query(None, description="comma-separated list"),
+    from_: datetime | None = Query(None, alias="from"),
+    to: datetime | None = Query(None),
+    project_tag: str | None = Query(None),
+    source: str | None = Query(None),
+    page: int = Query(1, ge=1),
+    page_size: int = Query(50, ge=1, le=200),
+):
+    """events 목록 — current_user.id 자동 필터. upcoming 은 ?from=now&to=now+7d 로."""
+    where = [Event.user_id == user.id]
+    if kind:
+        where.append(Event.kind == kind)
+    if status:
+        statuses = [s.strip() for s in status.split(",") if s.strip()]
+        if statuses:
+            where.append(Event.status.in_(statuses))
+    if project_tag:
+        where.append(Event.project_tag == project_tag)
+    if source:
+        where.append(Event.source == source)
+    if from_ is not None:
+        # task: due_at, calendar_event: start_at, activity_log: started_at
+        where.append(
+            or_(
+                Event.due_at >= from_,
+                Event.start_at >= from_,
+                Event.started_at >= from_,
+            )
+        )
+    if to is not None:
+        where.append(
+            or_(
+                Event.due_at < to,
+                Event.start_at < to,
+                Event.started_at < to,
+            )
+        )
+
+    base = select(Event).where(and_(*where))
+    total_q = await session.execute(
+        select(Event.id).where(and_(*where))
+    )
+    total = len(total_q.scalars().all())
+
+    rows = await session.execute(
+        base.order_by(Event.created_at.desc())
+        .offset((page - 1) * page_size)
+        .limit(page_size)
+    )
+    items = [_to_response(e) for e in rows.scalars().all()]
+    return EventListResponse(items=items, total=total)
+
+
+@router.get("/today", response_model=EventListResponse)
+async def list_today(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    timezone: str | None = Query(None, description="기본 Asia/Seoul"),
+):
+    """오늘 해야 할 것 / 예정된 것. timezone 적용.
+
+    포함: task(due_at today) / calendar_event(start_at today) / activity_log(started_at today)
+    status: inbox/next/scheduled/in_progress 또는 deferred (defer_until <= now() 일 때만).
+    """
+    start_utc, end_utc, now_utc = _local_day_bounds(timezone)
+
+    today_clause = or_(
+        and_(Event.kind == "task", Event.due_at >= start_utc, Event.due_at < end_utc),
+        and_(
+            Event.kind == "calendar_event",
+            Event.start_at >= start_utc,
+            Event.start_at < end_utc,
+        ),
+        and_(
+            Event.kind == "activity_log",
+            Event.started_at >= start_utc,
+            Event.started_at < end_utc,
+        ),
+    )
+    active_clause = or_(
+        Event.status.in_(("inbox", "next", "scheduled", "in_progress")),
+        and_(Event.status == "deferred", Event.defer_until <= now_utc),
+    )
+    rows = await session.execute(
+        select(Event)
+        .where(Event.user_id == user.id, today_clause, active_clause)
+        .order_by(Event.start_at.asc(), Event.due_at.asc(), Event.started_at.asc())
+    )
+    items = [_to_response(e) for e in rows.scalars().all()]
+    return EventListResponse(items=items, total=len(items))
+
+
+@router.get("/inbox", response_model=EventListResponse)
+async def list_inbox(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """Inbox — 아직 정리 안 된 것."""
+    rows = await session.execute(
+        select(Event)
+        .where(Event.user_id == user.id, Event.status == "inbox")
+        .order_by(Event.created_at.desc())
+    )
+    items = [_to_response(e) for e in rows.scalars().all()]
+    return EventListResponse(items=items, total=len(items))
+
+
+@router.get("/activity", response_model=EventListResponse)
+async def list_activity(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    from_: datetime | None = Query(None, alias="from"),
+    to: datetime | None = Query(None),
+):
+    """Activity timeline — 한 일 (kind=activity_log + status=done). Today 와 분리."""
+    where = [
+        Event.user_id == user.id,
+        Event.kind == "activity_log",
+        Event.status == "done",
+    ]
+    if from_ is not None:
+        where.append(Event.started_at >= from_)
+    if to is not None:
+        where.append(Event.started_at < to)
+    rows = await session.execute(
+        select(Event).where(and_(*where)).order_by(Event.started_at.desc())
+    )
+    items = [_to_response(e) for e in rows.scalars().all()]
+    return EventListResponse(items=items, total=len(items))
+
+
+@router.get("/{event_id}", response_model=EventResponse)
+async def get_event(
+    event_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    ev = await _load_owned(session, event_id, user)
+    return _to_response(ev)
+
+
+@router.get("/{event_id}/history", response_model=EventHistoryListResponse)
+async def get_event_history(
+    event_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """events_history 조회 — 상세 페이지 timeline. lifecycle op 자동 기록만 (v1)."""
+    await _load_owned(session, event_id, user)  # owner 검증
+    rows = await session.execute(
+        select(EventHistory)
+        .where(EventHistory.event_id == event_id)
+        .order_by(EventHistory.changed_at.desc())
+    )
+    items = [
+        EventHistoryResponse.model_validate(h, from_attributes=True)
+        for h in rows.scalars().all()
+    ]
+    return EventHistoryListResponse(items=items)
+
+
+# ─── PATCH ───
+
+
+@router.patch("/{event_id}", response_model=EventResponse)
+async def patch_event(
+    event_id: int,
+    body: EventPatch,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """PATCH — 허용 필드만. 시간 필드 변경 시 reschedule history 자동 기록.
+
+    status/completed_at/cancelled_at/defer_until 등 lifecycle 필드는 별 endpoint 강제.
+    """
+    ev = await _load_owned(session, event_id, user)
+
+    patch = body.model_dump(exclude_unset=True)
+    if not patch:
+        return _to_response(ev)
+
+    # 안전 검사 — extra=forbid 로 막혀 있지만 한 번 더.
+    for k in patch:
+        if k not in PATCH_ALLOWED_FIELDS:
+            raise HTTPException(status_code=400, detail=f"field not patchable: {k}")
+
+    time_changed = any(k in RESCHEDULE_TIME_FIELDS for k in patch)
+    before_snapshot = _serialize_for_history(ev) if time_changed else None
+
+    for k, v in patch.items():
+        setattr(ev, k, v)
+    await session.flush()
+
+    if time_changed:
+        actor = _actor_for_user(user)
+        await _record_history(
+            session,
+            event=ev,
+            change_kind="reschedule",
+            changed_by=actor,
+            before=before_snapshot,
+            after=_serialize_for_history(ev),
+        )
+
+    await session.commit()
+    await session.refresh(ev)
+    return _to_response(ev)
+
+
+# ─── Lifecycle ───
+
+
+async def _transition(
+    session: AsyncSession,
+    *,
+    event: Event,
+    change_kind: str,
+    new_status: str,
+    user: User,
+    extra_apply: dict[str, Any] | None = None,
+) -> Event:
+    actor = _actor_for_user(user)
+    before = _serialize_for_history(event)
+    event.status = new_status
+    if extra_apply:
+        for k, v in extra_apply.items():
+            setattr(event, k, v)
+    await session.flush()
+    await _record_history(
+        session,
+        event=event,
+        change_kind=change_kind,
+        changed_by=actor,
+        before=before,
+        after=_serialize_for_history(event),
+    )
+    return event
+
+
+@router.post("/{event_id}/complete", response_model=EventResponse)
+async def complete_event(
+    event_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    ev = await _load_owned(session, event_id, user)
+    now = datetime.now(timezone.utc)
+    await _transition(
+        session,
+        event=ev,
+        change_kind="complete",
+        new_status="done",
+        user=user,
+        extra_apply={"completed_at": now},
+    )
+    await session.commit()
+    await session.refresh(ev)
+    return _to_response(ev)
+
+
+@router.post("/{event_id}/cancel", response_model=EventResponse)
+async def cancel_event(
+    event_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    ev = await _load_owned(session, event_id, user)
+    now = datetime.now(timezone.utc)
+    await _transition(
+        session,
+        event=ev,
+        change_kind="cancel",
+        new_status="cancelled",
+        user=user,
+        extra_apply={"cancelled_at": now},
+    )
+    await session.commit()
+    await session.refresh(ev)
+    return _to_response(ev)
+
+
+@router.post("/{event_id}/defer", response_model=EventResponse)
+async def defer_event(
+    event_id: int,
+    body: DeferRequest,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    ev = await _load_owned(session, event_id, user)
+    await _transition(
+        session,
+        event=ev,
+        change_kind="defer",
+        new_status="deferred",
+        user=user,
+        extra_apply={"defer_until": body.defer_until},
+    )
+    await session.commit()
+    await session.refresh(ev)
+    return _to_response(ev)
+
+
+@router.post("/{event_id}/reactivate", response_model=EventResponse)
+async def reactivate_event(
+    event_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """완료/취소/연기 해제 — kind 따라 기본 status 복귀.
+
+    task: inbox, calendar_event: scheduled, activity_log: done 유지 안 함 (activity_log 는 done 이 자연 상태이므로 reactivate 적용 X → 400).
+    """
+    ev = await _load_owned(session, event_id, user)
+    if ev.kind == "activity_log":
+        raise HTTPException(
+            status_code=400, detail="activity_log 는 reactivate 대상 아님"
+        )
+    new_status = "scheduled" if ev.kind == "calendar_event" else "inbox"
+    await _transition(
+        session,
+        event=ev,
+        change_kind="reactivate",
+        new_status=new_status,
+        user=user,
+        extra_apply={"completed_at": None, "cancelled_at": None, "defer_until": None},
+    )
+    await session.commit()
+    await session.refresh(ev)
+    return _to_response(ev)
@@ -0,0 +1,75 @@
+"""PR-MacMini-Derived-Worker-1 internal endpoint.
+
+Mac mini derived-worker 가 study explanation 가공을 위해 호출.
+GPU = RAG context provider (LLM generation X), Mac mini = LLM 가공 공장.
+Bearer token 보호 (settings.internal_worker_token).
+"""
+from __future__ import annotations
+
+import logging
+
+from fastapi import APIRouter, Depends, Header, HTTPException, Path, Response, status
+from sqlalchemy.ext.asyncio import AsyncSession
+
+from core.config import settings
+from core.database import async_session
+from models.study_question import StudyQuestion
+from services.study.explanation_rag import gather_explanation_context, render_evidence_block
+from workers.study_explanation_worker import _render_envelope_prompt
+
+logger = logging.getLogger(__name__)
+
+router = APIRouter()
+
+
+def _verify_token(authorization: str | None = Header(default=None)) -> None:
+    if not settings.internal_worker_token:
+        raise HTTPException(status_code=503, detail="internal_worker_token not configured")
+    if not authorization or not authorization.lower().startswith("bearer "):
+        raise HTTPException(status_code=401, detail="missing Bearer token")
+    token = authorization[7:].strip()
+    if token != settings.internal_worker_token:
+        raise HTTPException(status_code=403, detail="invalid token")
+
+
+async def _session() -> AsyncSession:
+    async with async_session() as s:
+        yield s
+
+
+@router.get("/explanation-context/{question_id}")
+async def get_explanation_context(
+    question_id: int = Path(..., ge=1),
+    _auth: None = Depends(_verify_token),
+    session: AsyncSession = Depends(_session),
+):
+    question = await session.get(StudyQuestion, question_id)
+    if question is None or question.deleted_at is not None:
+        raise HTTPException(status_code=410, detail="question deleted or missing")
+    if question.ai_explanation_status == "ready":
+        raise HTTPException(status_code=410, detail="explanation already ready")
+
+    ctx = await gather_explanation_context(session, question.user_id, question)
+    docs_count = len(ctx.documents)
+    qs_count = len(ctx.questions)
+    if docs_count == 0 and qs_count == 0:
+        return Response(status_code=204)
+
+    doc_block = render_evidence_block(ctx.documents)
+    q_block = render_evidence_block(ctx.questions)
+    rendered_prompt = _render_envelope_prompt(question, doc_block, q_block)
+
+    logger.info(
+        "internal_study_context qid=%s docs=%s questions=%s prompt_len=%s",
+        question_id, docs_count, qs_count, len(rendered_prompt),
+    )
+
+    return {
+        "question_id": question.id,
+        "question_correct_choice": question.correct_choice,
+        "rendered_prompt": rendered_prompt,
+        "evidence_summary": {
+            "documents_count": docs_count,
+            "questions_count": qs_count,
+        },
+    }
@@ -0,0 +1,544 @@
+"""자료실 분류 체계 CRUD API — /api/library"""
+
+from datetime import datetime
+from typing import Annotated
+
+from fastapi import APIRouter, Depends, HTTPException, Query
+from pydantic import BaseModel
+from sqlalchemy import func, select
+from sqlalchemy import text as sql_text
+from sqlalchemy.ext.asyncio import AsyncSession
+
+from core.auth import get_current_user
+from core.database import get_session
+from core.library import LIBRARY_PREFIX, MAX_DEPTH, normalize_library_path
+from models.category import LibraryCategory
+from models.document import Document
+from models.facet_value import FacetValue
+from models.user import User
+
+FACET_TYPES = ("company", "topic", "doctype")  # year는 사전 불필요
+
+router = APIRouter()
+
+
+# ─── 스키마 ───
+
+
+class CategoryCreate(BaseModel):
+    path: str
+
+
+class CategoryRename(BaseModel):
+    path: str
+    new_name: str
+
+
+class CategoryResponse(BaseModel):
+    id: int
+    path: str
+    name: str
+    parent_path: str | None
+    depth: int
+    is_system: bool
+    created_at: datetime
+    updated_at: datetime
+
+    model_config = {"from_attributes": True}
+
+
+class CategoryTreeNode(BaseModel):
+    name: str
+    path: str
+    count: int
+    # 현재 사용자 기준, 해당 경로 (하위 경로 포함) 의 안 본 자료 수.
+    # 0 이면 모두 1+회독.
+    unread_count: int = 0
+    is_category: bool
+    is_system: bool
+    has_children: bool
+    children: list["CategoryTreeNode"]
+
+
+# ─── 엔드포인트 ───
+
+
+@router.get("/categories", response_model=list[CategoryResponse])
+async def list_categories(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """전체 카테고리 flat 목록 (path 순)"""
+    result = await session.execute(
+        select(LibraryCategory).order_by(LibraryCategory.path)
+    )
+    return [CategoryResponse.model_validate(c) for c in result.scalars().all()]
+
+
+@router.post("/categories", response_model=CategoryResponse, status_code=201)
+async def create_category(
+    body: CategoryCreate,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """카테고리 생성 (조상 자동 생성 포함)"""
+    try:
+        normalized = normalize_library_path(body.path)
+    except ValueError as e:
+        raise HTTPException(status_code=400, detail=str(e))
+
+    segments = normalized.split("/")
+    if len(segments) > MAX_DEPTH:
+        raise HTTPException(status_code=400, detail=f"최대 {MAX_DEPTH}단계까지 가능")
+
+    # 중복 검사
+    existing = await session.execute(
+        select(LibraryCategory).where(LibraryCategory.path == normalized)
+    )
+    if existing.scalar_one_or_none():
+        raise HTTPException(status_code=409, detail="이미 존재하는 분류 경로")
+
+    # 조상 자동 생성
+    for i in range(1, len(segments)):
+        ancestor_path = "/".join(segments[:i])
+        ancestor_name = segments[i - 1]
+        ancestor_parent = "/".join(segments[: i - 1]) or None
+        exists = await session.execute(
+            select(LibraryCategory.id).where(
+                LibraryCategory.path == ancestor_path
+            )
+        )
+        if not exists.scalar_one_or_none():
+            session.add(LibraryCategory(
+                path=ancestor_path,
+                name=ancestor_name,
+                parent_path=ancestor_parent,
+                depth=i,
+            ))
+
+    # 본 카테고리 생성
+    category = LibraryCategory(
+        path=normalized,
+        name=segments[-1],
+        parent_path="/".join(segments[:-1]) or None,
+        depth=len(segments),
+    )
+    session.add(category)
+    await session.commit()
+    await session.refresh(category)
+
+    return CategoryResponse.model_validate(category)
+
+
+@router.patch("/categories", response_model=CategoryResponse)
+async def rename_category(
+    body: CategoryRename,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """카테고리 이름 변경 (leaf only, path 기반 식별)"""
+    # 카테고리 조회
+    result = await session.execute(
+        select(LibraryCategory).where(LibraryCategory.path == body.path)
+    )
+    category = result.scalar_one_or_none()
+    if not category:
+        raise HTTPException(status_code=404, detail="분류를 찾을 수 없습니다")
+
+    # 시스템 분류 보호
+    if category.is_system:
+        raise HTTPException(status_code=422, detail="시스템 분류는 변경할 수 없습니다")
+
+    # leaf 검사
+    children = await session.execute(
+        select(func.count()).where(
+            LibraryCategory.parent_path == category.path
+        )
+    )
+    if children.scalar() > 0:
+        raise HTTPException(
+            status_code=422, detail="하위 분류가 있어 이름을 변경할 수 없습니다"
+        )
+
+    # new_name 검증
+    new_name = body.new_name.strip()
+    if not new_name:
+        raise HTTPException(status_code=400, detail="빈 이름")
+    if len(new_name) > 30:
+        raise HTTPException(status_code=400, detail="이름은 30자 이하")
+
+    # 새 path 계산
+    new_path = (
+        f"{category.parent_path}/{new_name}" if category.parent_path else new_name
+    )
+
+    # 중복 검사
+    dup = await session.execute(
+        select(LibraryCategory.id).where(LibraryCategory.path == new_path)
+    )
+    if dup.scalar_one_or_none():
+        raise HTTPException(status_code=409, detail="같은 이름의 분류가 이미 존재합니다")
+
+    old_tag = f"{LIBRARY_PREFIX}{category.path}"
+    new_tag = f"{LIBRARY_PREFIX}{new_path}"
+
+    # 문서 태그 갱신
+    await session.execute(
+        sql_text("""
+            UPDATE documents
+            SET user_tags = COALESCE((
+                SELECT jsonb_agg(
+                    CASE WHEN elem = :old_tag THEN :new_tag ELSE elem END
+                )
+                FROM jsonb_array_elements_text(
+                    COALESCE(user_tags, '[]'::jsonb)
+                ) AS elem
+            ), '[]'::jsonb)
+            WHERE user_tags @> :old_tag_jsonb
+        """).bindparams(
+            old_tag=old_tag,
+            new_tag=new_tag,
+            old_tag_jsonb=f'["{old_tag}"]',
+        )
+    )
+
+    # 카테고리 row 갱신 (path, name만. parent_path 유지)
+    category.path = new_path
+    category.name = new_name
+    await session.commit()
+    await session.refresh(category)
+
+    return CategoryResponse.model_validate(category)
+
+
+@router.delete("/categories", status_code=204)
+async def delete_category(
+    path: str = Query(..., description="삭제할 카테고리 경로"),
+    user: Annotated[User, Depends(get_current_user)] = None,
+    session: Annotated[AsyncSession, Depends(get_session)] = None,
+):
+    """카테고리 삭제 (leaf only, 문서 없는 경우만)"""
+    result = await session.execute(
+        select(LibraryCategory).where(LibraryCategory.path == path)
+    )
+    category = result.scalar_one_or_none()
+    if not category:
+        raise HTTPException(status_code=404, detail="분류를 찾을 수 없습니다")
+
+    if category.is_system:
+        raise HTTPException(status_code=422, detail="시스템 분류는 삭제할 수 없습니다")
+
+    # leaf 검사
+    children = await session.execute(
+        select(func.count()).where(
+            LibraryCategory.parent_path == category.path
+        )
+    )
+    if children.scalar() > 0:
+        raise HTTPException(
+            status_code=422, detail="하위 분류가 있어 삭제할 수 없습니다"
+        )
+
+    # 문서 연결 검사
+    tag = f"{LIBRARY_PREFIX}{category.path}"
+    doc_count = await session.execute(
+        sql_text("""
+            SELECT COUNT(*) FROM documents
+            WHERE deleted_at IS NULL
+              AND EXISTS (
+                  SELECT 1 FROM jsonb_array_elements_text(
+                      COALESCE(user_tags, '[]'::jsonb)
+                  ) AS t
+                  WHERE t = :tag
+              )
+        """).bindparams(tag=tag)
+    )
+    if doc_count.scalar() > 0:
+        raise HTTPException(
+            status_code=422,
+            detail="이 분류에 속한 문서가 있어 삭제할 수 없습니다. 문서를 먼저 이동하세요.",
+        )
+
+    await session.delete(category)
+    await session.commit()
+
+
+@router.get("/tree", response_model=list[CategoryTreeNode])
+async def get_library_tree(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """카테고리 저장소 + 문서 태그 count 머지 트리"""
+
+    # 1. 카테고리 전체 fetch
+    cat_result = await session.execute(
+        select(LibraryCategory).order_by(LibraryCategory.path)
+    )
+    categories = cat_result.scalars().all()
+
+    # path → category 매핑
+    cat_map: dict[str, LibraryCategory] = {c.path: c for c in categories}
+
+    # 2. 문서 태그에서 doc count 집계
+    doc_result = await session.execute(
+        select(Document.id, Document.user_tags).where(
+            Document.deleted_at == None,  # noqa: E711
+            Document.user_tags != None,  # noqa: E711
+        )
+    )
+
+    # path → set of doc_ids
+    path_docs: dict[str, set[int]] = {}
+    for doc_id, tags in doc_result:
+        if not tags:
+            continue
+        seen_ancestors: set[str] = set()
+        for tag in tags:
+            if not isinstance(tag, str) or not tag.startswith(LIBRARY_PREFIX):
+                continue
+            path = tag[len(LIBRARY_PREFIX):]
+            parts = path.split("/")
+            for i in range(1, len(parts) + 1):
+                ancestor = "/".join(parts[:i])
+                if ancestor not in seen_ancestors:
+                    path_docs.setdefault(ancestor, set()).add(doc_id)
+                    seen_ancestors.add(ancestor)
+
+    # 2.5 현재 사용자가 1+회독 한 doc_id 집합 (안 본 자료 = 전체 - 읽음)
+    from models.document_read import DocumentRead
+    read_result = await session.execute(
+        select(DocumentRead.document_id)
+        .where(DocumentRead.user_id == user.id)
+        .group_by(DocumentRead.document_id)
+    )
+    read_doc_ids: set[int] = {r[0] for r in read_result}
+
+    # 3. 모든 path 합산 (카테고리 + 태그)
+    all_paths = set(cat_map.keys()) | set(path_docs.keys())
+
+    # 4. 트리 구축
+    root: dict = {}
+    for p in sorted(all_paths):
+        parts = p.split("/")
+        node = root
+        for i, part in enumerate(parts):
+            if part not in node:
+                node[part] = {"_children": {}}
+            node = node[part]["_children"] if i < len(parts) - 1 else node[part]
+
+    def build_tree(d: dict, prefix: str = "") -> list[dict]:
+        nodes = []
+        for name, data in sorted(d.items()):
+            if name.startswith("_"):
+                continue
+            path = f"{prefix}/{name}" if prefix else name
+            children_dict = data.get("_children", {})
+            children = build_tree(children_dict, path)
+            cat = cat_map.get(path)
+            # path_docs[path] 는 이미 본 노드의 자손 doc 까지 누적되어 있음 (위 ancestor 누적 로직).
+            # 따라서 unread_count 도 하위 경로 전체 합산 (bottom-up 별도 계산 불필요).
+            docs_at_path = path_docs.get(path, set())
+            unread = len(docs_at_path - read_doc_ids)
+            nodes.append(CategoryTreeNode(
+                name=name,
+                path=path,
+                count=len(docs_at_path),
+                unread_count=unread,
+                is_category=path in cat_map,
+                is_system=cat.is_system if cat else False,
+                has_children=len(children) > 0,
+                children=children,
+            ))
+        return nodes
+
+    return build_tree(root)
+
+
+# ─── Facet API (Phase 2) ───
+
+
+class FacetValueResponse(BaseModel):
+    facet_type: str
+    value: str
+
+    model_config = {"from_attributes": True}
+
+
+class FacetCountItem(BaseModel):
+    value: str
+    count: int
+
+
+class FacetCountsResponse(BaseModel):
+    company: list[FacetCountItem]
+    topic: list[FacetCountItem]
+    year: list[FacetCountItem]
+    doctype: list[FacetCountItem]
+
+
+@router.get("/facets", response_model=dict[str, list[str]])
+async def get_facet_values(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """facet 축별 허용값 사전 (year는 실제 데이터 기반)"""
+    result: dict[str, list[str]] = {}
+
+    for ft in FACET_TYPES:
+        rows = await session.execute(
+            select(FacetValue.value)
+            .where(FacetValue.facet_type == ft)
+            .order_by(FacetValue.value)
+        )
+        result[ft] = [r[0] for r in rows]
+
+    # year는 사전 없이 실제 문서 값에서 추출
+    year_rows = await session.execute(
+        select(Document.facet_year)
+        .where(
+            Document.deleted_at == None,  # noqa: E711
+            Document.facet_year != None,  # noqa: E711
+        )
+        .distinct()
+        .order_by(Document.facet_year.desc())
+    )
+    result["year"] = [str(r[0]) for r in year_rows]
+
+    return result
+
+
+@router.post("/facets", response_model=FacetValueResponse, status_code=201)
+async def add_facet_value(
+    body: FacetValueResponse,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """facet 사전에 새 값 추가"""
+    if body.facet_type not in FACET_TYPES:
+        raise HTTPException(status_code=400, detail=f"허용 facet: {', '.join(FACET_TYPES)}")
+
+    value = body.value.strip()
+    if not value:
+        raise HTTPException(status_code=400, detail="빈 값")
+
+    existing = await session.execute(
+        select(FacetValue).where(
+            FacetValue.facet_type == body.facet_type,
+            FacetValue.value == value,
+        )
+    )
+    if existing.scalar_one_or_none():
+        raise HTTPException(status_code=409, detail="이미 존재하는 값")
+
+    fv = FacetValue(facet_type=body.facet_type, value=value)
+    session.add(fv)
+    await session.commit()
+    return FacetValueResponse(facet_type=body.facet_type, value=value)
+
+
+@router.get("/facet-counts", response_model=FacetCountsResponse)
+async def get_facet_counts(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    library_path: str | None = None,
+    facet_company: str | None = None,
+    facet_topic: str | None = None,
+    facet_year: int | None = None,
+    facet_doctype: str | None = None,
+    q: str | None = None,
+):
+    """현재 필터 기준 facet별 집계 count"""
+
+    def base_query():
+        query = select(Document).where(
+            Document.deleted_at == None,  # noqa: E711
+            Document.doc_purpose == "business",
+        )
+        if library_path:
+            exact = f"{LIBRARY_PREFIX}{library_path}"
+            prefix = f"{LIBRARY_PREFIX}{library_path}/%"
+            query = query.where(
+                sql_text("""
+                    EXISTS (
+                        SELECT 1 FROM jsonb_array_elements_text(
+                            COALESCE(documents.user_tags, '[]'::jsonb)
+                        ) AS t
+                        WHERE t = :exact OR t LIKE :prefix
+                    )
+                """).bindparams(exact=exact, prefix=prefix)
+            )
+        if q:
+            query = query.where(Document.title.ilike(f"%{q}%"))
+        return query
+
+    result = FacetCountsResponse(company=[], topic=[], year=[], doctype=[])
+
+    # company counts (다른 facet 필터 적용, 자기 자신 제외)
+    q_company = base_query()
+    if facet_topic:
+        q_company = q_company.where(Document.facet_topic == facet_topic)
+    if facet_year:
+        q_company = q_company.where(Document.facet_year == facet_year)
+    if facet_doctype:
+        q_company = q_company.where(Document.facet_doctype == facet_doctype)
+    rows = await session.execute(
+        select(Document.facet_company, func.count())
+        .where(Document.facet_company != None)  # noqa: E711
+        .where(Document.id.in_(q_company.with_only_columns(Document.id).subquery().select()))
+        .group_by(Document.facet_company)
+        .order_by(func.count().desc())
+    )
+    result.company = [FacetCountItem(value=r[0], count=r[1]) for r in rows]
+
+    # topic counts
+    q_topic = base_query()
+    if facet_company:
+        q_topic = q_topic.where(Document.facet_company == facet_company)
+    if facet_year:
+        q_topic = q_topic.where(Document.facet_year == facet_year)
+    if facet_doctype:
+        q_topic = q_topic.where(Document.facet_doctype == facet_doctype)
+    rows = await session.execute(
+        select(Document.facet_topic, func.count())
+        .where(Document.facet_topic != None)  # noqa: E711
+        .where(Document.id.in_(q_topic.with_only_columns(Document.id).subquery().select()))
+        .group_by(Document.facet_topic)
+        .order_by(func.count().desc())
+    )
+    result.topic = [FacetCountItem(value=r[0], count=r[1]) for r in rows]
+
+    # year counts
+    q_year = base_query()
+    if facet_company:
+        q_year = q_year.where(Document.facet_company == facet_company)
+    if facet_topic:
+        q_year = q_year.where(Document.facet_topic == facet_topic)
+    if facet_doctype:
+        q_year = q_year.where(Document.facet_doctype == facet_doctype)
+    rows = await session.execute(
+        select(Document.facet_year, func.count())
+        .where(Document.facet_year != None)  # noqa: E711
+        .where(Document.id.in_(q_year.with_only_columns(Document.id).subquery().select()))
+        .group_by(Document.facet_year)
+        .order_by(Document.facet_year.desc())
+    )
+    result.year = [FacetCountItem(value=str(r[0]), count=r[1]) for r in rows]
+
+    # doctype counts
+    q_doctype = base_query()
+    if facet_company:
+        q_doctype = q_doctype.where(Document.facet_company == facet_company)
+    if facet_topic:
+        q_doctype = q_doctype.where(Document.facet_topic == facet_topic)
+    if facet_year:
+        q_doctype = q_doctype.where(Document.facet_year == facet_year)
+    rows = await session.execute(
+        select(Document.facet_doctype, func.count())
+        .where(Document.facet_doctype != None)  # noqa: E711
+        .where(Document.id.in_(q_doctype.with_only_columns(Document.id).subquery().select()))
+        .group_by(Document.facet_doctype)
+        .order_by(func.count().desc())
+    )
+    result.doctype = [FacetCountItem(value=r[0], count=r[1]) for r in rows]
+
+    return result
@@ -0,0 +1,798 @@
+"""메모 CRUD API — text 메모(file_type='note') + voice 메모 (file_type='immutable', category='audio', source_channel='voice')
+
+doc_type enum = (immutable, editable, note). 기존 audio 파일이 file_type='immutable' + category='audio'
+패턴을 사용하므로 voice 메모도 같은 패턴 따름 (enum 확장 회피).
+"""
+
+import hashlib
+import logging
+import os
+import re
+import uuid
+from datetime import datetime, timezone
+from pathlib import Path
+from typing import Annotated, Any
+
+from fastapi import APIRouter, Depends, File, Form, HTTPException, Query, UploadFile
+from pydantic import BaseModel, Field
+from sqlalchemy import delete, func, select
+from sqlalchemy.ext.asyncio import AsyncSession
+
+from core.auth import get_current_user
+from core.config import settings
+from core.database import get_session
+from models.document import Document
+from models.event import Event
+from models.event_history import EventHistory
+from models.queue import ProcessingQueue, enqueue_stage
+from models.user import User
+
+# Voice upload 제한 (plan v9 결정 — 10분 / 50MB)
+VOICE_MAX_BYTES = 50 * 1024 * 1024
+VOICE_ALLOWED_EXTS = {".m4a", ".mp3", ".wav", ".webm", ".ogg", ".opus", ".aac"}
+VOICE_ALLOWED_CONTENT_PREFIXES = ("audio/",)
+VOICE_NAS_SUBDIR = "PKM/Recordings"  # /mnt/nas/Document_Server/PKM/Recordings/{YYYY-MM}/{uuid}.{ext}
+
+logger = logging.getLogger(__name__)
+
+router = APIRouter()
+
+# markdown task line: "- [ ] ..." 또는 "- [x] ..."
+TASK_LINE_RE = re.compile(r"^(\s*- \[)([ xX])(\].*)$")
+
+# #태그 파싱 패턴: 한글/영문/숫자/밑줄, 2자 이상
+TAG_PATTERN = re.compile(r"(?:^|(?<=\s))#([가-힣a-zA-Z0-9_]{2,})")
+
+
+def _parse_hashtags(content: str) -> list[str]:
+    """본문에서 #태그 추출, 중복 제거, 순서 유지"""
+    seen: set[str] = set()
+    tags: list[str] = []
+    for m in TAG_PATTERN.finditer(content):
+        tag = m.group(1)
+        if tag not in seen:
+            seen.add(tag)
+            tags.append(tag)
+    return tags
+
+
+def _content_hash(content: str) -> str:
+    """메모 본문의 SHA-256 해시 (note의 file_hash = content hash)"""
+    return hashlib.sha256(content.encode("utf-8")).hexdigest()
+
+
+def _auto_title(content: str) -> str:
+    """첫 줄에서 제목 자동 생성 (80자 절단, 마크다운 헤딩 제거)"""
+    first_line = content.split("\n", 1)[0].strip()
+    title = re.sub(r"^#+\s*", "", first_line)[:80] or "메모"
+    return title
+
+
+def _toggle_task_line(content: str, target_index: int, checked: bool) -> tuple[str, bool]:
+    """N번째 markdown task line을 찾아 checked/unchecked 상태로 설정.
+
+    (new_content, found) 반환. found=False면 target_index에 해당하는 task line이 없음
+    (본문 편집으로 drift된 경우).
+    """
+    lines = content.split("\n")
+    ti = 0
+    found = False
+    for i, line in enumerate(lines):
+        m = TASK_LINE_RE.match(line)
+        if not m:
+            continue
+        if ti == target_index:
+            mark = "x" if checked else " "
+            lines[i] = m.group(1) + mark + m.group(3)
+            found = True
+            break
+        ti += 1
+    return "\n".join(lines), found
+
+
+def _sync_task_state_with_content(content: str, existing_state: dict | None) -> dict:
+    """content 의 체크리스트 상태를 memo_task_state 와 동기화.
+
+    - content 의 `- [x]` 중 state 에 checked_at 이 없으면 현재 시각으로 기록
+      → 본문에 `- [x]` 로 직접 입력된 legacy 항목도 저장 시각 기준으로 10초 후 숨김 동작.
+    - content 의 `- [ ]` 에 해당하는 index 는 state 에서 제거.
+    - content 에 task 가 줄어들어 사라진 index 도 정리.
+    """
+    state = dict(existing_state or {})
+    current_keys: set[str] = set()
+    task_idx = 0
+    now_iso = datetime.now(timezone.utc).isoformat()
+    for line in (content or "").split("\n"):
+        m = TASK_LINE_RE.match(line)
+        if not m:
+            continue
+        key = str(task_idx)
+        is_checked = m.group(2).lower() == "x"
+        if is_checked:
+            current_keys.add(key)
+            entry = state.get(key) or {}
+            if not entry.get("checked_at"):
+                state[key] = {"checked_at": now_iso}
+        # unchecked 는 current_keys 에 넣지 않음 → 아래에서 제거
+        task_idx += 1
+    # content 에서 unchecked 가 됐거나 아예 사라진 index 의 state 정리
+    for k in list(state.keys()):
+        if k not in current_keys:
+            state.pop(k, None)
+    return state
+
+
+async def _enqueue_ai_stages(session: AsyncSession, document_id: int):
+    """classify + embed + chunk 큐 등록. 기존 pending 건 정리 (중복 방지)."""
+    stages = ["classify", "embed", "chunk"]
+    await session.execute(
+        delete(ProcessingQueue).where(
+            ProcessingQueue.document_id == document_id,
+            ProcessingQueue.stage.in_(stages),
+            ProcessingQueue.status == "pending",
+        )
+    )
+    for stage in stages:
+        await enqueue_stage(session, document_id, stage)
+
+
+# ─── 스키마 ───
+
+
+class MemoCreate(BaseModel):
+    content: str
+    title: str | None = None  # 선택적 제목 (없으면 첫 줄 자동 생성)
+    ask_includable: bool = True
+    # PR-Hermes-Docsrv-Bridge-1: 외부 채널 진입점 식별. default='memo' (web UI 호환).
+    # 허용 값: memo / voice / hermes / ... (app/models/document.py source_channel enum).
+    source_channel: str | None = None
+    # PR-Hermes-Docsrv-Bridge-1: channel/user/message_id/timestamp 등 채널 메타.
+    source_metadata: dict | None = None
+
+
+class MemoUpdate(BaseModel):
+    content: str
+    title: str | None = None  # 명시 제목 변경 (None이면 자동 생성)
+
+
+class ArchiveSet(BaseModel):
+    archived: bool
+
+
+class TaskToggle(BaseModel):
+    checked: bool
+
+
+class MemoResponse(BaseModel):
+    id: int
+    title: str | None
+    content: str | None  # extracted_text
+    file_format: str
+    user_tags: list | None
+    ai_tags: list | None
+    ai_domain: str | None
+    ai_sub_group: str | None
+    ai_summary: str | None
+    pinned: bool
+    archived: bool
+    ask_includable: bool
+    memo_task_state: dict  # {"<task_index>": {"checked_at": "<ISO8601>"}}
+    # Memo Intake Upgrade PR-2B — AI 추천 분류 (사용자 1-click promote 의 hint)
+    ai_event_kind: str | None = None
+    ai_event_confidence: float | None = None
+    source_channel: str | None = None  # voice/memo/hermes 등 진입점 식별 (UI 배지)
+    source_metadata: dict = {}  # PR-Hermes-Docsrv-Bridge-1: channel/user/message_id/timestamp
+    file_type: str | None = None  # audio (voice 메모) vs note (text 메모)
+    file_path: str | None = None  # voice 메모의 NAS audio 경로 (audio player 용)
+    created_at: datetime
+    updated_at: datetime
+
+    class Config:
+        from_attributes = True
+
+
+class MemoListResponse(BaseModel):
+    items: list[MemoResponse]
+    total: int
+    page: int
+    page_size: int
+
+
+def _to_memo_response(doc: Document) -> MemoResponse:
+    return MemoResponse(
+        id=doc.id,
+        title=doc.title,
+        content=doc.extracted_text,
+        file_format=doc.file_format,
+        user_tags=doc.user_tags,
+        ai_tags=doc.ai_tags,
+        ai_domain=doc.ai_domain,
+        ai_sub_group=doc.ai_sub_group,
+        ai_summary=doc.ai_summary,
+        pinned=doc.pinned,
+        archived=doc.archived,
+        ask_includable=doc.ask_includable,
+        memo_task_state=dict(doc.memo_task_state or {}),
+        ai_event_kind=doc.ai_event_kind,
+        ai_event_confidence=doc.ai_event_confidence,
+        source_channel=doc.source_channel,
+        source_metadata=dict(doc.source_metadata or {}),
+        file_type=doc.file_type,
+        file_path=doc.file_path,
+        created_at=doc.created_at,
+        updated_at=doc.updated_at,
+    )
+
+
+# ─── 엔드포인트 ───
+
+
+@router.post("/", response_model=MemoResponse, status_code=201)
+async def create_memo(
+    body: MemoCreate,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """메모 생성 — file_type='note', 파일 없는 문서"""
+    content = body.content.strip()
+    if not content:
+        raise HTTPException(status_code=400, detail="메모 내용이 비어있습니다")
+
+    # PR-Hermes-Docsrv-Bridge-1: source_channel/metadata override 가능. default='memo' (기존 web UI 호환).
+    channel = body.source_channel or "memo"
+    if channel not in ("memo", "voice", "hermes"):
+        raise HTTPException(
+            status_code=400,
+            detail=f"source_channel '{channel}' 허용 안 됨 (memo/voice/hermes 만)",
+        )
+    doc = Document(
+        file_path=None,
+        file_hash=_content_hash(content),
+        file_format="md",
+        file_size=len(content.encode("utf-8")),
+        file_type="note",
+        title=body.title.strip() if body.title and body.title.strip() else _auto_title(content),
+        extracted_text=content,
+        review_status="approved",
+        source_channel=channel,
+        source_metadata=body.source_metadata or {},
+        user_tags=_parse_hashtags(content),
+        pinned=False,
+        archived=False,
+        ask_includable=body.ask_includable,
+        # 본문에 `- [x]` 로 입력된 체크 항목도 생성 시각 기준 10초 후 자동 숨김 대상이 되도록 sync.
+        memo_task_state=_sync_task_state_with_content(content, None),
+    )
+    session.add(doc)
+    await session.flush()
+
+    await _enqueue_ai_stages(session, doc.id)
+    await session.commit()
+    await session.refresh(doc)
+
+    return _to_memo_response(doc)
+
+
+@router.get("/", response_model=MemoListResponse)
+async def list_memos(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    page: int = Query(1, ge=1),
+    page_size: int = Query(20, ge=1, le=100),
+    tag: str | None = Query(None, description="user_tags 또는 ai_tags 필터"),
+    archived: bool = Query(False, description="true면 아카이브 목록"),
+    pinned: bool | None = Query(None, description="true면 핀 고정된 메모만"),
+):
+    """메모 목록 — 활성: 핀 우선 + 최신순 / 아카이브: 최신순 (핀 무시)
+
+    PR-2C: source_channel='voice' (음성 메모) 도 포함. 사용자 의도 = 메모는 모든 입력의 inbox.
+    voice 메모는 file_type='immutable' + category='audio' + source_channel='voice' 패턴.
+    source_channel 만으로 분리 (file_type 필터는 immutable 다른 binary 까지 끌어옴 — 회피).
+    PR-Hermes-Docsrv-Bridge-1: source_channel='hermes' (Hermes Discord 등 외부 채널 진입) 도 inbox 포함.
+    """
+    base = select(Document).where(
+        Document.source_channel.in_(("memo", "voice", "hermes")),
+        Document.deleted_at == None,  # noqa: E711
+        Document.archived == archived,
+    )
+
+    if pinned is not None:
+        base = base.where(Document.pinned == pinned)
+
+    if tag:
+        base = base.where(
+            Document.user_tags.op("@>")(f'["{tag}"]')
+            | Document.ai_tags.op("@>")(f'["{tag}"]')
+        )
+
+    count_query = select(func.count()).select_from(base.subquery())
+    total = (await session.execute(count_query)).scalar() or 0
+
+    # 활성: pinned DESC + created_at DESC / 아카이브: created_at DESC (핀 무시)
+    if archived:
+        query = base.order_by(Document.created_at.desc())
+    else:
+        query = base.order_by(Document.pinned.desc(), Document.created_at.desc())
+
+    query = query.offset((page - 1) * page_size).limit(page_size)
+    result = await session.execute(query)
+    items = result.scalars().all()
+
+    return MemoListResponse(
+        items=[_to_memo_response(doc) for doc in items],
+        total=total,
+        page=page,
+        page_size=page_size,
+    )
+
+
+@router.get("/{memo_id}", response_model=MemoResponse)
+async def get_memo(
+    memo_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """메모 단건 조회"""
+    doc = await session.get(Document, memo_id)
+    if not doc or doc.file_type != "note" or doc.deleted_at is not None:
+        raise HTTPException(status_code=404, detail="메모를 찾을 수 없습니다")
+    return _to_memo_response(doc)
+
+
+@router.patch("/{memo_id}", response_model=MemoResponse)
+async def update_memo(
+    memo_id: int,
+    body: MemoUpdate,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """메모 수정 — content 변경 시 AI 데이터 초기화 + 재처리 큐 등록"""
+    doc = await session.get(Document, memo_id)
+    if not doc or doc.file_type != "note" or doc.deleted_at is not None:
+        raise HTTPException(status_code=404, detail="메모를 찾을 수 없습니다")
+
+    content = body.content.strip()
+    if not content:
+        raise HTTPException(status_code=400, detail="메모 내용이 비어있습니다")
+
+    doc.extracted_text = content
+    doc.file_hash = _content_hash(content)
+    doc.file_size = len(content.encode("utf-8"))
+    # 본문 편집으로 task 순서/추가/삭제가 일어났을 수 있으니 state 재동기화.
+    # `- [x]` 에 checked_at 없으면 이번 수정 시각으로 기록 → 10초 후 자동 숨김 동작.
+    doc.memo_task_state = _sync_task_state_with_content(content, doc.memo_task_state)
+    # PATCH semantics: title 필드를 명시적으로 보낸 경우만 덮어쓴다.
+    # 체크박스 토글 경로처럼 {content}만 PATCH 하면 기존 title을 보존해야 함
+    # (이전엔 None→_auto_title(content)로 제목이 체크박스 라인으로 덮어씌워지는 버그).
+    if "title" in body.model_fields_set:
+        doc.title = body.title.strip() if body.title and body.title.strip() else _auto_title(content)
+    elif not (doc.title or "").strip():
+        # 기존 title이 비어 있던 경우만 보강
+        doc.title = _auto_title(content)
+    doc.user_tags = _parse_hashtags(content)
+
+    # stale AI 데이터 즉시 초기화
+    doc.ai_summary = None
+    doc.ai_domain = None
+    doc.ai_sub_group = None
+    doc.ai_tags = None
+    doc.ai_confidence = None
+    doc.ai_processed_at = None
+    doc.embedding = None
+    doc.embedded_at = None
+
+    # 기존 chunks 삭제
+    from models.chunk import DocumentChunk
+    await session.execute(
+        delete(DocumentChunk).where(DocumentChunk.doc_id == memo_id)
+    )
+
+    # 재처리 큐 등록
+    await _enqueue_ai_stages(session, memo_id)
+
+    doc.updated_at = datetime.now(timezone.utc)
+    await session.commit()
+    await session.refresh(doc)
+
+    return _to_memo_response(doc)
+
+
+@router.patch("/{memo_id}/tasks/{task_index}", response_model=MemoResponse)
+async def toggle_memo_task(
+    memo_id: int,
+    task_index: int,
+    body: TaskToggle,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """메모 체크박스 토글 전용 엔드포인트.
+
+    N번째 markdown task line의 체크 상태를 설정하고 memo_task_state에 시각 기록.
+    AI 재처리(classify/embed/chunk)는 **의도적으로 스킵** — 체크박스 한 번에 재분석을 트리거하는 건 과하다.
+    같은 row를 동시에 토글하는 race 방지를 위해 SELECT ... FOR UPDATE 사용.
+    """
+    # ❶ FOR UPDATE: 같은 row 동시 토글 race 차단 (JSONB 전체 replace라 필수)
+    doc = await session.get(Document, memo_id, with_for_update=True)
+    if not doc or doc.file_type != "note" or doc.deleted_at is not None:
+        raise HTTPException(status_code=404, detail="메모를 찾을 수 없습니다")
+
+    state = dict(doc.memo_task_state or {})
+    key = str(task_index)
+
+    # ❷ content의 N번째 task line 토글
+    new_content, found = _toggle_task_line(doc.extracted_text or "", task_index, body.checked)
+    if not found:
+        # drift: 사용자가 본문 편집으로 task_index 매칭이 깨짐 → stale state만 정리하고 200 OK
+        stale_removed = key in state
+        if stale_removed:
+            state.pop(key, None)
+            doc.memo_task_state = state
+            await session.commit()
+            await session.refresh(doc)
+        logger.info(
+            "memo_task_toggle_drift memo_id=%s task_index=%s stale_removed=%s",
+            memo_id, task_index, stale_removed,
+        )
+        return _to_memo_response(doc)
+
+    doc.extracted_text = new_content
+    doc.file_hash = _content_hash(new_content)
+    doc.file_size = len(new_content.encode("utf-8"))
+
+    # ❸ task_state 갱신 (JSONB 전체 replace — FOR UPDATE lock 아래라 race safe)
+    if body.checked:
+        state[key] = {"checked_at": datetime.now(timezone.utc).isoformat()}
+    else:
+        state.pop(key, None)
+    doc.memo_task_state = state
+
+    doc.updated_at = datetime.now(timezone.utc)
+    # AI 재처리 / user_tags 재파싱 / chunks 삭제 / queue enqueue — 모두 의도적 스킵.
+    # 왜 스킵하는지 나중에 디버깅하지 않아도 되도록 명시 로그.
+    logger.info(
+        "memo_task_toggle_skip_ai memo_id=%s task_index=%s checked=%s",
+        memo_id, task_index, body.checked,
+    )
+
+    await session.commit()
+    await session.refresh(doc)
+    return _to_memo_response(doc)
+
+
+@router.delete("/{memo_id}", status_code=204)
+async def delete_memo(
+    memo_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """메모 soft delete"""
+    doc = await session.get(Document, memo_id)
+    if not doc or doc.file_type != "note" or doc.deleted_at is not None:
+        raise HTTPException(status_code=404, detail="메모를 찾을 수 없습니다")
+
+    doc.deleted_at = datetime.now(timezone.utc)
+    await session.commit()
+
+
+@router.patch("/{memo_id}/pin", response_model=MemoResponse)
+async def toggle_pin(
+    memo_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """메모 핀 토글"""
+    doc = await session.get(Document, memo_id)
+    if not doc or doc.file_type != "note" or doc.deleted_at is not None:
+        raise HTTPException(status_code=404, detail="메모를 찾을 수 없습니다")
+
+    doc.pinned = not doc.pinned
+    doc.updated_at = datetime.now(timezone.utc)
+    await session.commit()
+    await session.refresh(doc)
+
+    return _to_memo_response(doc)
+
+
+@router.patch("/{memo_id}/archive", response_model=MemoResponse)
+async def set_archive(
+    memo_id: int,
+    body: ArchiveSet,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """메모 아카이브 설정 (멱등, 토글 아님)"""
+    doc = await session.get(Document, memo_id)
+    if not doc or doc.file_type != "note" or doc.deleted_at is not None:
+        raise HTTPException(status_code=404, detail="메모를 찾을 수 없습니다")
+
+    doc.archived = body.archived
+    doc.updated_at = datetime.now(timezone.utc)
+    await session.commit()
+    await session.refresh(doc)
+
+    return _to_memo_response(doc)
+
+
+@router.patch("/{memo_id}/ask-includable", response_model=MemoResponse)
+async def toggle_ask_includable(
+    memo_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """/ask 합성 포함 여부 토글"""
+    doc = await session.get(Document, memo_id)
+    if not doc or doc.file_type != "note" or doc.deleted_at is not None:
+        raise HTTPException(status_code=404, detail="메모를 찾을 수 없습니다")
+
+    doc.ask_includable = not doc.ask_includable
+    doc.updated_at = datetime.now(timezone.utc)
+    await session.commit()
+    await session.refresh(doc)
+
+    return _to_memo_response(doc)
+
+
+# ─── Memo Intake Upgrade PR-2B: promote to event ───
+
+
+class PromotePayload(BaseModel):
+    """메모 → events 승급. kind 미지정 시 documents.ai_event_kind 사용.
+
+    AI worker 는 events row 직접 생성 X — 본 endpoint 만이 사용자 의도 channel.
+    """
+    kind: str | None = None  # 'task' | 'calendar_event' | 'activity_log'
+    due_at: datetime | None = None
+    start_at: datetime | None = None
+    end_at: datetime | None = None
+    started_at: datetime | None = None
+    ended_at: datetime | None = None
+    priority: int | None = None
+    project_tag: str | None = None
+
+
+_PROMOTE_KIND_MAP = {
+    # AI 추천 (event_kind_hint) → events.kind
+    "task": "task",
+    "calendar_event": "calendar_event",
+    "activity_log": "activity_log",
+    # 'note' / 'reference' 는 promote 대상 아님 (사용자가 명시 kind 지정 필요)
+}
+
+
+@router.post("/{memo_id}/promote-to-event", status_code=201)
+async def promote_memo_to_event(
+    memo_id: int,
+    body: PromotePayload,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """메모 1건 → events row 1건 생성. memo_document_id 자동 link.
+
+    kind 결정 순서: body.kind > documents.ai_event_kind > 400 거부.
+    한 메모 → N events 가능 (정책: dedup 없음, 사용자 의도 따라).
+    """
+    doc = await session.get(Document, memo_id)
+    if (
+        not doc
+        or doc.deleted_at is not None
+        or doc.source_channel not in ("memo", "voice")
+    ):
+        raise HTTPException(status_code=404, detail="메모를 찾을 수 없습니다")
+
+    # kind 결정
+    requested = (body.kind or "").strip().lower() or None
+    ai_hint = (doc.ai_event_kind or "").strip().lower() or None
+    chosen = requested or ai_hint
+    event_kind = _PROMOTE_KIND_MAP.get(chosen or "")
+    if not event_kind:
+        raise HTTPException(
+            status_code=400,
+            detail="promote 할 kind 가 명확하지 않습니다 (task/calendar_event/activity_log 중 1개 지정 또는 ai_event_kind 필요)",
+        )
+
+    # 시간 필드 default — activity_log 는 빠른 행동 기록 UX 그대로
+    now = datetime.now(timezone.utc)
+    started_at = body.started_at
+    ended_at = body.ended_at
+    completed_at: datetime | None = None
+    status_val = "inbox"
+    if event_kind == "activity_log":
+        ended_at = ended_at or now
+        started_at = started_at or ended_at
+        completed_at = now
+        status_val = "done"
+    elif event_kind == "calendar_event":
+        status_val = "scheduled" if body.start_at else "inbox"
+
+    title = (doc.title or "").strip() or "메모"
+    description = doc.extracted_text
+
+    ev = Event(
+        title=title,
+        description=description,
+        kind=event_kind,
+        status=status_val,
+        due_at=body.due_at,
+        start_at=body.start_at,
+        end_at=body.end_at,
+        started_at=started_at,
+        ended_at=ended_at,
+        completed_at=completed_at,
+        priority=body.priority,
+        project_tag=body.project_tag,
+        source="memo",
+        source_ref=str(doc.id),  # 같은 메모 N promote 시 별 row → dedup 의도 X
+        raw_metadata={
+            "memo_id": doc.id,
+            "ai_event_kind": doc.ai_event_kind,
+            "ai_event_confidence": doc.ai_event_confidence,
+            "promoted_at": now.isoformat(),
+        },
+        memo_document_id=doc.id,
+        user_id=user.id,
+        created_by="manual",
+    )
+    session.add(ev)
+    await session.flush()
+
+    # events_history.create row (events 도메인 패턴 — events/api/events.py 의 _record_history 와 동일 형태)
+    history = EventHistory(
+        event_id=ev.id,
+        changed_by="manual",
+        change_kind="create",
+        before=None,
+        after={
+            "id": ev.id,
+            "title": ev.title,
+            "kind": ev.kind,
+            "status": ev.status,
+            "source": ev.source,
+            "memo_document_id": ev.memo_document_id,
+        },
+    )
+    session.add(history)
+    await session.commit()
+    await session.refresh(ev)
+
+    return {
+        "event_id": ev.id,
+        "kind": ev.kind,
+        "status": ev.status,
+        "memo_document_id": ev.memo_document_id,
+    }
+
+
+@router.post("/{memo_id}/dismiss-event-suggestion", response_model=MemoResponse)
+async def dismiss_event_suggestion(
+    memo_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """'그냥 메모' — AI 추천 무시 + ai_event_kind='note' 강제. 4 버튼 숨김 신호.
+
+    MVP: AI 추천값과 사용자 확정값을 같은 컬럼에 저장 (정확도 측정 흐려짐 가능).
+    백로그: user_event_kind 별 컬럼 분리 (plan Memo Intake Upgrade 백로그).
+    """
+    doc = await session.get(Document, memo_id)
+    if (
+        not doc
+        or doc.deleted_at is not None
+        or doc.source_channel not in ("memo", "voice")
+    ):
+        raise HTTPException(status_code=404, detail="메모를 찾을 수 없습니다")
+
+    doc.ai_event_kind = "note"
+    doc.updated_at = datetime.now(timezone.utc)
+    await session.commit()
+    await session.refresh(doc)
+    return _to_memo_response(doc)
+
+
+# ─── Memo Intake Upgrade PR-2C: voice upload ───
+
+
+@router.post("/voice", response_model=MemoResponse, status_code=201)
+async def upload_voice_memo(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    audio: UploadFile = File(...),
+    recorded_at: str | None = Form(None),
+    device_hint: str | None = Form(None),
+):
+    """애플워치 / 모바일 / 기타 음성 메모 업로드 → STT 큐 → 자동 분류.
+
+    PR-2C: source_channel='voice' + file_type='audio'. 기존 stt_worker → classify
+    파이프라인 자동 통과. plan 원칙: AI worker 는 events 직접 생성 X.
+    """
+    # Content-Type 검증
+    if audio.content_type and not audio.content_type.startswith(VOICE_ALLOWED_CONTENT_PREFIXES):
+        raise HTTPException(status_code=415, detail=f"지원되지 않는 Content-Type: {audio.content_type}")
+
+    # 확장자 결정
+    orig_name = audio.filename or ""
+    ext = (Path(orig_name).suffix or "").lower()
+    if ext and ext not in VOICE_ALLOWED_EXTS:
+        raise HTTPException(status_code=415, detail=f"지원되지 않는 확장자: {ext}")
+    if not ext:
+        # content_type 으로 추정 (audio/m4a 등)
+        ext = ".m4a"
+
+    # 본문 읽기 + size 검증
+    payload: bytes = await audio.read()
+    if len(payload) > VOICE_MAX_BYTES:
+        raise HTTPException(status_code=413, detail=f"50MB 초과 ({len(payload)//1024//1024}MB)")
+    if len(payload) == 0:
+        raise HTTPException(status_code=400, detail="빈 audio")
+
+    # 저장 경로 (NAS) — fastapi 컨테이너 안 /documents = NAS mount
+    nas_root = Path(settings.nas_mount_path)
+    yyyy_mm = datetime.now(timezone.utc).astimezone().strftime("%Y-%m")
+    target_dir = nas_root / VOICE_NAS_SUBDIR / yyyy_mm
+    target_dir.mkdir(parents=True, exist_ok=True)
+    file_uuid = uuid.uuid4().hex
+    target_path = target_dir / f"{file_uuid}{ext}"
+
+    # fsync + rename(atomic) 패턴 — NAS soft mount 안전 (feedback_nfs_korean_path_normalize 결)
+    tmp_path = target_path.with_suffix(target_path.suffix + ".tmp")
+    try:
+        with open(tmp_path, "wb") as fh:
+            fh.write(payload)
+            fh.flush()
+            os.fsync(fh.fileno())
+        os.replace(tmp_path, target_path)
+    except OSError as e:
+        # NAS 쓰기 실패 graceful — DB row 미생성
+        if tmp_path.exists():
+            try:
+                tmp_path.unlink()
+            except OSError:
+                pass
+        logger.error("voice upload NAS write 실패: %s", e)
+        raise HTTPException(status_code=503, detail="NAS 저장 실패 (재시도 권장)")
+
+    # recorded_at 파싱
+    rec_at: datetime | None = None
+    if recorded_at:
+        try:
+            rec_at = datetime.fromisoformat(recorded_at.replace("Z", "+00:00"))
+        except ValueError:
+            rec_at = None
+
+    raw_metadata: dict[str, Any] = {}
+    if device_hint:
+        raw_metadata["device_hint"] = device_hint
+    if rec_at:
+        raw_metadata["recorded_at"] = rec_at.isoformat()
+
+    # file_path 는 NAS root 기준 상대 경로 (다른 documents 컨벤션, /api/documents/{id}/file endpoint 호환)
+    relative_path = target_path.relative_to(nas_root)
+
+    # Document row — file_type='immutable' (binary, doc_type enum 제약) + category='audio' + source_channel='voice'
+    # 기존 audio 컨테이너 인입과 같은 패턴. source_channel='voice' 로 일반 audio 와 구분.
+    title_seed = (orig_name or "음성 메모").rsplit(".", 1)[0]
+    doc = Document(
+        file_path=str(relative_path),
+        file_hash=hashlib.sha256(payload).hexdigest(),
+        file_format=ext.lstrip(".") or "m4a",
+        file_size=len(payload),
+        file_type="immutable",
+        title=title_seed[:80] or "음성 메모",
+        extracted_text=None,  # STT 후 채움
+        review_status="approved",
+        source_channel="voice",
+        category="audio",
+        ask_includable=True,
+        pinned=False,
+        archived=False,
+        memo_task_state={},
+        extract_meta=raw_metadata or None,
+    )
+    session.add(doc)
+    await session.flush()
+
+    # STT 큐 등록 — 기존 stt_worker → classify → embed → chunk 파이프라인 자동
+    await enqueue_stage(session, doc.id, "stt")
+    await session.commit()
+    await session.refresh(doc)
+
+    return _to_memo_response(doc)
@@ -8,7 +8,7 @@ from pydantic import BaseModel
 from sqlalchemy import String, select
 from sqlalchemy.ext.asyncio import AsyncSession

-from core.auth import get_current_user
+from core.auth import get_current_user, require_admin
 from core.database import get_session
 from models.news_source import NewsSource
 from models.user import User
@@ -60,9 +60,14 @@ async def list_sources(
@router.post("/sources")
 async def create_source(
    body: NewsSourceCreate,
-    user: Annotated[User, Depends(get_current_user)],
+    user: Annotated[User, Depends(require_admin)],
    session: Annotated[AsyncSession, Depends(get_session)],
 ):
+    from core.url_validator import validate_feed_url
+    try:
+        validate_feed_url(body.feed_url)
+    except ValueError as e:
+        raise HTTPException(status_code=422, detail=f"feed_url 검증 실패: {e}")
    source = NewsSource(**body.model_dump())
    session.add(source)
    await session.commit()
@@ -73,12 +78,18 @@ async def create_source(
 async def update_source(
    source_id: int,
    body: NewsSourceUpdate,
-    user: Annotated[User, Depends(get_current_user)],
+    user: Annotated[User, Depends(require_admin)],
    session: Annotated[AsyncSession, Depends(get_session)],
 ):
    source = await session.get(NewsSource, source_id)
    if not source:
        raise HTTPException(status_code=404)
+    if body.feed_url is not None:
+        from core.url_validator import validate_feed_url
+        try:
+            validate_feed_url(body.feed_url)
+        except ValueError as e:
+            raise HTTPException(status_code=422, detail=f"feed_url 검증 실패: {e}")
    for field, value in body.model_dump(exclude_unset=True).items():
        setattr(source, field, value)
    await session.commit()
@@ -88,7 +99,7 @@ async def update_source(
@router.delete("/sources/{source_id}")
 async def delete_source(
    source_id: int,
-    user: Annotated[User, Depends(get_current_user)],
+    user: Annotated[User, Depends(require_admin)],
    session: Annotated[AsyncSession, Depends(get_session)],
 ):
    source = await session.get(NewsSource, source_id)
@@ -105,6 +116,7 @@ async def list_articles(
    session: Annotated[AsyncSession, Depends(get_session)],
    source: str | None = None,
    unread_only: bool = False,
+    pinned_only: bool = False,
    page: int = 1,
    page_size: int = 30,
 ):
@@ -127,6 +139,8 @@ async def list_articles(
            query = query.where(Document.ai_sub_group == source)
    if unread_only:
        query = query.where(Document.is_read == False)
+    if pinned_only:
+        query = query.where(Document.pinned.is_(True))

    count_q = select(func.count()).select_from(query.subquery())
    total = (await session.execute(count_q)).scalar()
@@ -162,12 +176,28 @@ async def mark_all_read(
    return {"marked": result.rowcount}


+import asyncio
+
+_collect_lock = asyncio.Lock()
+
+
@router.post("/collect")
 async def trigger_collect(
-    user: Annotated[User, Depends(get_current_user)],
+    user: Annotated[User, Depends(require_admin)],
 ):
-    """수동 수집 트리거"""
-    from workers.news_collector import run
-    import asyncio
-    asyncio.create_task(run())
+    """수동 수집 트리거 (admin 전용).
+
+    asyncio.Lock은 단일 프로세스/이벤트루프 기준.
+    현재 FastAPI 단일 인스턴스 운영이므로 유효하지만,
+    scale-out 시 DB advisory lock으로 교체 필요.
+    """
+    if _collect_lock.locked():
+        raise HTTPException(status_code=429, detail="수집이 이미 진행 중입니다")
+
+    async def _run_with_lock():
+        async with _collect_lock:
+            from workers.news_collector import run
+            await run()
+
+    asyncio.create_task(_run_with_lock())
    return {"message": "뉴스 수집 시작됨"}
@@ -1,27 +1,39 @@
-"""하이브리드 검색 API — orchestrator (Phase 1.1: thin endpoint).
+"""하이브리드 검색 API — thin endpoint (Phase 3.1 이후).

-retrieval / fusion / rerank 등 실제 로직은 services/search/* 모듈로 분리.
-이 파일은 mode 분기, 응답 직렬화, debug 응답 구성, BackgroundTask dispatch만 담당.
+실제 검색 파이프라인(retrieval → fusion → rerank → diversity → confidence)
+은 `services/search/search_pipeline.py::run_search()` 로 분리되어 있다.
+이 파일은 다음만 담당:
+  - Pydantic 스키마 (SearchResult / SearchResponse / SearchDebug / DebugCandidate
+    / Citation / AskResponse / AskDebug)
+  - `/search` endpoint wrapper (run_search 호출 + logger + telemetry + 직렬화)
+  - `/ask` endpoint wrapper (Phase 3.3 에서 추가)
 """

+import asyncio
+import hmac
 import time
-from typing import Annotated
+from typing import Annotated, Literal

-from fastapi import APIRouter, BackgroundTasks, Depends, Query
+from fastapi import APIRouter, BackgroundTasks, Depends, Header, Query
 from pydantic import BaseModel
 from sqlalchemy.ext.asyncio import AsyncSession

 from core.auth import get_current_user
+from core.config import settings
 from core.database import get_session
 from core.utils import setup_logger
 from models.user import User
-from services.search.fusion_service import DEFAULT_FUSION, get_strategy, normalize_display_scores
-from services.search.retrieval_service import search_text, search_vector
-from services.search_telemetry import (
-    compute_confidence,
-    compute_confidence_hybrid,
-    record_search_event,
-)
+from services.document_telemetry import sanitize_source
+from services.search.classifier_service import ClassifierResult, classify
+from services.search.evidence_service import EvidenceItem, extract_evidence
+from services.search.fusion_service import DEFAULT_FUSION
+from services.search.grounding_check import check as grounding_check
+from services.search.refusal_gate import RefusalDecision, decide as refusal_decide
+from services.search.search_pipeline import PipelineResult, run_search
+from services.search.synthesis_service import SynthesisResult, synthesize
+from services.search.verifier_service import VerifierResult, verify
+from services.prompt_versions import ASK_PROMPT_VERSION, resolve_primary_model
+from services.search_telemetry import record_ask_event, record_search_event

 # logs/search.log + stdout 동시 출력 (Phase 0.4)
 logger = setup_logger("search")
@@ -30,7 +42,14 @@ router = APIRouter()


 class SearchResult(BaseModel):
-    id: int
+    """검색 결과 단일 행.
+
+    Phase 1.2-C: chunk-level vector retrieval 도입으로 chunk 메타 필드 추가.
+    text 검색 결과는 chunk_id 등이 None (doc-level).
+    vector 검색 결과는 chunk_id 등이 채워짐 (chunk-level).
+    """
+
+    id: int  # doc_id (text/vector 공통)
    title: str | None
    ai_domain: str | None
    ai_summary: str | None
@@ -38,6 +57,17 @@ class SearchResult(BaseModel):
    score: float
    snippet: str | None
    match_reason: str | None = None
+    # Phase 1.2-C: chunk 메타 (vector 검색 시 채워짐)
+    chunk_id: int | None = None
+    chunk_index: int | None = None
+    section_title: str | None = None
+    # Phase 3.1: reranker raw score 보존 (display score drift 방지).
+    # rerank 경로를 탄 chunk에만 채워짐. normalize_display_scores는 이 필드를
+    # 건드리지 않는다. Phase 3 evidence fast-path 판단에 사용.
+    rerank_score: float | None = None
+    # PR-RAG-Time-1: freshness decay 디버그 메타. apply_freshness_decay 가 채움.
+    # 비적용 row 도 채워짐(freshness_policy=None). base_score 는 항상 보존.
+    freshness_debug: dict | None = None


 # ─── Phase 0.4: 디버그 응답 스키마 ─────────────────────────
@@ -80,6 +110,29 @@ def _to_debug_candidates(rows: list[SearchResult], n: int = 20) -> list[DebugCan
    ]


+def _build_search_debug(pr: PipelineResult) -> SearchDebug:
+    """PipelineResult → SearchDebug (기존 search()의 debug 구성 블록 복사)."""
+    return SearchDebug(
+        timing_ms=pr.timing_ms,
+        text_candidates=(
+            _to_debug_candidates(pr.text_results)
+            if pr.text_results or pr.mode != "vector"
+            else None
+        ),
+        vector_candidates=(
+            _to_debug_candidates(pr.vector_results)
+            if pr.vector_results or pr.mode in ("vector", "hybrid")
+            else None
+        ),
+        fused_candidates=(
+            _to_debug_candidates(pr.results) if pr.mode == "hybrid" else None
+        ),
+        confidence=pr.confidence_signal,
+        notes=pr.notes,
+        query_analysis=pr.query_analysis,
+    )
+
+
@router.get("/", response_model=SearchResponse)
 async def search(
    q: str,
@@ -93,85 +146,720 @@ async def search(
        pattern="^(legacy|rrf|rrf_boost)$",
        description="hybrid 모드 fusion 전략 (legacy=기존 가중합, rrf=RRF k=60, rrf_boost=RRF+강한신호 boost)",
    ),
+    rerank: bool = Query(
+        True,
+        description="bge-reranker-v2-m3 활성화 (Phase 1.3, hybrid 모드만 동작)",
+    ),
+    analyze: bool = Query(
+        False,
+        description="QueryAnalyzer 활성화 (Phase 2.1, LLM 호출). Phase 2.1은 debug 노출만, 검색 경로 영향 X",
+    ),
    debug: bool = Query(False, description="단계별 candidates + timing 응답에 포함"),
 ):
-    """문서 검색 — FTS + ILIKE + 벡터 결합 (Phase 0.5: RRF fusion)"""
-    timing: dict[str, float] = {}
-    notes: list[str] = []
-    text_results: list[SearchResult] = []
-    vector_results: list[SearchResult] = []
-
-    t_total = time.perf_counter()
-
-    if mode == "vector":
-        t0 = time.perf_counter()
-        vector_results = await search_vector(session, q, limit)
-        timing["vector_ms"] = (time.perf_counter() - t0) * 1000
-        if not vector_results:
-            notes.append("vector_search_returned_empty (AI client error or no embeddings)")
-        results = vector_results
-    else:
-        t0 = time.perf_counter()
-        text_results = await search_text(session, q, limit)
-        timing["text_ms"] = (time.perf_counter() - t0) * 1000
-
-        if mode == "hybrid":
-            t1 = time.perf_counter()
-            vector_results = await search_vector(session, q, limit)
-            timing["vector_ms"] = (time.perf_counter() - t1) * 1000
-            if not vector_results:
-                notes.append("vector_search_returned_empty — text-only fallback")
-
-            t2 = time.perf_counter()
-            strategy = get_strategy(fusion)
-            results = strategy.fuse(text_results, vector_results, q, limit)
-            timing["fusion_ms"] = (time.perf_counter() - t2) * 1000
-            notes.append(f"fusion={strategy.name}")
-        else:
-            results = text_results
-
-    # display score 정규화 — 프론트엔드는 score*100을 % 표시.
-    # fusion 내부 score(RRF는 0.01~0.05 범위)를 그대로 노출하면 표시가 깨짐.
-    normalize_display_scores(results)
-
-    timing["total_ms"] = (time.perf_counter() - t_total) * 1000
-
-    # confidence는 fusion 적용 전 raw 신호로 계산 (Phase 0.5 이후 fused score는 절대값 의미 없음)
-    if mode == "hybrid":
-        confidence_signal = compute_confidence_hybrid(text_results, vector_results)
-    elif mode == "vector":
-        confidence_signal = compute_confidence(vector_results, "vector")
-    else:
-        confidence_signal = compute_confidence(text_results, mode)
+    """문서 검색 — FTS + ILIKE + 벡터 결합 (Phase 3.1 이후 run_search wrapper)"""
+    pr = await run_search(
+        session,
+        q,
+        mode=mode,  # type: ignore[arg-type]
+        limit=limit,
+        fusion=fusion,
+        rerank=rerank,
+        analyze=analyze,
+    )

    # 사용자 feedback: 모든 단계 timing은 debug 응답과 별도로 항상 로그로 남긴다
-    timing_str = " ".join(f"{k}={v:.0f}" for k, v in timing.items())
+    timing_str = " ".join(f"{k}={v:.0f}" for k, v in pr.timing_ms.items())
    fusion_str = f" fusion={fusion}" if mode == "hybrid" else ""
+    analyzer_str = (
+        f" analyzer=hit={pr.analyzer_cache_hit}/conf={pr.analyzer_confidence:.2f}/tier={pr.analyzer_tier}"
+        if analyze
+        else ""
+    )
    logger.info(
-        "search query=%r mode=%s%s results=%d conf=%.2f %s",
-        q[:80], mode, fusion_str, len(results), confidence_signal, timing_str,
+        "search query=%r mode=%s%s%s results=%d conf=%.2f %s",
+        q[:80],
+        pr.mode,
+        fusion_str,
+        analyzer_str,
+        len(pr.results),
+        pr.confidence_signal,
+        timing_str,
    )

    # Phase 0.3: 실패 자동 로깅 (응답 latency에 영향 X — background task)
+    # Phase 2.1: analyze=true일 때만 analyzer_confidence 전달 (False는 None → 기존 호환)
    background_tasks.add_task(
-        record_search_event, q, user.id, results, mode, confidence_signal
+        record_search_event,
+        q,
+        user.id,
+        pr.results,
+        pr.mode,
+        pr.confidence_signal,
+        pr.analyzer_confidence if analyze else None,
    )

-    debug_obj: SearchDebug | None = None
-    if debug:
-        debug_obj = SearchDebug(
-            timing_ms=timing,
-            text_candidates=_to_debug_candidates(text_results) if text_results or mode != "vector" else None,
-            vector_candidates=_to_debug_candidates(vector_results) if vector_results or mode in ("vector", "hybrid") else None,
-            fused_candidates=_to_debug_candidates(results) if mode == "hybrid" else None,
-            confidence=confidence_signal,
-            notes=notes,
-        )
+    debug_obj = _build_search_debug(pr) if debug else None

    return SearchResponse(
-        results=results,
-        total=len(results),
+        results=pr.results,
+        total=len(pr.results),
        query=q,
-        mode=mode,
+        mode=pr.mode,
+        debug=debug_obj,
+    )
+
+
+# ═══════════════════════════════════════════════════════════
+# Phase 3.3: /api/search/ask — Evidence + Grounded Synthesis
+# ═══════════════════════════════════════════════════════════
+
+
+class Citation(BaseModel):
+    """answer 본문의 [n] 에 해당하는 근거 단일 행."""
+
+    n: int
+    chunk_id: int | None
+    doc_id: int
+    title: str | None
+    section_title: str | None
+    span_text: str  # evidence LLM 이 추출한 50~300자
+    full_snippet: str  # 원본 800자 (citation 원문 보기 전용)
+    relevance: float
+    rerank_score: float
+
+
+class ConfirmedItem(BaseModel):
+    """Partial answer 의 개별 aspect 답변."""
+
+    aspect: str
+    text: str
+    citations: list[int]
+
+
+class AskDebug(BaseModel):
+    """`/ask?debug=true` 응답 확장."""
+
+    timing_ms: dict[str, float]
+    search_notes: list[str]
+    query_analysis: dict | None = None
+    confidence_signal: float
+    evidence_candidate_count: int
+    evidence_kept_count: int
+    evidence_skip_reason: str | None
+    synthesis_cache_hit: bool
+    synthesis_prompt_preview: str | None = None
+    synthesis_raw_preview: str | None = None
+    hallucination_flags: list[str] = []
+    # Phase 3.5a: per-layer defense 로깅
+    defense_layers: dict | None = None
+
+
+class AskResponse(BaseModel):
+    """`/ask` 응답. Phase 3.5a: completeness + aspects 추가."""
+
+    results: list[SearchResult]
+    ai_answer: str | None
+    citations: list[Citation]
+    synthesis_status: Literal[
+        "completed", "timeout", "skipped", "no_evidence", "parse_failed", "llm_error"
+    ]
+    synthesis_ms: float
+    confidence: Literal["high", "medium", "low"] | None
+    refused: bool
+    no_results_reason: str | None
+    query: str
+    total: int
+    # Phase 3.5a
+    completeness: Literal["full", "partial", "insufficient"] = "full"
+    covered_aspects: list[str] | None = None
+    missing_aspects: list[str] | None = None
+    confirmed_items: list[ConfirmedItem] | None = None
+    debug: AskDebug | None = None
+
+
+def _map_no_results_reason(
+    pr: PipelineResult,
+    evidence: list[EvidenceItem],
+    ev_skip: str | None,
+    sr: SynthesisResult,
+) -> str | None:
+    """사용자에게 보여줄 한국어 메시지 매핑.
+
+    Failure mode 표 (plan §Failure Modes) 기반.
+    """
+    # LLM 자가 refused → 모델이 준 사유 그대로
+    if sr.refused and sr.refuse_reason:
+        return sr.refuse_reason
+
+    # synthesis 상태 우선
+    if sr.status == "no_evidence":
+        if not pr.results:
+            return "검색 결과가 없습니다."
+        return "관련도 높은 근거를 찾지 못했습니다."
+    if sr.status == "skipped":
+        return "검색 결과가 없습니다."
+    if sr.status == "timeout":
+        return "답변 생성이 지연되어 생략했습니다. 검색 결과를 확인해 주세요."
+    if sr.status == "parse_failed":
+        return "답변 형식 오류로 생략했습니다."
+    if sr.status == "llm_error":
+        return "AI 서버에 일시적 문제가 있습니다."
+
+    # evidence 단계 실패는 fallback 을 탔더라도 notes 용
+    if ev_skip == "all_low_rerank":
+        return "관련도 높은 근거를 찾지 못했습니다."
+    if ev_skip == "empty_retrieval":
+        return "검색 결과가 없습니다."
+
+    return None
+
+
+def _build_citations(
+    evidence: list[EvidenceItem], used_citations: list[int]
+) -> list[Citation]:
+    """answer 본문에 실제로 등장한 n 만 Citation 으로 변환."""
+    by_n = {e.n: e for e in evidence}
+    out: list[Citation] = []
+    for n in used_citations:
+        e = by_n.get(n)
+        if e is None:
+            continue
+        out.append(
+            Citation(
+                n=e.n,
+                chunk_id=e.chunk_id,
+                doc_id=e.doc_id,
+                title=e.title,
+                section_title=e.section_title,
+                span_text=e.span_text,
+                full_snippet=e.full_snippet,
+                relevance=e.relevance,
+                rerank_score=e.rerank_score,
+            )
+        )
+    return out
+
+
+def _build_ask_debug(
+    pr: PipelineResult,
+    evidence: list[EvidenceItem],
+    ev_skip: str | None,
+    sr: SynthesisResult,
+    ev_ms: float,
+    synth_ms: float,
+    total_ms: float,
+) -> AskDebug:
+    timing: dict[str, float] = dict(pr.timing_ms)
+    timing["evidence_ms"] = ev_ms
+    timing["synthesis_ms"] = synth_ms
+    timing["ask_total_ms"] = total_ms
+
+    # candidate count 는 rule filter 통과한 수 (recomputable from results)
+    # 엄밀히는 evidence_service 내부 숫자인데, evidence 길이 ≈ kept, candidate
+    # 는 관측이 어려움 → kept 는 evidence 길이, candidate 는 별도 필드 없음.
+    # 단순화: candidate_count = len(evidence) 를 상한 근사로 둠 (debug 전용).
+    return AskDebug(
+        timing_ms=timing,
+        search_notes=pr.notes,
+        query_analysis=pr.query_analysis,
+        confidence_signal=pr.confidence_signal,
+        evidence_candidate_count=len(evidence),
+        evidence_kept_count=len(evidence),
+        evidence_skip_reason=ev_skip,
+        synthesis_cache_hit=sr.cache_hit,
+        synthesis_prompt_preview=None,  # 현재 synthesis_service 에서 노출 안 함
+        synthesis_raw_preview=sr.raw_preview,
+        hallucination_flags=sr.hallucination_flags,
+    )
+
+
+def _detect_synthesis_failure(sr: SynthesisResult) -> str | None:
+    """Synthesis 가 유효한 답을 못 냈으면 re_gate 라벨, 아니면 None.
+
+    판정 우선순위 (Phase 3.5 fix3):
+      1) sr.refused → LLM self-refuse (status="completed") 또는 mechanical fail 후 refused 전파
+         - status=="completed" + refused=True → "synthesis_self_refuse"
+         - 그 외 → f"synthesis_failed({status})"
+      2) sr.status ∈ {timeout, parse_failed, llm_error} → f"synthesis_failed({status})"
+      3) answer 공백 → f"synthesis_failed({status})"
+      4) 유효 → None
+    """
+    if sr.refused:
+        if sr.status == "completed":
+            return "synthesis_self_refuse"
+        return f"synthesis_failed({sr.status})"
+    if sr.status in ("timeout", "parse_failed", "llm_error"):
+        return f"synthesis_failed({sr.status})"
+    if not (sr.answer or "").strip():
+        return f"synthesis_failed({sr.status})"
+    return None
+
+
+def _resolve_eval_identity(
+    x_source: str | None,
+    x_eval_case_id: str | None,
+    x_eval_token: str | None,
+) -> tuple[str, str | None]:
+    """X-Source/X-Eval-Case-Id 신뢰 검증 (Phase 3.5 fix2).
+
+    규칙:
+      - 기본값: source='document_server', eval_case_id=None
+      - X-Source=eval 또는 X-Eval-Case-Id 가 들어왔다면 eval claim 으로 간주
+      - eval claim 은 X-Eval-Token == settings.eval_runner_token 일 때만 수용
+        (constant-time compare, env 미설정 시 항상 거부)
+      - 거부 시: 헤더 무시 + warning log + source=sanitize(non-eval) / eval_case_id=None
+      - 통과 시: source='eval', eval_case_id=x_eval_case_id
+
+    반환: (source, eval_case_id)
+    """
+    claimed_source = sanitize_source(x_source)
+    is_eval_claim = (claimed_source == "eval") or bool(x_eval_case_id)
+    if not is_eval_claim:
+        # 일반 호출 — eval_case_id 강제 None (source != 'eval' 이면 case_id 의미 없음)
+        return claimed_source, None
+
+    # eval claim — token 검증
+    expected = settings.eval_runner_token
+    presented = x_eval_token or ""
+    token_valid = bool(expected) and hmac.compare_digest(presented, expected)
+    if not token_valid:
+        logger.warning(
+            "eval header rejected: source=%s case_id=%s token_present=%s expected_set=%s",
+            x_source, x_eval_case_id, bool(x_eval_token), bool(expected),
+        )
+        # 일반 호출로 강등 — source='eval' 주장은 무시, case_id 도 무시
+        # claimed_source 가 'eval' 이면 default 'document_server' 로
+        if claimed_source == "eval":
+            return "document_server", None
+        return claimed_source, None
+
+    # token OK — eval 라벨 수용
+    return "eval", x_eval_case_id
+
+
+@router.get("/ask", response_model=AskResponse)
+async def ask(
+    q: str,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    background_tasks: BackgroundTasks,
+    limit: int = Query(10, ge=1, le=20, description="synthesis 입력 상한"),
+    debug: bool = Query(False, description="evidence/synthesis 중간 상태 노출"),
+    x_source: Annotated[str | None, Header(alias="X-Source")] = None,
+    x_eval_case_id: Annotated[str | None, Header(alias="X-Eval-Case-Id")] = None,
+    x_eval_token: Annotated[str | None, Header(alias="X-Eval-Token")] = None,
+):
+    """근거 기반 AI 답변 (Phase 3.5a).
+
+    Phase 3.3 기반 + classifier parallel + refusal gate + grounding re-gate.
+    실패 경로에서도 `results` 는 항상 반환.
+
+    Phase 3.5 calibration trust boundary (fix2):
+      - X-Source / X-Eval-Case-Id 는 X-Eval-Token 이 EVAL_RUNNER_TOKEN 와 일치하는
+        trusted internal eval runner 에서만 수용된다.
+      - 일반 client 의 X-Source=eval 시도는 무시되고 source='document_server' 로 강제.
+      - source != 'eval' 이면 eval_case_id 항상 None.
+    """
+    t_total = time.perf_counter()
+    defense_log: dict = {}  # per-layer flag snapshot
+    source, eval_case_id = _resolve_eval_identity(x_source, x_eval_case_id, x_eval_token)
+
+    # 1. 검색 파이프라인
+    pr = await run_search(
+        session, q, mode="hybrid", limit=limit,
+        fusion=DEFAULT_FUSION, rerank=True, analyze=True,
+    )
+
+    # 1.5. ask_includable=false 문서를 evidence 입력에서 제외
+    # 검색 결과 자체는 유지 (사용자에게 보여줌), evidence만 필터
+    if pr.results:
+        from sqlalchemy import select as sa_select
+        from models.document import Document as DocModel
+        ask_doc_ids = set()
+        excluded_ids = {r.id for r in pr.results}
+        rows = await session.execute(
+            sa_select(DocModel.id, DocModel.ask_includable).where(
+                DocModel.id.in_(excluded_ids)
+            )
+        )
+        for doc_id, includable in rows:
+            if includable is False:
+                ask_doc_ids.add(doc_id)
+        evidence_results = [r for r in pr.results if r.id not in ask_doc_ids]
+    else:
+        evidence_results = pr.results
+
+    # 2. Evidence + Classifier 병렬
+    t_ev = time.perf_counter()
+    evidence_task = asyncio.create_task(extract_evidence(q, evidence_results))
+
+    # classifier input: top 3 chunks meta + rerank scores
+    top_chunks = [
+        {
+            "title": r.title or "",
+            "section": r.section_title or "",
+            "snippet": (r.snippet or "")[:200],
+        }
+        for r in pr.results[:3]
+    ]
+    rerank_scores_top = [
+        r.rerank_score if r.rerank_score is not None else r.score
+        for r in pr.results[:3]
+    ]
+    classifier_task = asyncio.create_task(
+        classify(q, top_chunks, rerank_scores_top)
+    )
+
+    evidence, ev_skip = await evidence_task
+    ev_ms = (time.perf_counter() - t_ev) * 1000
+
+    # classifier await (timeout 보호 — classifier_service 내부에도 있지만 여기서 이중 보호)
+    # 2026-05-17: 6s outer wrapper 가 classifier_service.LLM_TIMEOUT_MS (30s) 를 override → 동시 부하 시
+    # 거의 모든 classifier 호출 timeout → conservative_refuse(no_classifier) 경로. 15s 로 상향 — classifier
+    # 가 실제 작동하도록 (단, ask 전체 응답 시간 상한 영향: ev_ms + max(classifier_wait, evidence_extract) +
+    # synth_ms + verifier 누적).
+    # 2026-05-17 B-3: 15s 도 동시 부하 시 부족 (classifier_service LLM_TIMEOUT_MS 30s 와 misalign).
+    # 30s 로 align → classifier 동작 안정. ask 응답 latency 상한 ↑ 의도.
+    try:
+        classifier_result = await asyncio.wait_for(classifier_task, timeout=30.0)
+    except (asyncio.TimeoutError, Exception):
+        classifier_result = ClassifierResult("timeout", None, [], [], 0.0)
+
+    defense_log["classifier"] = {
+        "status": classifier_result.status,
+        "verdict": classifier_result.verdict,
+        "covered_aspects": classifier_result.covered_aspects,
+        "missing_aspects": classifier_result.missing_aspects,
+        "elapsed_ms": classifier_result.elapsed_ms,
+    }
+
+    # 3. Refusal gate (multi-signal fusion)
+    all_rerank_scores = [
+        e.rerank_score for e in evidence
+    ] if evidence else rerank_scores_top
+    decision = refusal_decide(all_rerank_scores, classifier_result)
+
+    defense_log["score_gate"] = {
+        "max": max(all_rerank_scores) if all_rerank_scores else 0.0,
+        "agg_top3": sum(sorted(all_rerank_scores, reverse=True)[:3]),
+    }
+    defense_log["refusal"] = {
+        "refused": decision.refused,
+        "rule_triggered": decision.rule_triggered,
+    }
+
+    if decision.refused:
+        total_ms = (time.perf_counter() - t_total) * 1000
+        no_reason = "관련 근거를 찾지 못했습니다."
+        if not pr.results:
+            no_reason = "검색 결과가 없습니다."
+        logger.info(
+            "ask REFUSED query=%r rule=%s max_score=%.2f total=%.0f",
+            q[:80], decision.rule_triggered,
+            max(all_rerank_scores) if all_rerank_scores else 0.0, total_ms,
+        )
+        # telemetry — search + ask_events 두 경로 동시
+        background_tasks.add_task(
+            record_search_event, q, user.id, pr.results, "hybrid",
+            pr.confidence_signal, pr.analyzer_confidence,
+        )
+        # input_snapshot (디버깅/재현용)
+        defense_log["input_snapshot"] = {
+            "query": q,
+            "top_chunks_preview": [
+                {"title": c.get("title", ""), "snippet": c.get("snippet", "")[:100]}
+                for c in top_chunks[:3]
+            ],
+            "answer_preview": None,
+        }
+        background_tasks.add_task(
+            record_ask_event,
+            q, user.id, "insufficient", "skipped", None,
+            True, classifier_result.verdict,
+            max(all_rerank_scores) if all_rerank_scores else 0.0,
+            sum(sorted(all_rerank_scores, reverse=True)[:3]),
+            [], len(evidence), 0,
+            defense_log, int(total_ms),
+            # Phase E.1 측정 필드
+            answer_length=0,
+            covered_aspects=classifier_result.covered_aspects or None,
+            missing_aspects=classifier_result.missing_aspects or None,
+            model_name=resolve_primary_model(),
+            prompt_version=ASK_PROMPT_VERSION,
+            # Phase 3.5 calibration
+            source=source,
+            eval_case_id=eval_case_id,
+        )
+        debug_obj = None
+        if debug:
+            debug_obj = AskDebug(
+                timing_ms={**pr.timing_ms, "evidence_ms": ev_ms, "ask_total_ms": total_ms},
+                search_notes=pr.notes,
+                confidence_signal=pr.confidence_signal,
+                evidence_candidate_count=len(evidence),
+                evidence_kept_count=len(evidence),
+                evidence_skip_reason=ev_skip,
+                synthesis_cache_hit=False,
+                hallucination_flags=[],
+                defense_layers=defense_log,
+            )
+        return AskResponse(
+            results=pr.results,
+            ai_answer=None,
+            citations=[],
+            synthesis_status="skipped",
+            synthesis_ms=0.0,
+            confidence=None,
+            refused=True,
+            no_results_reason=no_reason,
+            query=q,
+            total=len(pr.results),
+            completeness="insufficient",
+            covered_aspects=classifier_result.covered_aspects or None,
+            missing_aspects=classifier_result.missing_aspects or None,
+            debug=debug_obj,
+        )
+
+    # 4. Synthesis
+    t_synth = time.perf_counter()
+    sr = await synthesize(q, evidence, debug=debug)
+    synth_ms = (time.perf_counter() - t_synth) * 1000
+
+    # 5. Grounding check + Verifier (조건부 병렬) + re-gate (Phase 3.5b)
+    grounding = grounding_check(q, sr.answer or "", evidence)
+
+    # verifier skip: grounding strong 2+ OR retrieval 자체가 망함
+    grounding_only_strong = [
+        f for f in grounding.strong_flags if not f.startswith("verifier_")
+    ]
+    max_rerank = max(all_rerank_scores, default=0.0)
+    if len(grounding_only_strong) >= 2 or max_rerank < 0.2:
+        verifier_result = VerifierResult("skipped", [], 0.0)
+    else:
+        verifier_task = asyncio.create_task(
+            verify(q, sr.answer or "", evidence)
+        )
+        # 2026-05-17 B-3: 4s outer wait_for 가 verifier_service LLM_TIMEOUT_MS (10s) 를 override
+        # → classifier 와 동일 패턴 (search.py:522 가 6s→15s swap 했던 case). 10s 로 align.
+        try:
+            verifier_result = await asyncio.wait_for(verifier_task, timeout=10.0)
+        except (asyncio.TimeoutError, Exception):
+            verifier_result = VerifierResult("timeout", [], 0.0)
+
+    # Verifier contradictions → grounding flags 머지 (prefix 로 구분, severity 3단계)
+    for c in verifier_result.contradictions:
+        if c.severity == "strong":
+            grounding.strong_flags.append(f"verifier_{c.type}:{c.claim[:30]}")
+        elif c.severity == "medium":
+            grounding.weak_flags.append(f"verifier_{c.type}_medium:{c.claim[:30]}")
+        else:
+            grounding.weak_flags.append(f"verifier_{c.type}:{c.claim[:30]}")
+
+    defense_log["evidence"] = {
+        "skip_reason": ev_skip,
+        "kept_count": len(evidence),
+    }
+    defense_log["grounding"] = {
+        "strong": grounding.strong_flags,
+        "weak": grounding.weak_flags,
+    }
+    defense_log["verifier"] = {
+        "status": verifier_result.status,
+        "contradictions_count": len(verifier_result.contradictions),
+        "strong_count": sum(1 for c in verifier_result.contradictions if c.severity == "strong"),
+        "medium_count": sum(1 for c in verifier_result.contradictions if c.severity == "medium"),
+        "elapsed_ms": verifier_result.elapsed_ms,
+    }
+
+    # ── Re-gate: 7-tier completeness 결정 (Phase 3.5 B2 — Tier 4 신규 삽입, 재번호) ──
+    # 기존 6-tier (3.5b 4차 리뷰) + Tier 4(g_strong + v_strong_numeric + low_conf → refuse).
+    # 호환성: defense_layers["re_gate"] 의 string literal 들은 기존 그대로 유지.
+    # 신규 "refuse(grounding+verifier_numeric)" 만 추가.
+    completeness: Literal["full", "partial", "insufficient"] = "full"
+    covered_aspects = classifier_result.covered_aspects or None
+    missing_aspects = classifier_result.missing_aspects or None
+    confirmed_items: list[ConfirmedItem] | None = None
+
+    # verifier/grounding strong 구분
+    g_strong = [f for f in grounding.strong_flags if not f.startswith("verifier_")]
+    v_strong = [f for f in grounding.strong_flags if f.startswith("verifier_")]
+    v_medium = [f for f in grounding.weak_flags if f.startswith("verifier_") and "_medium:" in f]
+    has_direct_negation = any("direct_negation" in f for f in v_strong)
+    # Phase 3.5 B2: verifier strong flags 중 numeric_conflict 만 카운트.
+    # promote(VERIFIER_NUMERIC_PROMOTE=1) 활성 시 critical numeric_conflict 가 strong 으로 승격되며
+    # 여기 카운트에 잡힘. promote off 면 항상 0 → Tier 4 활성 안 됨 (기존 동작 유지).
+    v_strong_numeric = sum(
+        1 for f in v_strong if f.startswith("verifier_numeric_conflict")
+    )
+
+    # ── Tier 0 (Phase 3.5 fix3): synthesis 자체 실패 처리 ──
+    # LLM self-refuse, 메커니즘 실패(timeout/parse_failed/llm_error), answer 공백.
+    # 빈 답에 대해 grounding/verifier flag 가 0건이라 기존 체인이 "else clean" 으로 빠지며
+    # completeness="full" 초기값이 보존되던 모순을 여기서 일관되게 차단.
+    # 과거 baseline(v1-400char) 에서 20(self-refuse)+4(timeout) = 24/223 (10.8%) 해당.
+    tier0_label = _detect_synthesis_failure(sr)
+    if tier0_label:
+        completeness = "insufficient"
+        sr.answer = None
+        sr.refused = True
+        sr.confidence = None
+        defense_log["re_gate"] = tier0_label
+    elif len(g_strong) >= 2:
+        # Tier 1: grounding strong 2+ → refuse
+        completeness = "insufficient"
+        sr.answer = None
+        sr.refused = True
+        sr.confidence = None
+        defense_log["re_gate"] = "refuse(grounding_2+strong)"
+    elif g_strong and has_direct_negation:
+        # Tier 2: grounding strong + verifier direct_negation → refuse
+        completeness = "insufficient"
+        sr.answer = None
+        sr.refused = True
+        sr.confidence = None
+        defense_log["re_gate"] = "refuse(grounding+direct_negation)"
+    elif g_strong and sr.confidence == "low" and max_rerank < 0.25:
+        # Tier 3: grounding strong 1 + (low confidence AND weak evidence) → refuse
+        completeness = "insufficient"
+        sr.answer = None
+        sr.refused = True
+        sr.confidence = None
+        defense_log["re_gate"] = "refuse(grounding+low_conf+weak_ev)"
+    elif g_strong and v_strong_numeric >= 1 and sr.confidence == "low":
+        # Tier 4 (B2 신규): grounding strong + verifier numeric_conflict strong + low conf → refuse.
+        # verifier strong 단독 refuse 금지 원칙 유지 — g_strong 교차 필수.
+        completeness = "insufficient"
+        sr.answer = None
+        sr.refused = True
+        sr.confidence = None
+        defense_log["re_gate"] = "refuse(grounding+verifier_numeric)"
+    elif g_strong or has_direct_negation:
+        # Tier 5 (기존 4): grounding strong 1 또는 verifier direct_negation 단독 → partial
+        completeness = "partial"
+        sr.confidence = "low"
+        defense_log["re_gate"] = "partial(strong_or_negation)"
+    elif v_medium:
+        # Tier 6 (기존 5): verifier medium 누적 → count 기반 confidence 하향
+        medium_count = len(v_medium)
+        if medium_count >= 3:
+            sr.confidence = "low"
+            defense_log["re_gate"] = f"conf_low(medium_x{medium_count})"
+        elif medium_count == 2 and sr.confidence == "high":
+            sr.confidence = "medium"
+            defense_log["re_gate"] = "conf_cap_medium(medium_x2)"
+        else:
+            defense_log["re_gate"] = f"medium_x{medium_count}(no_action)"
+    elif grounding.weak_flags:
+        # Tier 7 (기존 6): weak → confidence 한 단계 하향
+        if sr.confidence == "high":
+            sr.confidence = "medium"
+        defense_log["re_gate"] = "conf_lower(weak)"
+    else:
+        defense_log["re_gate"] = "clean"
+
+    # Confidence cap from refusal gate (classifier 부재 시 conservative)
+    if decision.confidence_cap and sr.confidence:
+        conf_rank = {"low": 0, "medium": 1, "high": 2}
+        if conf_rank.get(sr.confidence, 0) > conf_rank.get(decision.confidence_cap, 2):
+            sr.confidence = decision.confidence_cap
+
+    # Partial 이면 max confidence = medium
+    if completeness == "partial" and sr.confidence == "high":
+        sr.confidence = "medium"
+
+    sr.hallucination_flags.extend(
+        [f"strong:{f}" for f in grounding.strong_flags]
+        + [f"weak:{f}" for f in grounding.weak_flags]
+    )
+
+    total_ms = (time.perf_counter() - t_total) * 1000
+
+    # 6. 응답 구성
+    citations = _build_citations(evidence, sr.used_citations)
+    no_reason = _map_no_results_reason(pr, evidence, ev_skip, sr)
+    if completeness == "insufficient" and not no_reason:
+        # Tier 0 경로: synthesis self-refuse 는 LLM 이 준 사유가 가장 정확.
+        if sr.refused and sr.refuse_reason:
+            no_reason = sr.refuse_reason
+        else:
+            no_reason = "답변 검증에서 복수 오류 감지"
+
+    logger.info(
+        "ask query=%r results=%d evidence=%d cite=%d synth=%s conf=%s completeness=%s "
+        "refused=%s grounding_strong=%d grounding_weak=%d ev_ms=%.0f synth_ms=%.0f total=%.0f",
+        q[:80], len(pr.results), len(evidence), len(citations),
+        sr.status, sr.confidence or "-", completeness,
+        sr.refused, len(grounding.strong_flags), len(grounding.weak_flags),
+        ev_ms, synth_ms, total_ms,
+    )
+
+    # 7. telemetry — search + ask_events 두 경로 동시
+    background_tasks.add_task(
+        record_search_event, q, user.id, pr.results, "hybrid",
+        pr.confidence_signal, pr.analyzer_confidence,
+    )
+    # input_snapshot (디버깅/재현용)
+    defense_log["input_snapshot"] = {
+        "query": q,
+        "top_chunks_preview": [
+            {"title": (r.title or "")[:50], "snippet": (r.snippet or "")[:100]}
+            for r in pr.results[:3]
+        ],
+        "answer_preview": (sr.answer or "")[:200],
+    }
+    background_tasks.add_task(
+        record_ask_event,
+        q, user.id, completeness, sr.status, sr.confidence,
+        sr.refused, classifier_result.verdict,
+        max(all_rerank_scores) if all_rerank_scores else 0.0,
+        sum(sorted(all_rerank_scores, reverse=True)[:3]),
+        sr.hallucination_flags, len(evidence), len(citations),
+        defense_log, int(total_ms),
+        # Phase E.1 측정 필드
+        answer_length=len(sr.answer or ""),
+        covered_aspects=covered_aspects,
+        missing_aspects=missing_aspects,
+        model_name=resolve_primary_model(),
+        prompt_version=ASK_PROMPT_VERSION,
+        # Phase 3.5 calibration
+        source=source,
+        eval_case_id=eval_case_id,
+    )
+
+    debug_obj = None
+    if debug:
+        timing = dict(pr.timing_ms)
+        timing["evidence_ms"] = ev_ms
+        timing["synthesis_ms"] = synth_ms
+        timing["ask_total_ms"] = total_ms
+        debug_obj = AskDebug(
+            timing_ms=timing,
+            search_notes=pr.notes,
+            query_analysis=pr.query_analysis,
+            confidence_signal=pr.confidence_signal,
+            evidence_candidate_count=len(evidence),
+            evidence_kept_count=len(evidence),
+            evidence_skip_reason=ev_skip,
+            synthesis_cache_hit=sr.cache_hit,
+            synthesis_raw_preview=sr.raw_preview,
+            hallucination_flags=sr.hallucination_flags,
+            defense_layers=defense_log,
+        )
+
+    return AskResponse(
+        results=pr.results,
+        ai_answer=sr.answer,
+        citations=citations,
+        synthesis_status=sr.status,
+        synthesis_ms=sr.elapsed_ms,
+        confidence=sr.confidence,
+        refused=sr.refused,
+        no_results_reason=no_reason,
+        query=q,
+        total=len(pr.results),
+        completeness=completeness,
+        covered_aspects=covered_aspects,
+        missing_aspects=missing_aspects,
+        confirmed_items=confirmed_items,
        debug=debug_obj,
    )
@@ -8,6 +8,7 @@ from pathlib import Path
 from typing import Annotated

 import pyotp
+from datetime import datetime, timezone
 from fastapi import APIRouter, Depends, HTTPException, Request, status
 from fastapi.responses import HTMLResponse
 from fastapi.templating import Jinja2Templates
@@ -137,6 +138,7 @@ async def create_admin(
        username=body.username,
        password_hash=hash_password(body.password),
        is_active=True,
+        password_changed_at=datetime.now(timezone.utc),
    )
    session.add(user)
    await session.commit()
@@ -0,0 +1,728 @@
+"""학습 진행 상태 (progress) API — review-complete + review-queue + stats.
+
+review-complete: 사용자가 오답/모르겠음 문제를 검토했음을 표시. due_at 최초 부여.
+review-queue: 5 탭 (due_today / pending_review / chronic / regressed / mastered) 으로 progress 조회.
+stats (Phase 2-D): 통계 대시보드 — 진척도 / 패턴 분포 / 복습 큐 / 세션 추이 / 일별 풀이량 / 과목별.
+"""
+
+from __future__ import annotations
+
+from datetime import date, datetime, timedelta, timezone
+from typing import Annotated
+
+from fastapi import APIRouter, Depends, HTTPException, Query
+from pydantic import BaseModel
+from sqlalchemy import and_, case, cast, func, or_, select
+from sqlalchemy.ext.asyncio import AsyncSession
+from sqlalchemy.types import Date as SQLDate
+
+from core.auth import get_current_user
+from core.database import get_session
+from models.study_question import StudyQuestion, StudyQuestionAttempt
+from models.study_question_progress import StudyQuestionProgress
+from models.study_quiz_session import StudyQuizSession
+from models.study_topic import StudyTopic
+from models.user import User
+
+router = APIRouter(prefix="/study-topics", tags=["study-progress"])
+
+# 1차 due_at 부여 시 디폴트 1일 뒤
+DEFAULT_FIRST_DUE_DAYS = 1
+
+
+def _verify_topic_owner(topic: StudyTopic | None, user: User) -> None:
+    if topic is None or topic.deleted_at is not None or topic.user_id != user.id:
+        raise HTTPException(status_code=404, detail="주제를 찾을 수 없습니다")
+
+
+@router.post("/{topic_id}/questions/{question_id}/review-complete", status_code=204)
+async def review_complete(
+    topic_id: int,
+    question_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """확인완료 처리 — last_reviewed_at + (wrong/unsure 인 경우) due_at 최초 부여.
+
+    이미 due_at 박힌 문제면 due_at 그대로 유지 (큐 위치 보존).
+    정답 맞춘 문제면 due_at 박지 않음 (큐 폭발 방지).
+    """
+    topic = await session.get(StudyTopic, topic_id)
+    _verify_topic_owner(topic, user)
+
+    q = await session.get(StudyQuestion, question_id)
+    if q is None or q.deleted_at is not None or q.user_id != user.id or q.study_topic_id != topic_id:
+        raise HTTPException(status_code=404, detail="문제를 찾을 수 없습니다")
+
+    progress = (
+        await session.execute(
+            select(StudyQuestionProgress).where(
+                StudyQuestionProgress.user_id == user.id,
+                StudyQuestionProgress.study_topic_id == topic_id,
+                StudyQuestionProgress.study_question_id == question_id,
+            )
+        )
+    ).scalar_one_or_none()
+    if progress is None:
+        # attempt 없는데 review-complete 시도. 진척 상태가 없어 의미 없음.
+        raise HTTPException(status_code=409, detail="아직 시도한 적이 없는 문제입니다")
+
+    now = datetime.now(timezone.utc)
+    progress.last_reviewed_at = now
+
+    # due_at 최초 부여는 wrong/unsure 일 때만. 이미 박혀있으면 유지.
+    if progress.last_outcome in ("wrong", "unsure") and progress.due_at is None:
+        progress.review_stage = 0
+        progress.due_at = now + timedelta(days=DEFAULT_FIRST_DUE_DAYS)
+
+    await session.commit()
+
+
+# ─── review-queue ───
+
+
+class ReviewQueueItem(BaseModel):
+    question_id: int
+    question_text: str
+    subject: str | None
+    scope: str | None
+    exam_round: str | None
+    exam_question_number: int | None
+    last_outcome: str | None
+    last_attempted_at: datetime | None
+    last_reviewed_at: datetime | None
+    due_at: datetime | None
+    review_stage: int | None
+    pattern_state: str | None
+
+
+class ReviewQueueResponse(BaseModel):
+    tab: str
+    total: int
+    items: list[ReviewQueueItem]
+    page: int
+    page_size: int
+    # Phase 2-F: due_today 탭에서만 채움. due_at < today 0시 (UTC) + stage < 4.
+    # UI 가 "정체 N건" 경고 + [정리] 버튼 노출 판단에 사용.
+    overdue_count: int = 0
+
+
+def _truncate(text: str, n: int = 80) -> str:
+    if not text:
+        return ""
+    s = text.strip()
+    return s if len(s) <= n else s[:n].rstrip() + "…"
+
+
+@router.get("/{topic_id}/review-queue", response_model=ReviewQueueResponse)
+async def review_queue(
+    topic_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    tab: str = Query(..., pattern="^(due_today|pending_review|chronic|regressed|mastered)$"),
+    page: int = Query(1, ge=1),
+    page_size: int = Query(50, ge=1, le=200),
+):
+    """5 탭 진행 상태 조회.
+
+    - due_today:       progress.due_at <= now() AND review_stage < 4
+    - pending_review:  last_outcome IN (wrong, unsure)
+                       AND (last_reviewed_at IS NULL OR last_reviewed_at < last_attempted_at)
+    - chronic:         pattern_state = 'chronic_wrong'
+    - regressed:       pattern_state = 'regressed'
+    - mastered:        review_stage >= 4
+    """
+    topic = await session.get(StudyTopic, topic_id)
+    _verify_topic_owner(topic, user)
+
+    base = (
+        select(StudyQuestionProgress, StudyQuestion)
+        .join(StudyQuestion, StudyQuestion.id == StudyQuestionProgress.study_question_id)
+        .where(
+            StudyQuestionProgress.user_id == user.id,
+            StudyQuestionProgress.study_topic_id == topic_id,
+            StudyQuestion.deleted_at.is_(None),
+        )
+    )
+
+    now = datetime.now(timezone.utc)
+    if tab == "due_today":
+        base = base.where(
+            StudyQuestionProgress.due_at.is_not(None),
+            StudyQuestionProgress.due_at <= now,
+            or_(
+                StudyQuestionProgress.review_stage.is_(None),
+                StudyQuestionProgress.review_stage < 4,
+            ),
+        ).order_by(StudyQuestionProgress.due_at.asc())
+    elif tab == "pending_review":
+        base = base.where(
+            StudyQuestionProgress.last_outcome.in_(("wrong", "unsure")),
+            or_(
+                StudyQuestionProgress.last_reviewed_at.is_(None),
+                and_(
+                    StudyQuestionProgress.last_reviewed_at.is_not(None),
+                    StudyQuestionProgress.last_attempted_at.is_not(None),
+                    StudyQuestionProgress.last_reviewed_at
+                    < StudyQuestionProgress.last_attempted_at,
+                ),
+            ),
+        ).order_by(StudyQuestionProgress.last_attempted_at.desc().nulls_last())
+    elif tab == "chronic":
+        base = base.where(
+            StudyQuestionProgress.pattern_state == "chronic_wrong",
+        ).order_by(StudyQuestionProgress.last_attempted_at.desc().nulls_last())
+    elif tab == "regressed":
+        base = base.where(
+            StudyQuestionProgress.pattern_state == "regressed",
+        ).order_by(StudyQuestionProgress.last_attempted_at.desc().nulls_last())
+    elif tab == "mastered":
+        base = base.where(
+            StudyQuestionProgress.review_stage.is_not(None),
+            StudyQuestionProgress.review_stage >= 4,
+        ).order_by(StudyQuestionProgress.last_attempted_at.desc().nulls_last())
+
+    # total
+    total_row = await session.execute(
+        select(func.count()).select_from(base.subquery())
+    )
+    total = int(total_row.scalar() or 0)
+
+    # paged
+    rows = (
+        await session.execute(
+            base.offset((page - 1) * page_size).limit(page_size)
+        )
+    ).all()
+
+    items = [
+        ReviewQueueItem(
+            question_id=q.id,
+            question_text=_truncate(q.question_text, 80),
+            subject=q.subject,
+            scope=q.scope,
+            exam_round=q.exam_round,
+            exam_question_number=q.exam_question_number,
+            last_outcome=p.last_outcome,
+            last_attempted_at=p.last_attempted_at,
+            last_reviewed_at=p.last_reviewed_at,
+            due_at=p.due_at,
+            review_stage=p.review_stage,
+            pattern_state=p.pattern_state,
+        )
+        for (p, q) in rows
+    ]
+
+    # Phase 2-F: due_today 탭일 때 overdue 카운트 (오늘 0시 UTC 이전 due) — UI 경고 노출용
+    overdue_count = 0
+    if tab == "due_today":
+        today_start = now.replace(hour=0, minute=0, second=0, microsecond=0)
+        overdue_row = await session.execute(
+            select(func.count())
+            .select_from(StudyQuestionProgress)
+            .where(
+                StudyQuestionProgress.user_id == user.id,
+                StudyQuestionProgress.study_topic_id == topic_id,
+                StudyQuestionProgress.due_at.is_not(None),
+                StudyQuestionProgress.due_at < today_start,
+                or_(
+                    StudyQuestionProgress.review_stage.is_(None),
+                    StudyQuestionProgress.review_stage < 4,
+                ),
+            )
+        )
+        overdue_count = int(overdue_row.scalar() or 0)
+
+    return ReviewQueueResponse(
+        tab=tab, total=total, items=items, page=page, page_size=page_size,
+        overdue_count=overdue_count,
+    )
+
+
+# ─── redistribute (Phase 2-F due_at 정체 정리) ───
+
+
+class RedistributeRequest(BaseModel):
+    spread_days: int = 7  # 1~14 일 사이. default 7.
+
+
+class RedistributeResponse(BaseModel):
+    redistributed_count: int
+    spread_days: int
+
+
+@router.post(
+    "/{topic_id}/review-queue/redistribute", response_model=RedistributeResponse
+)
+async def redistribute_overdue(
+    topic_id: int,
+    body: RedistributeRequest,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """overdue (due_at < today 0시 UTC + stage < 4) 를 내일~spread_days 일에 round-robin 분산.
+
+    동작:
+      - 오늘 0시 이전에 due 된 항목 모두 fetch (오래된 순)
+      - i % spread_days + 1 일 후 자정 + i*7분 (분산용 분단위) 로 due_at 갱신
+      - review_stage 는 건드리지 않음 (정체 처리는 시간 재배치만)
+    """
+    if not (1 <= body.spread_days <= 14):
+        raise HTTPException(status_code=400, detail="spread_days 는 1~14 사이여야 합니다")
+
+    topic = await session.get(StudyTopic, topic_id)
+    _verify_topic_owner(topic, user)
+
+    now = datetime.now(timezone.utc)
+    today_start = now.replace(hour=0, minute=0, second=0, microsecond=0)
+
+    overdue = (
+        await session.execute(
+            select(StudyQuestionProgress)
+            .where(
+                StudyQuestionProgress.user_id == user.id,
+                StudyQuestionProgress.study_topic_id == topic_id,
+                StudyQuestionProgress.due_at.is_not(None),
+                StudyQuestionProgress.due_at < today_start,
+                or_(
+                    StudyQuestionProgress.review_stage.is_(None),
+                    StudyQuestionProgress.review_stage < 4,
+                ),
+            )
+            .order_by(StudyQuestionProgress.due_at.asc())
+        )
+    ).scalars().all()
+
+    if not overdue:
+        return RedistributeResponse(redistributed_count=0, spread_days=body.spread_days)
+
+    base_day = today_start  # 오늘 0시 기준 — +1일부터 분산
+    for i, p in enumerate(overdue):
+        days_offset = (i % body.spread_days) + 1
+        # 같은 날 안에서도 분산하려고 i*7분 추가 (200건 까지 24시간 안에 겹침 없이 spread)
+        minute_offset = (i * 7) % (24 * 60)
+        p.due_at = base_day + timedelta(days=days_offset, minutes=minute_offset)
+
+    await session.commit()
+    return RedistributeResponse(
+        redistributed_count=len(overdue), spread_days=body.spread_days
+    )
+
+
+# ─── stats (Phase 2-D 통계 대시보드) ───
+
+
+class StatsQuestions(BaseModel):
+    total: int
+    attempted: int
+    unattempted: int
+
+
+class StatsDue(BaseModel):
+    today: int
+    this_week: int
+    later: int
+    mastered: int
+
+
+class StatsSessionTrendItem(BaseModel):
+    id: int
+    finished_at: datetime
+    total: int
+    correct_count: int
+    wrong_count: int
+    unsure_count: int
+    accuracy: int  # 0~100
+    newly_correct_count: int
+    relapsed_count: int
+    recovered_count: int
+
+
+class StatsDailyAttempt(BaseModel):
+    date: date
+    count: int
+
+
+class StatsSubjectBreakdown(BaseModel):
+    subject: str
+    total: int
+    attempted: int
+    last_correct: int
+    accuracy: int  # 0~100
+    pending_review: int
+    chronic: int
+
+
+class StatsAiExplanation(BaseModel):
+    """Phase 4-A 운영 관찰 — AI 풀이 캐시 진척 + 최근 7일 worker 결과."""
+    # study_questions.ai_explanation_status 분포 (이 토픽 전체)
+    status_distribution: dict  # 'none' / 'ready' / 'failed' / 'skipped' / 'stale' / 'pending'
+    # wrong/unsure 중 ready 박힌 비율 (캐시 hit 가능성 추정)
+    target_total: int        # progress.last_outcome IN (wrong, unsure) 의 qid 수
+    target_ready: int        # 그 중 ai_explanation_status='ready' 인 수
+    # 최근 7일 study_question_jobs 의 (status, error_code) 분포
+    recent_jobs: dict  # {'completed': N, 'failed:guard_fail': N, 'failed:parse_fail': N, 'skipped:evidence_missing': N, 'pending': N, ...}
+
+
+class StatsResponse(BaseModel):
+    questions: StatsQuestions
+    pattern_distribution: dict  # state(or "unattempted") → count
+    review_stage_distribution: dict  # "0"/"1"/"2"/"3"/"mastered" → count
+    due: StatsDue
+    session_trend: list[StatsSessionTrendItem]  # 최근 done 세션 newest→oldest
+    daily_attempts_30d: list[StatsDailyAttempt]
+    subject_breakdown: list[StatsSubjectBreakdown]
+    ai_explanation: StatsAiExplanation
+
+
+@router.get("/{topic_id}/stats", response_model=StatsResponse)
+async def topic_stats(
+    topic_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    session_trend_limit: int = Query(20, ge=1, le=100),
+):
+    """통계 대시보드 — progress + quiz_sessions + attempts 한 번에 집계.
+
+    가벼운 쿼리 6~7 묶음. 1인 운영 + 토픽당 progress 수천 행 가정 — 추가 인덱스 없이 OK.
+    """
+    topic = await session.get(StudyTopic, topic_id)
+    _verify_topic_owner(topic, user)
+
+    now = datetime.now(timezone.utc)
+
+    # 1. 문제 진척도 — 토픽의 question 총수 + progress 행 수 (attempted)
+    total_q_row = await session.execute(
+        select(func.count())
+        .select_from(StudyQuestion)
+        .where(
+            StudyQuestion.user_id == user.id,
+            StudyQuestion.study_topic_id == topic_id,
+            StudyQuestion.deleted_at.is_(None),
+        )
+    )
+    total_q = int(total_q_row.scalar() or 0)
+
+    attempted_row = await session.execute(
+        select(func.count())
+        .select_from(StudyQuestionProgress)
+        .where(
+            StudyQuestionProgress.user_id == user.id,
+            StudyQuestionProgress.study_topic_id == topic_id,
+            StudyQuestionProgress.last_outcome.is_not(None),
+        )
+    )
+    attempted = int(attempted_row.scalar() or 0)
+    unattempted = max(0, total_q - attempted)
+
+    # 2. pattern_state 분포 (NULL 은 "unattempted" 로)
+    pattern_rows = (
+        await session.execute(
+            select(
+                func.coalesce(StudyQuestionProgress.pattern_state, "unattempted").label("state"),
+                func.count().label("cnt"),
+            )
+            .where(
+                StudyQuestionProgress.user_id == user.id,
+                StudyQuestionProgress.study_topic_id == topic_id,
+            )
+            .group_by("state")
+        )
+    ).all()
+    pattern_distribution = {r.state: int(r.cnt) for r in pattern_rows}
+    # 모든 키 default 0 채우기 (UI 가 빈 키 처리 안 해도 되게)
+    for k in ("stable", "unstable", "unsure", "regressed", "recovered", "chronic_wrong", "unattempted"):
+        pattern_distribution.setdefault(k, 0)
+    # 한 번도 시도 안 한 (progress 행 자체 없음) 분량을 unattempted 에 합산
+    pattern_distribution["unattempted"] += unattempted
+
+    # 3. review_stage 분포 — 0/1/2/3/mastered (>=4)
+    stage_rows = (
+        await session.execute(
+            select(
+                StudyQuestionProgress.review_stage.label("stage"),
+                func.count().label("cnt"),
+            )
+            .where(
+                StudyQuestionProgress.user_id == user.id,
+                StudyQuestionProgress.study_topic_id == topic_id,
+                StudyQuestionProgress.review_stage.is_not(None),
+            )
+            .group_by(StudyQuestionProgress.review_stage)
+        )
+    ).all()
+    review_stage_distribution = {"0": 0, "1": 0, "2": 0, "3": 0, "mastered": 0}
+    for r in stage_rows:
+        st = int(r.stage)
+        if st >= 4:
+            review_stage_distribution["mastered"] += int(r.cnt)
+        elif 0 <= st <= 3:
+            review_stage_distribution[str(st)] += int(r.cnt)
+
+    # 4. due 분류 — today / this_week / later / mastered
+    end_today = now.replace(hour=23, minute=59, second=59, microsecond=999999)
+    end_week = end_today + timedelta(days=7)
+    due_rows = (
+        await session.execute(
+            select(
+                func.count().filter(
+                    and_(
+                        StudyQuestionProgress.due_at.is_not(None),
+                        StudyQuestionProgress.due_at <= end_today,
+                        or_(
+                            StudyQuestionProgress.review_stage.is_(None),
+                            StudyQuestionProgress.review_stage < 4,
+                        ),
+                    )
+                ).label("today"),
+                func.count().filter(
+                    and_(
+                        StudyQuestionProgress.due_at.is_not(None),
+                        StudyQuestionProgress.due_at > end_today,
+                        StudyQuestionProgress.due_at <= end_week,
+                        or_(
+                            StudyQuestionProgress.review_stage.is_(None),
+                            StudyQuestionProgress.review_stage < 4,
+                        ),
+                    )
+                ).label("this_week"),
+                func.count().filter(
+                    and_(
+                        StudyQuestionProgress.due_at.is_not(None),
+                        StudyQuestionProgress.due_at > end_week,
+                        or_(
+                            StudyQuestionProgress.review_stage.is_(None),
+                            StudyQuestionProgress.review_stage < 4,
+                        ),
+                    )
+                ).label("later"),
+                func.count().filter(
+                    and_(
+                        StudyQuestionProgress.review_stage.is_not(None),
+                        StudyQuestionProgress.review_stage >= 4,
+                    )
+                ).label("mastered"),
+            )
+            .where(
+                StudyQuestionProgress.user_id == user.id,
+                StudyQuestionProgress.study_topic_id == topic_id,
+            )
+        )
+    ).first()
+    due = StatsDue(
+        today=int(due_rows.today or 0),
+        this_week=int(due_rows.this_week or 0),
+        later=int(due_rows.later or 0),
+        mastered=int(due_rows.mastered or 0),
+    )
+
+    # 5. 최근 done 세션 추이 (Phase 2-B 4 컬럼 활용)
+    sess_rows = (
+        await session.execute(
+            select(StudyQuizSession)
+            .where(
+                StudyQuizSession.user_id == user.id,
+                StudyQuizSession.study_topic_id == topic_id,
+                StudyQuizSession.status == "done",
+                StudyQuizSession.finished_at.is_not(None),
+            )
+            .order_by(StudyQuizSession.finished_at.desc())
+            .limit(session_trend_limit)
+        )
+    ).scalars().all()
+    session_trend: list[StatsSessionTrendItem] = []
+    for s in sess_rows:
+        total_n = len(s.question_ids or [])
+        acc = round((s.correct_count / total_n) * 100) if total_n > 0 else 0
+        session_trend.append(StatsSessionTrendItem(
+            id=s.id,
+            finished_at=s.finished_at,
+            total=total_n,
+            correct_count=s.correct_count,
+            wrong_count=s.wrong_count,
+            unsure_count=s.unsure_count,
+            accuracy=acc,
+            newly_correct_count=s.newly_correct_count,
+            relapsed_count=s.relapsed_count,
+            recovered_count=s.recovered_count,
+        ))
+
+    # 6. 일별 풀이량 30일 (date 기준 — UTC, 시간대 차이는 Phase 5 후보)
+    start_30d = (now - timedelta(days=29)).replace(hour=0, minute=0, second=0, microsecond=0)
+    daily_rows = (
+        await session.execute(
+            select(
+                cast(StudyQuestionAttempt.answered_at, SQLDate).label("d"),
+                func.count().label("cnt"),
+            )
+            .where(
+                StudyQuestionAttempt.user_id == user.id,
+                StudyQuestionAttempt.study_topic_id == topic_id,
+                StudyQuestionAttempt.answered_at >= start_30d,
+            )
+            .group_by("d")
+            .order_by("d")
+        )
+    ).all()
+    daily_attempts_30d = [StatsDailyAttempt(date=r.d, count=int(r.cnt)) for r in daily_rows]
+
+    # 7. 과목별 약점
+    subj_rows = (
+        await session.execute(
+            select(
+                func.coalesce(StudyQuestion.subject, "(미분류)").label("subject"),
+                func.count(StudyQuestion.id.distinct()).label("total"),
+                func.count(StudyQuestionProgress.id.distinct()).filter(
+                    StudyQuestionProgress.last_outcome.is_not(None)
+                ).label("attempted"),
+                func.count(StudyQuestionProgress.id.distinct()).filter(
+                    StudyQuestionProgress.last_outcome == "correct"
+                ).label("last_correct"),
+                func.count(StudyQuestionProgress.id.distinct()).filter(
+                    and_(
+                        StudyQuestionProgress.last_outcome.in_(("wrong", "unsure")),
+                        or_(
+                            StudyQuestionProgress.last_reviewed_at.is_(None),
+                            and_(
+                                StudyQuestionProgress.last_reviewed_at.is_not(None),
+                                StudyQuestionProgress.last_attempted_at.is_not(None),
+                                StudyQuestionProgress.last_reviewed_at
+                                < StudyQuestionProgress.last_attempted_at,
+                            ),
+                        ),
+                    )
+                ).label("pending_review"),
+                func.count(StudyQuestionProgress.id.distinct()).filter(
+                    StudyQuestionProgress.pattern_state == "chronic_wrong"
+                ).label("chronic"),
+            )
+            .select_from(StudyQuestion)
+            .outerjoin(
+                StudyQuestionProgress,
+                and_(
+                    StudyQuestionProgress.user_id == StudyQuestion.user_id,
+                    StudyQuestionProgress.study_topic_id == StudyQuestion.study_topic_id,
+                    StudyQuestionProgress.study_question_id == StudyQuestion.id,
+                ),
+            )
+            .where(
+                StudyQuestion.user_id == user.id,
+                StudyQuestion.study_topic_id == topic_id,
+                StudyQuestion.deleted_at.is_(None),
+            )
+            .group_by("subject")
+            .order_by(func.count(StudyQuestion.id.distinct()).desc())
+        )
+    ).all()
+    subject_breakdown = [
+        StatsSubjectBreakdown(
+            subject=r.subject,
+            total=int(r.total),
+            attempted=int(r.attempted),
+            last_correct=int(r.last_correct),
+            accuracy=round((int(r.last_correct) / int(r.attempted)) * 100) if int(r.attempted) > 0 else 0,
+            pending_review=int(r.pending_review),
+            chronic=int(r.chronic),
+        )
+        for r in subj_rows
+    ]
+
+    # 8. Phase 4-A: AI 풀이 캐시 진척 + 최근 7일 worker 결과
+    # 8a. study_questions.ai_explanation_status 분포 (토픽 전체)
+    ai_status_rows = (
+        await session.execute(
+            select(
+                func.coalesce(StudyQuestion.ai_explanation_status, "none").label("st"),
+                func.count().label("cnt"),
+            )
+            .where(
+                StudyQuestion.user_id == user.id,
+                StudyQuestion.study_topic_id == topic_id,
+                StudyQuestion.deleted_at.is_(None),
+            )
+            .group_by("st")
+        )
+    ).all()
+    ai_status_distribution = {r.st: int(r.cnt) for r in ai_status_rows}
+    for k in ("none", "ready", "failed", "skipped", "stale", "pending"):
+        ai_status_distribution.setdefault(k, 0)
+
+    # 8b. wrong/unsure 의 ready 비율 (캐시 hit 가능성)
+    target_total_row = await session.execute(
+        select(func.count())
+        .select_from(StudyQuestionProgress)
+        .where(
+            StudyQuestionProgress.user_id == user.id,
+            StudyQuestionProgress.study_topic_id == topic_id,
+            StudyQuestionProgress.last_outcome.in_(("wrong", "unsure")),
+        )
+    )
+    target_total = int(target_total_row.scalar() or 0)
+
+    target_ready_row = await session.execute(
+        select(func.count())
+        .select_from(StudyQuestionProgress)
+        .join(
+            StudyQuestion,
+            and_(
+                StudyQuestion.id == StudyQuestionProgress.study_question_id,
+                StudyQuestion.deleted_at.is_(None),
+            ),
+        )
+        .where(
+            StudyQuestionProgress.user_id == user.id,
+            StudyQuestionProgress.study_topic_id == topic_id,
+            StudyQuestionProgress.last_outcome.in_(("wrong", "unsure")),
+            StudyQuestion.ai_explanation_status == "ready",
+        )
+    )
+    target_ready = int(target_ready_row.scalar() or 0)
+
+    # 8c. 최근 7일 study_question_jobs 분포 — terminal status × error_code
+    from models.study_question_job import StudyQuestionJob
+
+    recent_cutoff = now - timedelta(days=7)
+    job_rows = (
+        await session.execute(
+            select(
+                StudyQuestionJob.status.label("st"),
+                func.coalesce(StudyQuestionJob.error_code, "").label("err"),
+                func.count().label("cnt"),
+            )
+            .join(
+                StudyQuestion,
+                and_(
+                    StudyQuestion.id == StudyQuestionJob.study_question_id,
+                    StudyQuestion.study_topic_id == topic_id,
+                    StudyQuestion.user_id == user.id,
+                ),
+            )
+            .where(
+                StudyQuestionJob.user_id == user.id,
+                StudyQuestionJob.created_at >= recent_cutoff,
+            )
+            .group_by("st", "err")
+        )
+    ).all()
+    recent_jobs: dict[str, int] = {}
+    for r in job_rows:
+        key = f"{r.st}:{r.err}" if r.err else r.st
+        recent_jobs[key] = int(r.cnt)
+
+    return StatsResponse(
+        questions=StatsQuestions(
+            total=total_q, attempted=attempted, unattempted=unattempted
+        ),
+        pattern_distribution=pattern_distribution,
+        review_stage_distribution=review_stage_distribution,
+        due=due,
+        session_trend=session_trend,
+        daily_attempts_30d=daily_attempts_30d,
+        subject_breakdown=subject_breakdown,
+        ai_explanation=StatsAiExplanation(
+            status_distribution=ai_status_distribution,
+            target_total=target_total,
+            target_ready=target_ready,
+            recent_jobs=recent_jobs,
+        ),
+    )
@@ -0,0 +1,927 @@
+"""학습 세션 API — Phase 1 MVP (자격증 + 어학 일반화)
+
+iPad 손글씨 필사 / 모바일 암기노트 / 모바일 퀴즈 가 같은 study_sessions 데이터를
+공유. 본 모듈은 Phase 1 = iPad 필사 세션 + DB/API 일반화 까지만 다룬다.
+
+핵심:
+  - study_type 'certification' | 'language' 분기. metadata jsonb 가 도메인별 자유 메타.
+  - 단일 *_document_id 컬럼 ❌. 모든 미디어 연결은 study_session_assets 로 통일.
+  - documents 본체는 절대 삭제하지 않음 (assets 연결만 해제).
+  - ownership 검증: study_sessions.user_id == current_user.id (필수).
+    documents 는 single-user 시스템이라 컬럼 부재 — 미래 multi-user 대비
+    `getattr(doc, 'user_id', None)` 로 부드럽게 검증 (값 있으면 비교, 없으면 통과).
+  - 409 중복: UNIQUE(study_session_id, document_id, asset_type, role) 위반.
+
+Phase 2~4 미사용 필드 (review_state / quiz / ocr_text / ai_summary / prompt 등) 는
+스키마에만 존재, 자동 로직 없음. 별도 PR 에서 활성.
+"""
+
+import asyncio
+import logging
+from datetime import datetime, timezone
+from pathlib import Path
+from typing import Annotated, Any
+
+from fastapi import (
+    APIRouter,
+    Depends,
+    Form,
+    HTTPException,
+    Query,
+    Request,
+    UploadFile,
+)
+from pydantic import BaseModel, Field
+from sqlalchemy import and_, delete, func, select
+from sqlalchemy.exc import IntegrityError
+from sqlalchemy.ext.asyncio import AsyncSession
+from sqlalchemy.orm import selectinload
+from starlette.requests import ClientDisconnect
+
+from core.auth import get_current_user
+from core.config import settings
+from core.database import get_session
+from core.utils import file_hash
+from models.document import Document
+from models.queue import enqueue_stage
+from models.study_session import StudySession, StudySessionAsset
+from models.user import User
+
+logger = logging.getLogger(__name__)
+router = APIRouter()
+
+
+# ─── Enum 검증 상수 ───
+
+VALID_STUDY_TYPES: set[str] = {"certification", "language"}
+VALID_MODES: set[str] = {
+    "copy", "trace", "blank-repeat",
+    "dictation", "shadowing",
+    "quiz", "flashcard",  # Phase 2~4 활성, schema 만 수용
+}
+VALID_ASSET_TYPES: set[str] = {
+    "source_scan", "handwriting_png", "audio", "video", "transcript", "reference",
+}
+VALID_ROLES: set[str | None] = {
+    None,
+    "prompt", "answer", "pronunciation", "lecture",
+    "listening_source", "shadowing_source", "reference",
+}
+VALID_REVIEW_STATES: set[str | None] = {
+    None, "new", "learning", "weak", "mastered",
+}
+VALID_ORDERS: set[str] = {"created_at", "next_review_at", "last_quiz_at"}
+
+
+# ─── Helpers ───
+
+
+def _upload_error(status_code: int, error_code: str, message: str) -> HTTPException:
+    """업로드 실패 응답 — documents.py 와 동일한 패턴."""
+    return HTTPException(
+        status_code=status_code,
+        detail={"error_code": error_code, "message": message},
+    )
+
+
+def _verify_session_ownership(
+    sess: StudySession | None, user: User
+) -> StudySession:
+    """세션 ownership 검증. 정보 누설 방지로 mismatch 도 404."""
+    if sess is None or sess.user_id != user.id:
+        raise HTTPException(status_code=404, detail="학습 세션을 찾을 수 없습니다")
+    return sess
+
+
+def _verify_document_ownership(doc: Document | None, user: User) -> Document:
+    """문서 ownership 검증.
+
+    documents.user_id 컬럼은 현재 single-user 시스템이라 부재.
+    미래 multi-user 대비 `getattr` 로 안전하게 비교.
+    """
+    if doc is None or getattr(doc, "deleted_at", None) is not None:
+        raise HTTPException(status_code=404, detail="문서를 찾을 수 없습니다")
+    doc_user_id = getattr(doc, "user_id", None)
+    if doc_user_id is not None and doc_user_id != user.id:
+        raise HTTPException(status_code=404, detail="문서를 찾을 수 없습니다")
+    return doc
+
+
+# ─── Pydantic Schemas ───
+
+
+class StudySessionAssetCreate(BaseModel):
+    document_id: int
+    asset_type: str
+    role: str | None = None
+    sort_order: int = 0
+
+
+class StudySessionAssetResponse(BaseModel):
+    id: int
+    document_id: int
+    asset_type: str
+    role: str | None
+    sort_order: int
+    created_at: datetime
+
+    class Config:
+        from_attributes = True
+
+
+class StudySessionCreate(BaseModel):
+    study_type: str = "certification"
+    certification: str | None = None
+    language_code: str | None = None
+    learning_level: str | None = None
+    subject: str | None = None
+    topic: str | None = None
+    source_text: str | None = None
+    source_page: int | None = None
+    mode: str = "copy"
+    prompt_question: str | None = None
+    expected_answer: str | None = None
+    metadata: dict[str, Any] | None = None
+    target_count: int | None = None
+    canvas_width: int | None = None
+    canvas_height: int | None = None
+    strokes_json: dict[str, Any] | None = None
+    # 학습 워크스페이스 묶음. 미지정 시 미분류.
+    study_topic_id: int | None = None
+
+
+class StudySessionUpdate(BaseModel):
+    """PATCH 부분 업데이트 — 명시 set 된 필드만 반영."""
+
+    certification: str | None = None
+    language_code: str | None = None
+    learning_level: str | None = None
+    subject: str | None = None
+    topic: str | None = None
+    source_text: str | None = None
+    source_page: int | None = None
+    mode: str | None = None
+    prompt_question: str | None = None
+    expected_answer: str | None = None
+    metadata: dict[str, Any] | None = None
+    target_count: int | None = None
+    repetition_count: int | None = None
+    canvas_width: int | None = None
+    canvas_height: int | None = None
+    strokes_json: dict[str, Any] | None = None
+    ocr_text: str | None = None
+    user_corrected_text: str | None = None
+    review_state: str | None = None
+    next_review_at: datetime | None = None
+    # 주제 재할당 (NULL 로 분리도 가능)
+    study_topic_id: int | None = None
+
+
+class StudySessionResponse(BaseModel):
+    id: int
+    user_id: int
+    study_type: str
+    certification: str | None
+    language_code: str | None
+    learning_level: str | None
+    subject: str | None
+    topic: str | None
+    source_text: str | None
+    source_page: int | None
+    mode: str
+    prompt_question: str | None
+    expected_answer: str | None
+    metadata: dict[str, Any] | None = Field(default=None)
+    target_count: int | None
+    repetition_count: int
+    canvas_width: int | None
+    canvas_height: int | None
+    schema_version: int
+    strokes_json: dict[str, Any] | None
+    ocr_text: str | None
+    user_corrected_text: str | None
+    ai_summary: str | None
+    review_state: str | None
+    next_review_at: datetime | None
+    last_quiz_at: datetime | None
+    correct_count: int
+    incorrect_count: int
+    study_topic_id: int | None = None
+    assets: list[StudySessionAssetResponse]
+    created_at: datetime
+    updated_at: datetime
+
+
+class StudySessionListResponse(BaseModel):
+    items: list[StudySessionResponse]
+    total: int
+    limit: int
+    offset: int
+
+
+def _to_session_response(sess: StudySession) -> StudySessionResponse:
+    return StudySessionResponse(
+        id=sess.id,
+        user_id=sess.user_id,
+        study_type=sess.study_type,
+        certification=sess.certification,
+        language_code=sess.language_code,
+        learning_level=sess.learning_level,
+        subject=sess.subject,
+        topic=sess.topic,
+        source_text=sess.source_text,
+        source_page=sess.source_page,
+        mode=sess.mode,
+        prompt_question=sess.prompt_question,
+        expected_answer=sess.expected_answer,
+        metadata=sess.metadata_json,
+        target_count=sess.target_count,
+        repetition_count=sess.repetition_count,
+        canvas_width=sess.canvas_width,
+        canvas_height=sess.canvas_height,
+        schema_version=sess.schema_version,
+        strokes_json=sess.strokes_json,
+        ocr_text=sess.ocr_text,
+        user_corrected_text=sess.user_corrected_text,
+        ai_summary=sess.ai_summary,
+        review_state=sess.review_state,
+        next_review_at=sess.next_review_at,
+        last_quiz_at=sess.last_quiz_at,
+        correct_count=sess.correct_count,
+        incorrect_count=sess.incorrect_count,
+        study_topic_id=sess.study_topic_id,
+        assets=[
+            StudySessionAssetResponse.model_validate(a) for a in (sess.assets or [])
+        ],
+        created_at=sess.created_at,
+        updated_at=sess.updated_at,
+    )
+
+
+def _validate_create_payload(body: StudySessionCreate) -> None:
+    if body.study_type not in VALID_STUDY_TYPES:
+        raise HTTPException(
+            status_code=422,
+            detail=f"study_type 은 {sorted(VALID_STUDY_TYPES)} 중 하나여야 합니다",
+        )
+    if body.mode not in VALID_MODES:
+        raise HTTPException(
+            status_code=422,
+            detail=f"mode 는 {sorted(VALID_MODES)} 중 하나여야 합니다",
+        )
+
+
+# ─── 엔드포인트 ───
+
+
+@router.post("/", response_model=StudySessionResponse, status_code=201)
+async def create_study_session(
+    body: StudySessionCreate,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """새 학습 세션 생성.
+
+    자격증 예: study_type='certification', certification='산업안전기사',
+              subject='산업안전보건법', topic='안전보건관리책임자의 직무', mode='copy'
+    어학 예:   study_type='language', language_code='ja', learning_level='JLPT N3',
+              subject='漢字', topic='安全', source_text='安全',
+              metadata={'reading':'あんぜん','meaning':'안전','unit_type':'kanji'}
+    """
+    _validate_create_payload(body)
+
+    # study_topic_id 가 주어지면 소유 검증 (다른 사용자의 주제로 매핑 차단)
+    if body.study_topic_id is not None:
+        from models.study_topic import StudyTopic as _Topic
+
+        topic = await session.get(_Topic, body.study_topic_id)
+        if topic is None or topic.user_id != user.id or topic.deleted_at is not None:
+            raise HTTPException(status_code=404, detail="학습 주제를 찾을 수 없습니다")
+
+    sess = StudySession(
+        user_id=user.id,
+        study_type=body.study_type,
+        certification=body.certification,
+        language_code=body.language_code,
+        learning_level=body.learning_level,
+        subject=body.subject,
+        topic=body.topic,
+        source_text=body.source_text,
+        source_page=body.source_page,
+        mode=body.mode,
+        prompt_question=body.prompt_question,
+        expected_answer=body.expected_answer,
+        metadata_json=body.metadata,
+        target_count=body.target_count,
+        canvas_width=body.canvas_width,
+        canvas_height=body.canvas_height,
+        strokes_json=body.strokes_json,
+        study_topic_id=body.study_topic_id,
+    )
+    session.add(sess)
+    await session.flush()
+    await session.commit()
+    # 새 세션은 assets 가 비어있지만 async session lazy load 우회를 위해 명시 refresh
+    await session.refresh(sess, attribute_names=["assets"])
+    return _to_session_response(sess)
+
+
+@router.get("/", response_model=StudySessionListResponse)
+async def list_study_sessions(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    study_type: str | None = Query(None),
+    certification: str | None = Query(None),
+    language_code: str | None = Query(None),
+    learning_level: str | None = Query(None),
+    subject: str | None = Query(None),
+    topic: str | None = Query(None),
+    review_state: str | None = Query(None),
+    document_id: int | None = Query(None, description="이 문서가 연결된 세션만"),
+    asset_type: str | None = Query(None, description="이 asset_type 보유 세션만"),
+    mode: str | None = Query(None),
+    due_before: datetime | None = Query(None, description="next_review_at <= due_before"),
+    study_topic_id: int | None = Query(None, description="학습 워크스페이스(주제) id"),
+    order: str = Query("created_at"),
+    limit: int = Query(50, ge=1, le=200),
+    offset: int = Query(0, ge=0),
+):
+    """학습 세션 목록 — Phase 1 부터 모든 filter 수용 (Phase 3/4 활성 대비)."""
+    if study_type is not None and study_type not in VALID_STUDY_TYPES:
+        raise HTTPException(status_code=422, detail="study_type 값이 올바르지 않습니다")
+    if review_state is not None and review_state not in VALID_REVIEW_STATES:
+        raise HTTPException(status_code=422, detail="review_state 값이 올바르지 않습니다")
+    if asset_type is not None and asset_type not in VALID_ASSET_TYPES:
+        raise HTTPException(status_code=422, detail="asset_type 값이 올바르지 않습니다")
+    if mode is not None and mode not in VALID_MODES:
+        raise HTTPException(status_code=422, detail="mode 값이 올바르지 않습니다")
+    if order not in VALID_ORDERS:
+        raise HTTPException(status_code=422, detail="order 값이 올바르지 않습니다")
+
+    base = select(StudySession).where(StudySession.user_id == user.id)
+    if study_type is not None:
+        base = base.where(StudySession.study_type == study_type)
+    if certification is not None:
+        base = base.where(StudySession.certification == certification)
+    if language_code is not None:
+        base = base.where(StudySession.language_code == language_code)
+    if learning_level is not None:
+        base = base.where(StudySession.learning_level == learning_level)
+    if subject is not None:
+        base = base.where(StudySession.subject == subject)
+    if topic is not None:
+        base = base.where(StudySession.topic == topic)
+    if review_state is not None:
+        base = base.where(StudySession.review_state == review_state)
+    if mode is not None:
+        base = base.where(StudySession.mode == mode)
+    if due_before is not None:
+        base = base.where(StudySession.next_review_at <= due_before)
+    if study_topic_id is not None:
+        base = base.where(StudySession.study_topic_id == study_topic_id)
+
+    # assets join filter — EXISTS 서브쿼리
+    if document_id is not None or asset_type is not None:
+        asset_conditions = [StudySessionAsset.study_session_id == StudySession.id]
+        if document_id is not None:
+            asset_conditions.append(StudySessionAsset.document_id == document_id)
+        if asset_type is not None:
+            asset_conditions.append(StudySessionAsset.asset_type == asset_type)
+        base = base.where(
+            select(StudySessionAsset.id)
+            .where(and_(*asset_conditions))
+            .exists()
+        )
+
+    count_query = select(func.count()).select_from(base.subquery())
+    total = (await session.execute(count_query)).scalar() or 0
+
+    if order == "next_review_at":
+        ordered = base.order_by(StudySession.next_review_at.asc().nullslast(), StudySession.id.desc())
+    elif order == "last_quiz_at":
+        ordered = base.order_by(StudySession.last_quiz_at.desc().nullslast(), StudySession.id.desc())
+    else:
+        ordered = base.order_by(StudySession.created_at.desc(), StudySession.id.desc())
+
+    ordered = (
+        ordered.options(selectinload(StudySession.assets))
+        .offset(offset)
+        .limit(limit)
+    )
+    rows = (await session.execute(ordered)).scalars().all()
+
+    return StudySessionListResponse(
+        items=[_to_session_response(s) for s in rows],
+        total=total,
+        limit=limit,
+        offset=offset,
+    )
+
+
+@router.get("/groups")
+async def get_study_groups(
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """도메인별 그룹 카운트 (Phase 3 모바일 카드 메뉴 대비, Phase 1 부터 endpoint 제공).
+
+    응답: {by_type: {certification: {...}, language: {...}}}
+    """
+    # certification 그룹: certification → subject → topic
+    cert_query = (
+        select(
+            StudySession.certification,
+            StudySession.subject,
+            StudySession.topic,
+            func.count().label("session_count"),
+            func.count().filter(StudySession.review_state == "weak").label("weak_count"),
+            func.count()
+            .filter(
+                and_(
+                    StudySession.next_review_at.is_not(None),
+                    StudySession.next_review_at <= datetime.now(timezone.utc),
+                )
+            )
+            .label("due_count"),
+        )
+        .where(
+            StudySession.user_id == user.id,
+            StudySession.study_type == "certification",
+        )
+        .group_by(StudySession.certification, StudySession.subject, StudySession.topic)
+    )
+    cert_rows = (await session.execute(cert_query)).all()
+
+    # language 그룹: language_code → learning_level → subject → topic + assets 보유 여부
+    lang_query = (
+        select(
+            StudySession.language_code,
+            StudySession.learning_level,
+            StudySession.subject,
+            StudySession.topic,
+            func.count().label("session_count"),
+            func.count().filter(StudySession.review_state == "weak").label("weak_count"),
+            func.count()
+            .filter(
+                and_(
+                    StudySession.next_review_at.is_not(None),
+                    StudySession.next_review_at <= datetime.now(timezone.utc),
+                )
+            )
+            .label("due_count"),
+        )
+        .where(
+            StudySession.user_id == user.id,
+            StudySession.study_type == "language",
+        )
+        .group_by(
+            StudySession.language_code,
+            StudySession.learning_level,
+            StudySession.subject,
+            StudySession.topic,
+        )
+    )
+    lang_rows = (await session.execute(lang_query)).all()
+
+    # 어학 그룹의 has_audio / has_video — 별도 카운트 (assets 와 join)
+    media_query = (
+        select(
+            StudySession.language_code,
+            StudySession.learning_level,
+            StudySession.subject,
+            StudySession.topic,
+            StudySessionAsset.asset_type,
+            func.count().label("c"),
+        )
+        .join(StudySessionAsset, StudySessionAsset.study_session_id == StudySession.id)
+        .where(
+            StudySession.user_id == user.id,
+            StudySession.study_type == "language",
+            StudySessionAsset.asset_type.in_(["audio", "video"]),
+        )
+        .group_by(
+            StudySession.language_code,
+            StudySession.learning_level,
+            StudySession.subject,
+            StudySession.topic,
+            StudySessionAsset.asset_type,
+        )
+    )
+    media_rows = (await session.execute(media_query)).all()
+    media_map: dict[tuple, dict[str, int]] = {}
+    for r in media_rows:
+        key = (r.language_code, r.learning_level, r.subject, r.topic)
+        media_map.setdefault(key, {"audio": 0, "video": 0})[r.asset_type] = r.c
+
+    # certification 트리 빌드
+    cert_groups: dict[str | None, dict[str | None, dict[str | None, dict]]] = {}
+    for r in cert_rows:
+        cert_groups.setdefault(r.certification, {}).setdefault(r.subject, {})[r.topic] = {
+            "session_count": r.session_count,
+            "weak_count": r.weak_count,
+            "due_count": r.due_count,
+        }
+
+    cert_out = []
+    for cert_name, subjects in cert_groups.items():
+        subj_list = []
+        sess_total = weak_total = due_total = 0
+        for subj_name, topics in subjects.items():
+            topic_list = []
+            s_count = w_count = d_count = 0
+            for topic_name, stats in topics.items():
+                topic_list.append({
+                    "topic": topic_name,
+                    "session_count": stats["session_count"],
+                    "weak_count": stats["weak_count"],
+                    "due_count": stats["due_count"],
+                })
+                s_count += stats["session_count"]
+                w_count += stats["weak_count"]
+                d_count += stats["due_count"]
+            subj_list.append({
+                "subject": subj_name,
+                "topics": topic_list,
+                "session_count": s_count,
+                "weak_count": w_count,
+                "due_count": d_count,
+            })
+            sess_total += s_count
+            weak_total += w_count
+            due_total += d_count
+        cert_out.append({
+            "certification": cert_name,
+            "subjects": subj_list,
+            "session_count": sess_total,
+            "weak_count": weak_total,
+            "due_count": due_total,
+        })
+
+    # language 트리 빌드
+    lang_groups: dict[str | None, dict[str | None, dict[str | None, dict[str | None, dict]]]] = {}
+    for r in lang_rows:
+        media = media_map.get(
+            (r.language_code, r.learning_level, r.subject, r.topic),
+            {"audio": 0, "video": 0},
+        )
+        (
+            lang_groups
+            .setdefault(r.language_code, {})
+            .setdefault(r.learning_level, {})
+            .setdefault(r.subject, {})[r.topic]
+        ) = {
+            "session_count": r.session_count,
+            "weak_count": r.weak_count,
+            "due_count": r.due_count,
+            "has_audio": media["audio"] > 0,
+            "has_video": media["video"] > 0,
+        }
+
+    lang_out = []
+    for lang_code, levels in lang_groups.items():
+        for level_name, subjects in levels.items():
+            subj_list = []
+            for subj_name, topics in subjects.items():
+                topic_list = []
+                for topic_name, stats in topics.items():
+                    topic_list.append({
+                        "topic": topic_name,
+                        "session_count": stats["session_count"],
+                        "weak_count": stats["weak_count"],
+                        "due_count": stats["due_count"],
+                        "has_audio": stats["has_audio"],
+                        "has_video": stats["has_video"],
+                    })
+                subj_list.append({"subject": subj_name, "topics": topic_list})
+            lang_out.append({
+                "language_code": lang_code,
+                "learning_level": level_name,
+                "subjects": subj_list,
+            })
+
+    return {
+        "by_type": {
+            "certification": {"groups": cert_out},
+            "language": {"groups": lang_out},
+        }
+    }
+
+
+@router.get("/{session_id}", response_model=StudySessionResponse)
+async def get_study_session(
+    session_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    sess = await session.get(
+        StudySession, session_id, options=[selectinload(StudySession.assets)]
+    )
+    sess = _verify_session_ownership(sess, user)
+    return _to_session_response(sess)
+
+
+@router.patch("/{session_id}", response_model=StudySessionResponse)
+async def update_study_session(
+    session_id: int,
+    body: StudySessionUpdate,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    sess = await session.get(
+        StudySession, session_id, options=[selectinload(StudySession.assets)]
+    )
+    sess = _verify_session_ownership(sess, user)
+
+    # 명시 set 된 필드만 적용
+    fields_set = body.model_fields_set
+    if "mode" in fields_set:
+        if body.mode not in VALID_MODES:
+            raise HTTPException(status_code=422, detail="mode 값이 올바르지 않습니다")
+        sess.mode = body.mode
+    if "review_state" in fields_set:
+        if body.review_state not in VALID_REVIEW_STATES:
+            raise HTTPException(status_code=422, detail="review_state 값이 올바르지 않습니다")
+        sess.review_state = body.review_state
+
+    # study_topic_id 변경 시 소유 검증
+    if "study_topic_id" in fields_set and body.study_topic_id is not None:
+        from models.study_topic import StudyTopic as _Topic
+
+        topic = await session.get(_Topic, body.study_topic_id)
+        if topic is None or topic.user_id != user.id or topic.deleted_at is not None:
+            raise HTTPException(status_code=404, detail="학습 주제를 찾을 수 없습니다")
+
+    # 단순 매핑 필드 (검증 불필요)
+    SIMPLE_FIELDS = {
+        "certification", "language_code", "learning_level", "subject", "topic",
+        "source_text", "source_page", "prompt_question", "expected_answer",
+        "target_count", "repetition_count",
+        "canvas_width", "canvas_height", "strokes_json",
+        "ocr_text", "user_corrected_text", "next_review_at",
+        "study_topic_id",
+    }
+    for fname in SIMPLE_FIELDS & fields_set:
+        setattr(sess, fname, getattr(body, fname))
+
+    if "metadata" in fields_set:
+        sess.metadata_json = body.metadata
+
+    sess.updated_at = datetime.now(timezone.utc)
+    await session.commit()
+    await session.refresh(sess, attribute_names=["assets"])
+    return _to_session_response(sess)
+
+
+@router.delete("/{session_id}", status_code=204)
+async def delete_study_session(
+    session_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """학습 세션 삭제. 연관 assets 도 cascade 로 함께 제거 (DB ON DELETE CASCADE).
+    documents 본체는 유지 — assets row 만 사라진다.
+    """
+    sess = await session.get(StudySession, session_id)
+    sess = _verify_session_ownership(sess, user)
+    await session.delete(sess)
+    await session.commit()
+
+
+# ─── Assets 엔드포인트 ───
+
+
+@router.post(
+    "/{session_id}/assets",
+    response_model=StudySessionAssetResponse,
+    status_code=201,
+)
+async def link_study_asset(
+    session_id: int,
+    body: StudySessionAssetCreate,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """기존 documents 의 id 를 study_session 에 asset 으로 연결.
+
+    409: 같은 (session, document, asset_type, role) 조합 이미 존재.
+    """
+    if body.asset_type not in VALID_ASSET_TYPES:
+        raise HTTPException(
+            status_code=422,
+            detail=f"asset_type 은 {sorted(VALID_ASSET_TYPES)} 중 하나여야 합니다",
+        )
+    if body.role not in VALID_ROLES:
+        raise HTTPException(
+            status_code=422,
+            detail=f"role 은 {sorted(r for r in VALID_ROLES if r is not None)} 중 하나 또는 NULL 이어야 합니다",
+        )
+
+    sess = await session.get(StudySession, session_id)
+    sess = _verify_session_ownership(sess, user)
+
+    doc = await session.get(Document, body.document_id)
+    _verify_document_ownership(doc, user)
+
+    # 사전 SELECT 로 중복 검사 + DB UNIQUE 제약 둘 다 — race condition 안전.
+    existing = await session.execute(
+        select(StudySessionAsset).where(
+            StudySessionAsset.study_session_id == session_id,
+            StudySessionAsset.document_id == body.document_id,
+            StudySessionAsset.asset_type == body.asset_type,
+            StudySessionAsset.role.is_(body.role) if body.role is None
+            else StudySessionAsset.role == body.role,
+        )
+    )
+    if existing.scalar_one_or_none() is not None:
+        raise HTTPException(
+            status_code=409,
+            detail={
+                "error_code": "asset_already_linked",
+                "message": "해당 문서가 이미 같은 asset_type/role 로 연결되어 있습니다",
+            },
+        )
+
+    asset = StudySessionAsset(
+        study_session_id=session_id,
+        document_id=body.document_id,
+        asset_type=body.asset_type,
+        role=body.role,
+        sort_order=body.sort_order,
+    )
+    session.add(asset)
+    try:
+        await session.commit()
+    except IntegrityError:
+        await session.rollback()
+        # UNIQUE 위반 — 위 사전 SELECT 와 race 했을 가능성. 동일 메시지로 응답.
+        raise HTTPException(
+            status_code=409,
+            detail={
+                "error_code": "asset_already_linked",
+                "message": "해당 문서가 이미 같은 asset_type/role 로 연결되어 있습니다",
+            },
+        )
+    await session.refresh(asset)
+    return StudySessionAssetResponse.model_validate(asset)
+
+
+@router.delete(
+    "/{session_id}/assets/{asset_id}", status_code=204
+)
+async def unlink_study_asset(
+    session_id: int,
+    asset_id: int,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """asset 연결 해제. documents 본체는 유지."""
+    sess = await session.get(StudySession, session_id)
+    sess = _verify_session_ownership(sess, user)
+
+    asset = await session.get(StudySessionAsset, asset_id)
+    if asset is None or asset.study_session_id != session_id:
+        raise HTTPException(status_code=404, detail="asset 을 찾을 수 없습니다")
+    await session.delete(asset)
+    await session.commit()
+
+
+# ─── Snapshot (PNG 업로드) ───
+
+
+@router.post("/{session_id}/snapshot", response_model=StudySessionAssetResponse, status_code=201)
+async def upload_handwriting_snapshot(
+    session_id: int,
+    request: Request,
+    file: UploadFile,
+    user: Annotated[User, Depends(get_current_user)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+    sort_order: int = Form(0),
+):
+    """캔버스 PNG 업로드 → documents 등록 + handwriting_png asset 연결.
+
+    documents.py upload_document 의 atomic rename + error_code 패턴을 PNG 전용으로 차용.
+    동일 세션에 여러 snapshot 누적 가능 (UNIQUE 제약은 (session, document, type, role) 단위라
+    document_id 가 매번 새로 생기므로 충돌 없음).
+    """
+    sess = await session.get(StudySession, session_id)
+    sess = _verify_session_ownership(sess, user)
+
+    if not file.filename:
+        raise _upload_error(400, "invalid_input", "파일명이 필요합니다")
+    safe_name = Path(file.filename).name
+    if not safe_name or safe_name.startswith("."):
+        raise _upload_error(400, "invalid_input", "유효하지 않은 파일명")
+    ext = Path(safe_name).suffix.lower()
+    if ext != ".png":
+        raise _upload_error(
+            400, "invalid_input", "snapshot 은 PNG 파일만 지원합니다",
+        )
+
+    max_bytes = settings.upload.max_bytes
+    slack_ratio = settings.upload.content_length_slack_ratio
+    chunk_size = settings.upload.stream_chunk_bytes
+
+    # Content-Length 사전 차단
+    cl_header = request.headers.get("content-length")
+    if cl_header:
+        try:
+            cl = int(cl_header)
+            if cl > int(max_bytes * slack_ratio):
+                raise _upload_error(413, "body_too_large", "파일이 너무 큽니다")
+        except ValueError:
+            pass
+
+    # NAS Inbox 경로 결정 + 충돌 회피
+    inbox_dir = Path(settings.nas_mount_path) / "PKM" / "Inbox"
+    inbox_dir.mkdir(parents=True, exist_ok=True)
+    target = (inbox_dir / safe_name).resolve()
+    if not str(target).startswith(str(inbox_dir.resolve())):
+        raise _upload_error(400, "invalid_input", "잘못된 파일 경로")
+
+    counter = 1
+    stem, suffix = target.stem, target.suffix
+    staging = target.with_name(target.name + ".uploading")
+    while target.exists() or staging.exists():
+        target = inbox_dir.resolve() / f"{stem}_{counter}{suffix}"
+        staging = target.with_name(target.name + ".uploading")
+        counter += 1
+
+    # 스트리밍 저장 + 누적 사이즈 검증
+    written = 0
+    try:
+        with staging.open("wb") as f:
+            while chunk := await file.read(chunk_size):
+                written += len(chunk)
+                if written > max_bytes:
+                    raise _upload_error(413, "body_too_large", "파일이 너무 큽니다")
+                f.write(chunk)
+        if written == 0:
+            raise _upload_error(400, "empty_file", "빈 파일은 업로드할 수 없습니다")
+    except ClientDisconnect:
+        staging.unlink(missing_ok=True)
+        logger.info("snapshot aborted by client: %s (written=%d)", safe_name, written)
+        raise _upload_error(499, "network_abort", "업로드가 취소되었습니다")
+    except asyncio.TimeoutError:
+        staging.unlink(missing_ok=True)
+        logger.warning("snapshot timeout: %s (written=%d)", safe_name, written)
+        raise _upload_error(408, "upload_timeout", "업로드 시간 초과")
+    except HTTPException:
+        staging.unlink(missing_ok=True)
+        raise
+    except Exception:
+        staging.unlink(missing_ok=True)
+        logger.exception("snapshot internal error: %s (written=%d)", safe_name, written)
+        raise _upload_error(500, "internal", "업로드 처리 중 오류가 발생했습니다")
+
+    # atomic rename → 최종 경로
+    try:
+        staging.replace(target)
+    except OSError:
+        staging.unlink(missing_ok=True)
+        logger.exception("snapshot rename failed: %s -> %s", staging, target)
+        raise _upload_error(500, "internal", "파일 저장 후 정리 중 오류가 발생했습니다")
+
+    # Document + ProcessingQueue('extract') + StudySessionAsset 단일 트랜잭션
+    rel_path = str(target.relative_to(Path(settings.nas_mount_path)))
+    fhash = file_hash(target)
+
+    # 학습 세션 메타에서 user_tags 합성
+    domain_tag = sess.certification or sess.language_code or "general"
+    user_tags = ["handwriting", domain_tag]
+    if sess.subject:
+        user_tags.append(sess.subject)
+
+    title = f"필기 — {sess.topic or sess.subject or 'study session'} #{session_id}"
+
+    try:
+        doc = Document(
+            file_path=rel_path,
+            file_hash=fhash,
+            file_format="png",
+            file_size=written,
+            file_type="immutable",
+            title=title,
+            user_tags=user_tags,
+        )
+        session.add(doc)
+        await session.flush()
+
+        await enqueue_stage(session, doc.id, "extract")
+
+        asset = StudySessionAsset(
+            study_session_id=session_id,
+            document_id=doc.id,
+            asset_type="handwriting_png",
+            role="answer",
+            sort_order=sort_order,
+        )
+        session.add(asset)
+
+        await session.commit()
+        await session.refresh(asset)
+    except Exception:
+        # DB 트랜잭션은 자동 rollback. 파일은 별도 자원 → 명시 unlink.
+        target.unlink(missing_ok=True)
+        raise
+
+    return StudySessionAssetResponse.model_validate(asset)
@@ -0,0 +1,56 @@
+"""비디오 썸네일 서빙 API — /api/video
+
+ffmpeg 썸네일 생성은 thumbnail_worker 에서 수행. 본 라우터는 저장된 파일만 서빙.
+"""
+
+from pathlib import Path
+from typing import Annotated
+
+from fastapi import APIRouter, Depends, HTTPException, Query
+from fastapi.responses import FileResponse
+from sqlalchemy.ext.asyncio import AsyncSession
+
+from core.auth import decode_token, get_current_user
+from core.database import get_session
+from models.document import Document
+from models.user import User
+
+router = APIRouter()
+
+
+@router.get("/{doc_id}/thumbnail")
+async def get_video_thumbnail(
+    doc_id: int,
+    session: Annotated[AsyncSession, Depends(get_session)],
+    token: str | None = Query(None, description="Bearer token (img src 용)"),
+    user: User | None = Depends(lambda: None),
+):
+    """비디오 썸네일 jpg 서빙. `<img src="...?token=...">` 바인딩 가능.
+
+    쿼리 토큰 또는 Authorization 헤더 중 하나로 인증. /file 엔드포인트와 동일 정책.
+    """
+    # 쿼리 토큰 검증 (img src 용) — /file 과 동일 패턴
+    if not token:
+        raise HTTPException(status_code=401, detail="토큰이 필요합니다")
+
+    payload = decode_token(token)
+    if not payload or payload.get("type") != "access":
+        raise HTTPException(status_code=401, detail="유효하지 않은 토큰")
+
+    doc = await session.get(Document, doc_id)
+    if not doc or doc.deleted_at is not None:
+        raise HTTPException(status_code=404, detail="문서를 찾을 수 없습니다")
+
+    thumb = getattr(doc, "thumbnail_path", None)
+    if not thumb:
+        raise HTTPException(status_code=404, detail="썸네일이 아직 생성되지 않았습니다")
+
+    path = Path(thumb)
+    if not path.exists():
+        raise HTTPException(status_code=404, detail="썸네일 파일이 없습니다")
+
+    return FileResponse(
+        path=str(path),
+        media_type="image/jpeg",
+        headers={"Content-Disposition": "inline"},
+    )
@@ -1,5 +1,6 @@
 """JWT + TOTP 2FA 인증"""

+import os
 from datetime import datetime, timedelta, timezone
 from typing import Annotated

@@ -30,15 +31,30 @@ def hash_password(password: str) -> str:
    return bcrypt.hashpw(password.encode(), bcrypt.gensalt()).decode()


-def create_access_token(subject: str) -> str:
-    expire = datetime.now(timezone.utc) + timedelta(minutes=ACCESS_TOKEN_EXPIRE_MINUTES)
-    payload = {"sub": subject, "exp": expire, "type": "access"}
+def create_access_token(subject: str, expires_minutes: int | None = None) -> str:
+    minutes = expires_minutes if expires_minutes is not None else ACCESS_TOKEN_EXPIRE_MINUTES
+    now = datetime.now(timezone.utc)
+    expire = now + timedelta(minutes=minutes)
+    payload = {"sub": subject, "exp": expire, "iat": int(now.timestamp()), "type": "access"}
    return jwt.encode(payload, settings.jwt_secret, algorithm=ALGORITHM)


+def create_voice_memo_bot_token(username: str) -> str | None:
+    # Voice Memo PoC v1 — bot 계정 한정 long-expiry access token (env gate + username hard-match).
+    # 일반 사용자 호출 시 None 반환. 정식 service-account/api_keys 는 Phase 2.
+    if os.getenv("VOICE_MEMO_BOT_TOKEN_ENABLED", "false").lower() != "true":
+        return None
+    bot_username = os.getenv("VOICE_MEMO_BOT_USERNAME", "voice-memo-bot")
+    if username != bot_username:
+        return None
+    expire_days = int(os.getenv("VOICE_MEMO_BOT_TOKEN_EXPIRE_DAYS", "365"))
+    return create_access_token(username, expires_minutes=expire_days * 24 * 60)
+
+
 def create_refresh_token(subject: str) -> str:
-    expire = datetime.now(timezone.utc) + timedelta(days=REFRESH_TOKEN_EXPIRE_DAYS)
-    payload = {"sub": subject, "exp": expire, "type": "refresh"}
+    now = datetime.now(timezone.utc)
+    expire = now + timedelta(days=REFRESH_TOKEN_EXPIRE_DAYS)
+    payload = {"sub": subject, "exp": expire, "iat": int(now.timestamp()), "type": "refresh"}
    return jwt.encode(payload, settings.jwt_secret, algorithm=ALGORITHM)


@@ -49,6 +65,21 @@ def decode_token(token: str) -> dict | None:
        return None


+
+
+def verify_password_changed_at(payload: dict, user) -> None:
+    # legacy 호환: password_changed_at NULL 이면 검증 skip (migration 전 발급 token 유지)
+    # password 변경 후 발급 token 만 검증 — iat (int 초) >= int(password_changed_at.timestamp())
+    if user.password_changed_at is None:
+        return
+    iat = payload.get("iat")
+    pwd_changed_int = int(user.password_changed_at.timestamp())
+    if iat is None or pwd_changed_int > int(iat):
+        raise HTTPException(
+            status_code=status.HTTP_401_UNAUTHORIZED,
+            detail="비밀번호 변경 후 재로그인 필요",
+        )
+
 def verify_totp(code: str, secret: str | None = None) -> bool:
    """TOTP 코드 검증 (유저별 secret 또는 글로벌 설정)"""
    totp_secret = secret or settings.totp_secret
@@ -82,4 +113,19 @@ async def get_current_user(
            status_code=status.HTTP_401_UNAUTHORIZED,
            detail="유저를 찾을 수 없음",
        )
+    verify_password_changed_at(payload, user)
+    return user
+
+
+async def require_admin(
+    credentials: Annotated[HTTPAuthorizationCredentials, Depends(security)],
+    session: Annotated[AsyncSession, Depends(get_session)],
+):
+    """관리자 권한 확인 — 뉴스 소스 CRUD, 수집 트리거, digest 재생성 등"""
+    user = await get_current_user(credentials, session)
+    if not user.is_admin:
+        raise HTTPException(
+            status_code=status.HTTP_403_FORBIDDEN,
+            detail="관리자 권한 필요",
+        )
    return user
@@ -7,6 +7,15 @@ import yaml
 from pydantic import BaseModel


+class UploadConfig(BaseModel):
+    max_bytes: int = 100_000_000
+    content_length_slack_ratio: float = 1.05
+    stream_chunk_bytes: int = 1_048_576
+    # orphan cleanup (`*.uploading` — 크래시/abort 후 잔존물)
+    orphan_max_age_sec: int = 3600
+    cleanup_warn_threshold: int = 10
+
+
 class AIModelConfig(BaseModel):
    endpoint: str
    model: str
@@ -14,16 +23,36 @@ class AIModelConfig(BaseModel):
    timeout: int = 60
    daily_budget_usd: float | None = None
    require_explicit_trigger: bool = False
+    # B-0: 4B/26B 에 부여한 실사용 컨텍스트 상한 (char). triage=120k, primary=260k.
+    # classify_worker 가 에스컬레이션 판정 시 참고. 0/None 이면 상한 무시.
+    context_char_limit: int | None = None
+
+
+class DeepSummaryBacklogConfig(BaseModel):
+    """B-1 R2 — deep_summary enqueue 폭발 억제 임계치."""
+    ratio_threshold: float = 0.3     # 지난 window 의 deep_n/classify_n
+    pending_threshold: int = 5       # deep_summary pending+processing
+    window_minutes: int = 30


 class AIConfig(BaseModel):
    gateway_endpoint: str
+    # B-0: 3-tier routing. triage/primary = Mac mini 26B MLX (PR #20 endpoint 통합). fallback = Claude Sonnet 4 API.
+    triage: AIModelConfig
    primary: AIModelConfig
    fallback: AIModelConfig
    premium: AIModelConfig
    embedding: AIModelConfig
-    vision: AIModelConfig
    rerank: AIModelConfig
+    # Phase 3.5a: answerability classifier (optional — 없으면 score-only gate). PR #20 이후 Mac mini 26B MLX endpoint (initial = exaone3.5).
+    classifier: AIModelConfig | None = None
+    # Phase 3.5b: semantic verifier (optional — 없으면 grounding-only). PR #20 이후 Mac mini 26B MLX endpoint (initial = exaone3.5).
+    verifier: AIModelConfig | None = None
+    # Legacy: vision 슬롯 (현재 사용처 0 — Document Server 는 OCR/STT 별도 서비스).
+    # 제거 진행 중이므로 optional 로 관대한 로딩 유지.
+    vision: AIModelConfig | None = None
+    # B-1 R2: backlog guard 임계치
+    deep_summary_backlog: DeepSummaryBacklogConfig = DeepSummaryBacklogConfig()


 class Settings(BaseModel):
@@ -41,21 +70,62 @@ class Settings(BaseModel):
    jwt_secret: str = ""
    totp_secret: str = ""

+    # Phase 3.5: eval runner shared secret — X-Source=eval / X-Eval-Case-Id 헤더 신뢰 검증.
+    # 비어있으면 모든 eval 헤더 거부 (부재 = 비활성).
+    eval_runner_token: str = ""
+
    # kordoc
    kordoc_endpoint: str = "http://kordoc-service:3100"

+    # OCR (Surya)
+    ocr_endpoint: str = "http://ocr-service:3200"
+
+    # STT (faster-whisper, §3)
+    stt_endpoint: str = "http://stt-service:3300"
+
+    # §3 file_watcher: Roon 음원 경로 (prefix match 로 skip).
+    # 빈 문자열이면 skip 없음. 예: "/documents/PKM/../Music/roon-library" 또는
+    # NFS 경유 별도 마운트된 Roon 라이브러리.
+    roon_library_path: str = ""
+
+    # KGS Code 등 외부 작성 마크다운 자료 추가 스캔 경로 (PKM 상대 경로, 쉼표 구분).
+    # env: ADDITIONAL_WATCH_TARGETS=Knowledge/Industrial_Safety/가스기사/KGS_Code,...
+    # 모두 expected_category="library" 로 처리 (md/pdf/docx 등 문서 확장자만 수락).
+    # Inbox/Recordings/Videos 기본 스캔 외에 추가만 허용.
+    additional_watch_targets: list[str] = []
+
    # 분류 체계
    taxonomy: dict = {}
    document_types: list[str] = []

+    # 업로드 한도 (authoritative policy)
+    upload: UploadConfig = UploadConfig()
+
+    # PR-MacMini-Derived-Worker-1: study explanation owner = Mac mini
+    # GPU 측은 false 로 설정 (.env), explanation 분기 skip guard 트리거.
+    study_explanation_enabled: bool = True
+
+    # internal endpoint Bearer token (Mac mini derived-worker 호출용)
+    internal_worker_token: str = ""
+

 def load_settings() -> Settings:
    """config.yaml + 환경변수에서 설정 로딩"""
    # 환경변수 (docker-compose에서 주입)
    database_url = os.getenv("DATABASE_URL", "")
+    study_explanation_enabled = os.getenv("STUDY_EXPLANATION_ENABLED", "true").lower() in ("1", "true", "yes")
+    internal_worker_token = os.getenv("INTERNAL_WORKER_TOKEN", "")
    jwt_secret = os.getenv("JWT_SECRET", "")
    totp_secret = os.getenv("TOTP_SECRET", "")
+    eval_runner_token = os.getenv("EVAL_RUNNER_TOKEN", "")
    kordoc_endpoint = os.getenv("KORDOC_ENDPOINT", "http://kordoc-service:3100")
+    ocr_endpoint = os.getenv("OCR_ENDPOINT", "http://ocr-service:3200")
+    stt_endpoint = os.getenv("STT_ENDPOINT", "http://stt-service:3300")
+    roon_library_path = os.getenv("ROON_LIBRARY_PATH", "")
+
+    # ADDITIONAL_WATCH_TARGETS — 쉼표 구분 (공백 제거)
+    awt_raw = os.getenv("ADDITIONAL_WATCH_TARGETS", "")
+    additional_watch_targets = [p.strip() for p in awt_raw.split(",") if p.strip()]

    # config.yaml — Docker 컨테이너 내부(/app/config.yaml) 또는 프로젝트 루트
    config_path = Path("/app/config.yaml")
@@ -71,14 +141,30 @@ def load_settings() -> Settings:

        if "ai" in raw:
            ai_raw = raw["ai"]
+            models = ai_raw.get("models", {})
+            # B-0: triage 는 config.yaml 에 없을 수도 있는 신규 슬롯. 구버전 호환을 위해
+            # 없으면 fallback 를 triage 로 대체 (동일 모델 재사용).
+            triage_raw = models.get("triage") or models.get("fallback")
+            if triage_raw is None:
+                raise ValueError("config.yaml: ai.models.triage (or fallback) required")
            ai_config = AIConfig(
                gateway_endpoint=ai_raw.get("gateway", {}).get("endpoint", ""),
-                primary=AIModelConfig(**ai_raw["models"]["primary"]),
-                fallback=AIModelConfig(**ai_raw["models"]["fallback"]),
-                premium=AIModelConfig(**ai_raw["models"]["premium"]),
-                embedding=AIModelConfig(**ai_raw["models"]["embedding"]),
-                vision=AIModelConfig(**ai_raw["models"]["vision"]),
-                rerank=AIModelConfig(**ai_raw["models"]["rerank"]),
+                triage=AIModelConfig(**triage_raw),
+                primary=AIModelConfig(**models["primary"]),
+                fallback=AIModelConfig(**models["fallback"]),
+                premium=AIModelConfig(**models["premium"]),
+                embedding=AIModelConfig(**models["embedding"]),
+                rerank=AIModelConfig(**models["rerank"]),
+                vision=(AIModelConfig(**models["vision"]) if "vision" in models else None),
+                classifier=(
+                    AIModelConfig(**models["classifier"]) if "classifier" in models else None
+                ),
+                verifier=(
+                    AIModelConfig(**models["verifier"]) if "verifier" in models else None
+                ),
+                deep_summary_backlog=DeepSummaryBacklogConfig(
+                    **ai_raw.get("deep_summary_backlog", {})
+                ),
            )

        if "nas" in raw:
@@ -87,6 +173,11 @@ def load_settings() -> Settings:

    taxonomy = raw.get("taxonomy", {}) if config_path.exists() and raw else {}
    document_types = raw.get("document_types", []) if config_path.exists() and raw else []
+    upload_cfg = (
+        UploadConfig(**raw["upload"])
+        if config_path.exists() and raw and "upload" in raw
+        else UploadConfig()
+    )

    return Settings(
        database_url=database_url,
@@ -95,9 +186,17 @@ def load_settings() -> Settings:
        nas_pkm_root=nas_pkm,
        jwt_secret=jwt_secret,
        totp_secret=totp_secret,
+        eval_runner_token=eval_runner_token,
        kordoc_endpoint=kordoc_endpoint,
+        ocr_endpoint=ocr_endpoint,
+        stt_endpoint=stt_endpoint,
+        roon_library_path=roon_library_path,
+        additional_watch_targets=additional_watch_targets,
        taxonomy=taxonomy,
        document_types=document_types,
+        upload=upload_cfg,
+        study_explanation_enabled=study_explanation_enabled,
+        internal_worker_token=internal_worker_token,
    )


@@ -95,7 +95,8 @@ async def _run_migrations(conn) -> None:
    applied = {row[0] for row in result}

    # migration 파일 스캔
-    migrations_dir = Path(__file__).resolve().parent.parent.parent / "migrations"
+    # /app/core/database.py → parent.parent = /app → /app/migrations (volume mount 위치)
+    migrations_dir = Path(__file__).resolve().parent.parent / "migrations"
    if not migrations_dir.is_dir():
        logger.info("[migration] migrations/ 디렉토리 없음, 스킵")
        return
@@ -113,8 +114,15 @@ async def _run_migrations(conn) -> None:
    for version, name, path in pending:
        sql = path.read_text(encoding="utf-8")
        _validate_sql_content(name, sql)
+        if "schema_migrations" in sql.lower():
+            raise ValueError(
+                f"Migration {name} must not modify schema_migrations table"
+            )
        logger.info(f"[migration] {name} 실행 중...")
-        await conn.execute(text(sql))
+        # raw driver SQL 사용 — text() 의 :name bind parameter 해석으로
+        # SQL 주석/literal 에 콜론이 들어가면 InvalidRequestError 발생.
+        # exec_driver_sql 은 SQL 을 driver(asyncpg) 에 그대로 전달.
+        await conn.exec_driver_sql(sql)
        await conn.execute(
            text("INSERT INTO schema_migrations (version, name) VALUES (:v, :n)"),
            {"v": version, "n": name},
@@ -0,0 +1,80 @@
+"""자료실 경로 유틸.
+
+user_tags 내 @library/ 접두사 태그를 정규화·검증·추출한다.
+"""
+
+LIBRARY_PREFIX = "@library/"
+DEFAULT_LIBRARY_PATH = "미분류"
+MAX_DEPTH = 5
+MAX_SEGMENT_LEN = 30
+
+
+def normalize_library_path(raw: str) -> str:
+    """경로 정규화. 엄격 정책 — 규칙 위반 시 ValueError 즉시 raise.
+
+    규칙:
+    - 앞뒤 공백·슬래시 제거
+    - segment별 trim
+    - 빈 segment(// 또는 공백만) → ValueError
+    - segment 30자 초과 → ValueError
+    - 5단계 초과 → ValueError
+
+    GET /documents/library?path= 쿼리에도 동일하게 적용.
+    """
+    stripped = raw.strip().strip("/")
+    if not stripped:
+        raise ValueError("빈 경로")
+
+    segments = stripped.split("/")
+    normalized: list[str] = []
+    for s in segments:
+        s = s.strip()
+        if not s:
+            raise ValueError("빈 세그먼트 (// 또는 공백만 있는 구간)")
+        if len(s) > MAX_SEGMENT_LEN:
+            raise ValueError(f"세그먼트 '{s}'가 {MAX_SEGMENT_LEN}자 초과")
+        normalized.append(s)
+
+    if len(normalized) > MAX_DEPTH:
+        raise ValueError(f"최대 {MAX_DEPTH}단계까지 가능")
+
+    return "/".join(normalized)
+
+
+def extract_library_paths(user_tags: list[str] | None) -> list[str]:
+    """user_tags에서 @library/ 경로만 추출 (prefix 포함)."""
+    if not user_tags:
+        return []
+    return [t for t in user_tags if t.startswith(LIBRARY_PREFIX)]
+
+
+def validate_user_tags(tags: list) -> list[str]:
+    """user_tags 전체 검증. 입력 순서 보존, 중복 제거.
+
+    - 문자열이 아닌 원소 → TypeError
+    - 빈 문자열 / 공백만 있는 태그 → 제거
+    - 일반 태그 → strip() 후 통과
+    - @library/ 태그 → normalize_library_path() 적용
+    - 중복 → 첫 출현만 유지 (입력 순서 보존)
+    """
+    result: list[str] = []
+    for tag in tags:
+        if not isinstance(tag, str):
+            raise TypeError(f"태그는 문자열이어야 합니다: {tag!r}")
+        tag = tag.strip()
+        if not tag:
+            continue
+        if tag.startswith(LIBRARY_PREFIX):
+            path = tag[len(LIBRARY_PREFIX):]
+            normalized = normalize_library_path(path)
+            tag = f"{LIBRARY_PREFIX}{normalized}"
+        result.append(tag)
+
+    # 중복 제거 (입력 순서 보존)
+    seen: set[str] = set()
+    deduped: list[str] = []
+    for t in result:
+        if t not in seen:
+            seen.add(t)
+            deduped.append(t)
+    return deduped
@@ -0,0 +1,62 @@
+"""외부 피드 URL 검증 — SSRF 차단 + redirect target 재검증
+
+등록 시 validate_feed_url()로 1차 검증, fetch 시 redirect target마다
+동일 함수로 재검증. 완전한 TOCTOU 방어는 httpx transport 레벨 후킹이
+필요하므로 이 이중 검증이 현재 현실적 상한선.
+"""
+
+import ipaddress
+import socket
+from urllib.parse import urlparse
+
+ALLOWED_SCHEMES = {"https"}
+
+# HTTP 예외 도메인 — 여기에 없으면 HTTPS만 허용
+# 추가 시 사유/승인일/재검토일을 주석에 기록
+HTTP_EXCEPTION_DOMAINS: set[str] = {
+    "www.scmp.com",  # 2026-04-13 승인, HTTPS→HTTP 301 redirect. 2026-07 재검토
+}
+
+
+def _is_blocked_ip(ip: ipaddress.IPv4Address | ipaddress.IPv6Address) -> bool:
+    """ipaddress 내장 속성으로 넓게 차단 (단순 대역 비교보다 안전)"""
+    return (
+        ip.is_private
+        or ip.is_loopback
+        or ip.is_link_local
+        or ip.is_reserved
+        or ip.is_multicast
+        or ip.is_unspecified
+        # Tailscale CGNAT 대역 (is_private에 포함 안 됨)
+        or ip in ipaddress.ip_network("100.64.0.0/10")
+    )
+
+
+def validate_feed_url(url: str, allow_http: bool = False) -> str:
+    """URL 검증. 실패 시 ValueError raise.
+
+    allow_http는 HTTP_EXCEPTION_DOMAINS allowlist 연동 시에만 사용.
+    API 파라미터로 노출하지 않는다.
+    """
+    parsed = urlparse(url)
+
+    allowed = ALLOWED_SCHEMES | ({"http"} if allow_http else set())
+    if parsed.scheme not in allowed:
+        raise ValueError(f"허용되지 않은 스킴: {parsed.scheme}")
+
+    if not parsed.hostname:
+        raise ValueError("호스트명 누락")
+
+    # DNS 해석 후 IP 차단
+    try:
+        addrs = socket.getaddrinfo(parsed.hostname, None)
+    except socket.gaierror:
+        raise ValueError(f"DNS 해석 실패: {parsed.hostname}")
+
+    for _, _, _, _, sockaddr in addrs:
+        ip = ipaddress.ip_address(sockaddr[0])
+        if _is_blocked_ip(ip):
+            # IP 자체를 에러에 노출하지 않음 — hostname만
+            raise ValueError(f"차단된 네트워크: {parsed.hostname}")
+
+    return url
@@ -6,12 +6,27 @@ from fastapi import FastAPI, Request
 from fastapi.responses import RedirectResponse
 from sqlalchemy import func, select, text

+from api.audio import router as audio_router
+from api.internal_study import router as internal_study_router
 from api.auth import router as auth_router
+from api.briefing import router as briefing_router
+from api.config import router as config_router
 from api.dashboard import router as dashboard_router
+from api.digest import router as digest_router
+from api.document_notes import router as document_notes_router
+from api.document_reads import router as document_reads_router
 from api.documents import router as documents_router
+from api.events import router as events_router
+from api.library import router as library_router
+from api.memos import router as memos_router
 from api.news import router as news_router
 from api.search import router as search_router
 from api.setup import router as setup_router
+from api.study_question_progress import router as study_question_progress_router
+from api.study_questions import router as study_questions_router
+from api.study_sessions import router as study_sessions_router
+from api.study_topics import router as study_topics_router
+from api.video import router as video_router
 from core.config import settings
 from core.database import async_session, engine, init_db
 from models.user import User
@@ -20,14 +35,30 @@ from models.user import User
@asynccontextmanager
 async def lifespan(app: FastAPI):
    """앱 시작/종료 시 실행되는 lifespan 핸들러"""
+    import asyncio
+
    from apscheduler.schedulers.asyncio import AsyncIOScheduler
    from apscheduler.triggers.cron import CronTrigger
+    from zoneinfo import ZoneInfo
+
+    KST = ZoneInfo("Asia/Seoul")
+    from services.search.query_analyzer import prewarm_analyzer
+    from workers.briefing_worker import run as morning_briefing_run
    from workers.daily_digest import run as daily_digest_run
+    from workers.digest_worker import run as global_digest_run
    from workers.file_watcher import watch_inbox
    from workers.law_monitor import run as law_monitor_run
    from workers.mailplus_archive import run as mailplus_run
    from workers.news_collector import run as news_collector_run
    from workers.queue_consumer import consume_queue
+    from workers.study_queue_consumer import consume_study_queue
+    from workers.study_session_queue_consumer import consume_study_session_queue
+    from workers.study_question_embed_worker import (
+        refresh_stale_related as study_q_related_refresh,
+        run as study_q_embed_run,
+    )
+    from workers.tier_backfill import run as tier_backfill_run
+    from workers.upload_cleanup import cleanup_orphan_uploads

    # 시작: DB 연결 확인
    await init_db()
@@ -46,14 +77,41 @@ async def lifespan(app: FastAPI):
    # 상시 실행
    scheduler.add_job(consume_queue, "interval", minutes=1, id="queue_consumer")
    scheduler.add_job(watch_inbox, "interval", minutes=5, id="file_watcher")
+    scheduler.add_job(cleanup_orphan_uploads, "interval", minutes=10, id="upload_cleanup")
+    # PR-4: study_questions 자동 임베딩 (status='none/failed/stale' 행을 batch=10 처리).
+    # 별도 큐 테이블 없이 status 자체가 큐. backfill 도 cron 이 'none' 행을 자연스럽게 처리.
+    scheduler.add_job(study_q_embed_run, "interval", minutes=1, id="study_q_embed")
+    # PR-12-A 후속: related-types 캐시 stale 행 재계산. 임베딩 워커와 분리한 별도 cron.
+    # 새 문제 ready / 같은 토픽 invalidation / 임계값 변경 시 NULL 마킹된 행을 batch=20 처리.
+    scheduler.add_job(study_q_related_refresh, "interval", minutes=1, id="study_q_related_refresh")
+    # Phase 4-A: study_question_jobs 처리 — wrong/unsure AI 풀이 prefetch.
+    # MLX gate 직렬화 + BATCH_SIZE=1 로 GPU 부하 통제. STALE_MINUTES=10 자체 복구.
+    scheduler.add_job(consume_study_queue, "interval", minutes=1, id="study_queue_consumer")
+    # Phase 4-B v1: study_quiz_session_jobs 처리 — 세션 단위 자유 마크다운 분석.
+    # 4-A 와 같은 MLX gate 공유 — 4-A 처리 중이면 직렬 대기.
+    scheduler.add_job(consume_study_session_queue, "interval", minutes=1, id="study_session_queue_consumer")
+    # PR-B 레거시 tier 백필 — 30분 주기로 호출되지만 KST 00:00~06:00 시간대만 실제 enqueue.
+    # safety > law > manual 우선순위로 25건씩. 6720 레거시 → 야간당 ~150건 → 약 45일 소화.
+    scheduler.add_job(tier_backfill_run, "interval", minutes=30, id="tier_backfill")
    # 일일 스케줄 (KST)
-    scheduler.add_job(law_monitor_run, CronTrigger(hour=7), id="law_monitor")
-    scheduler.add_job(mailplus_run, CronTrigger(hour=7), id="mailplus_morning")
-    scheduler.add_job(mailplus_run, CronTrigger(hour=18), id="mailplus_evening")
-    scheduler.add_job(daily_digest_run, CronTrigger(hour=20), id="daily_digest")
+    scheduler.add_job(law_monitor_run, CronTrigger(hour=7, timezone=KST), id="law_monitor")
+    scheduler.add_job(mailplus_run, CronTrigger(hour=7, timezone=KST), id="mailplus_morning")
+    scheduler.add_job(mailplus_run, CronTrigger(hour=18, timezone=KST), id="mailplus_evening")
+    scheduler.add_job(daily_digest_run, CronTrigger(hour=20, timezone=KST), id="daily_digest")
+    scheduler.add_job(global_digest_run, CronTrigger(hour=4, minute=0, timezone=KST), id="global_digest")
+    scheduler.add_job(morning_briefing_run, CronTrigger(hour=5, minute=10, timezone=KST), id="morning_briefing")
    scheduler.add_job(news_collector_run, "interval", hours=6, id="news_collector")
    scheduler.start()

+    # Phase 2.1 (async 구조): QueryAnalyzer prewarm.
+    # 대표 쿼리 15~20개를 background task로 분석해 cache 적재.
+    # 첫 사용자 요청부터 cache hit rate 70~80% 목표.
+    # 논블로킹 — startup을 막지 않음. MLX 부하 완화 위해 delay_between=0.5.
+    prewarm_task = asyncio.create_task(prewarm_analyzer())
+    prewarm_task.add_done_callback(
+        lambda t: t.exception() and None  # 예외는 query_analyzer 내부에서 로깅
+    )
+
    yield

    # 종료: 스케줄러 → DB 순서로 정리
@@ -70,12 +128,30 @@ app = FastAPI(

 # ─── 라우터 등록 ───
 app.include_router(setup_router, prefix="/api/setup", tags=["setup"])
+app.include_router(config_router, prefix="/api/config", tags=["config"])
 app.include_router(auth_router, prefix="/api/auth", tags=["auth"])
 app.include_router(documents_router, prefix="/api/documents", tags=["documents"])
+# 회독 카운트 — /api/documents/{id}/read* 경로. documents_router 와 prefix 같아 충돌 없음.
+app.include_router(document_reads_router, prefix="/api/documents", tags=["document-reads"])
+app.include_router(document_notes_router, prefix="/api/documents", tags=["document-notes"])
 app.include_router(search_router, prefix="/api/search", tags=["search"])

+app.include_router(memos_router, prefix="/api/memos", tags=["memos"])
+app.include_router(events_router, prefix="/api/events", tags=["events"])
 app.include_router(dashboard_router, prefix="/api/dashboard", tags=["dashboard"])
+app.include_router(library_router, prefix="/api/library", tags=["library"])
 app.include_router(news_router, prefix="/api/news", tags=["news"])
+app.include_router(digest_router, prefix="/api/digest", tags=["digest"])
+app.include_router(briefing_router, prefix="/api/briefing", tags=["briefing"])
+app.include_router(audio_router, prefix="/api/audio", tags=["audio"])
+app.include_router(internal_study_router, prefix="/internal/study", tags=["internal-study"])
+app.include_router(video_router, prefix="/api/video", tags=["video"])
+app.include_router(study_sessions_router, prefix="/api/study-sessions", tags=["study-sessions"])
+app.include_router(study_topics_router, prefix="/api/study-topics", tags=["study-topics"])
+# study_questions: 라우터 안에서 /study-topics/{id}/questions 와 /study-questions/{id} 두 줄기를 모두 정의하므로 prefix=/api 로 등록
+app.include_router(study_questions_router, prefix="/api", tags=["study-questions"])
+# Phase 1: 학습 진행 상태 (review-complete + review-queue). prefix=/api/study-topics 안에 정의됨.
+app.include_router(study_question_progress_router, prefix="/api", tags=["study-progress"])

 # TODO: Phase 5에서 추가
 # app.include_router(tasks.router, prefix="/api/tasks", tags=["tasks"])
@@ -84,7 +160,7 @@ app.include_router(news_router, prefix="/api/news", tags=["news"])

 # ─── 셋업 미들웨어: 유저 0명이면 /setup으로 리다이렉트 ───
 SETUP_BYPASS_PREFIXES = (
-    "/api/setup", "/setup", "/health", "/docs", "/openapi.json", "/redoc",
+    "/api/setup", "/api/config", "/setup", "/health", "/docs", "/openapi.json", "/redoc",
 )


@@ -0,0 +1,63 @@
+"""analyze_events 테이블 ORM — POST /documents/{id}/analyze 호출 관측 (Phase E.2)
+
+목적: 분석 failure mode 분류 (timeout / parse / llm / missing_summary) +
+      source 별 사용 패턴 (document_server / synology_chat / ui_search / ui_detail / eval).
+      단계 3 snapshot DB 설계 입력이 됨.
+"""
+
+from datetime import datetime
+from typing import Any
+
+from sqlalchemy import ARRAY, BigInteger, Boolean, DateTime, Float, ForeignKey, Integer, Text
+from sqlalchemy.dialects.postgresql import JSONB
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class AnalyzeEvent(Base):
+    __tablename__ = "analyze_events"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    doc_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("documents.id", ondelete="CASCADE"), nullable=False
+    )
+    user_id: Mapped[int | None] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="SET NULL")
+    )
+    mode: Mapped[str] = mapped_column(Text, default="quick", nullable=False)  # quick / full / summary_triage / summary_deep / retrieval_select / synthesis
+    text_limit: Mapped[int | None] = mapped_column(Integer)
+    truncated: Mapped[bool] = mapped_column(Boolean, default=False)
+    layers_returned: Mapped[list[Any] | None] = mapped_column(JSONB, default=list)
+    cached: Mapped[bool] = mapped_column(Boolean, default=False)
+    latency_ms: Mapped[int | None] = mapped_column(Integer)
+    model_name: Mapped[str | None] = mapped_column(Text)
+    prompt_version: Mapped[str | None] = mapped_column(Text)
+    # None (success) | "timeout" | "llm" | "parse" | "missing_summary" | "no_text"
+    error_code: Mapped[str | None] = mapped_column(Text)
+    # document_server / synology_chat / ui_search / ui_detail / eval / unknown
+    source: Mapped[str] = mapped_column(Text, default="document_server", nullable=False)
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+
+    # PR-A (migration 153) — routing shadow observability
+    subject_domain: Mapped[str | None] = mapped_column(Text)
+    risk_flags: Mapped[list[str] | None] = mapped_column(ARRAY(Text))
+    high_impact_task: Mapped[bool | None] = mapped_column(Boolean)
+    escalated_to_26b: Mapped[bool | None] = mapped_column(Boolean)
+    escalation_reasons: Mapped[list[str] | None] = mapped_column(ARRAY(Text))
+    confidence: Mapped[float | None] = mapped_column(Float)
+    policy_violation: Mapped[bool | None] = mapped_column(Boolean)
+    policy_violation_ids: Mapped[list[str] | None] = mapped_column(ARRAY(Text))
+    shadow_would_route_to: Mapped[str | None] = mapped_column(Text)
+    policy_version: Mapped[str | None] = mapped_column(Text)
+
+    # PR-B (migration 159) — 실제 호출 tier 와 R2 backlog guard 이벤트
+    tier: Mapped[str | None] = mapped_column(Text)                  # 'triage' | 'primary' | 'fallback'
+    suppressed_reason: Mapped[str | None] = mapped_column(Text)     # 'backlog_guard(ratio=0.42,pending=7)'
+
+    # PR-B B-2 (migration 161) — /ask 3-state answerability 독립 컬럼
+    answerability: Mapped[str | None] = mapped_column(Text)         # 'direct' | 'partial' | 'insufficient'
+    partial_basis: Mapped[bool | None] = mapped_column(Boolean)     # partial 답변이 실제 생성됐는지
+    suggested_query_count: Mapped[int | None] = mapped_column(Integer)
@@ -0,0 +1,48 @@
+"""ask_events 테이블 ORM — /ask 호출 관측 (Phase 3.5a migration 102, Phase 3.5b 배선)
+
+threshold calibration + verifier FP 분석 + defense layer 디버깅 데이터.
+"""
+
+from datetime import datetime
+from typing import Any
+
+from sqlalchemy import BigInteger, Boolean, DateTime, Float, ForeignKey, Integer, String, Text
+from sqlalchemy.dialects.postgresql import JSONB
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class AskEvent(Base):
+    __tablename__ = "ask_events"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    query: Mapped[str] = mapped_column(Text, nullable=False)
+    user_id: Mapped[int | None] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="SET NULL")
+    )
+    completeness: Mapped[str | None] = mapped_column(Text)  # full / partial / insufficient
+    synthesis_status: Mapped[str | None] = mapped_column(Text)
+    confidence: Mapped[str | None] = mapped_column(Text)  # high / medium / low
+    refused: Mapped[bool] = mapped_column(Boolean, default=False, nullable=False)
+    classifier_verdict: Mapped[str | None] = mapped_column(Text)  # sufficient / insufficient
+    max_rerank_score: Mapped[float | None] = mapped_column(Float)
+    aggregate_score: Mapped[float | None] = mapped_column(Float)
+    hallucination_flags: Mapped[list[Any] | None] = mapped_column(JSONB, default=list)
+    evidence_count: Mapped[int | None] = mapped_column(Integer)
+    citation_count: Mapped[int | None] = mapped_column(Integer)
+    defense_layers: Mapped[dict[str, Any] | None] = mapped_column(JSONB)
+    total_ms: Mapped[int | None] = mapped_column(Integer)
+    # Phase E.1: 측정 필드 확장 (answer_length가 E.3 400→600자 비교 핵심)
+    answer_length: Mapped[int | None] = mapped_column(Integer)
+    covered_aspects: Mapped[list[Any] | None] = mapped_column(JSONB)
+    missing_aspects: Mapped[list[Any] | None] = mapped_column(JSONB)
+    model_name: Mapped[str | None] = mapped_column(Text)
+    prompt_version: Mapped[str | None] = mapped_column(Text)
+    # Phase 3.5 calibration: eval/production 분리 + golden join 키
+    # 138~141 단계: nullable. 142 적용 후 source 는 NOT NULL (DB 강제, 앱은 항상 채움).
+    source: Mapped[str | None] = mapped_column(Text)
+    eval_case_id: Mapped[str | None] = mapped_column(Text)
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
@@ -0,0 +1,18 @@
+"""audio_segments 테이블 ORM — STT 전사 결과의 타임스탬프 세그먼트."""
+
+from sqlalchemy import BigInteger, Float, ForeignKey, Text
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class AudioSegment(Base):
+    __tablename__ = "audio_segments"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    document_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("documents.id", ondelete="CASCADE"), nullable=False
+    )
+    start_s: Mapped[float] = mapped_column(Float, nullable=False)
+    end_s: Mapped[float] = mapped_column(Float, nullable=False)
+    text: Mapped[str] = mapped_column(Text, nullable=False)
@@ -0,0 +1,103 @@
+"""morning_briefings + briefing_topics 테이블 ORM (야간 수집 뉴스 브리핑).
+
+axis 반대: Phase 4 = country×topic / Briefing = topic×country.
+country_perspectives JSONB 안에 한 topic 의 여러 국가 관점 array.
+"""
+
+from datetime import date, datetime
+
+from sqlalchemy import (
+    BigInteger,
+    Boolean,
+    Date,
+    DateTime,
+    Float,
+    ForeignKey,
+    Integer,
+    String,
+    Text,
+)
+from sqlalchemy.dialects.postgresql import JSONB
+from sqlalchemy.orm import Mapped, mapped_column, relationship
+
+from core.database import Base
+
+
+class MorningBriefing(Base):
+    """하루 단위 브리핑 메타데이터 (KST 자정~05:00 윈도우)"""
+
+    __tablename__ = "morning_briefings"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    briefing_date: Mapped[date] = mapped_column(Date, nullable=False, unique=True)
+    window_start: Mapped[datetime] = mapped_column(DateTime(timezone=True), nullable=False)
+    window_end: Mapped[datetime] = mapped_column(DateTime(timezone=True), nullable=False)
+    decay_lambda: Mapped[float] = mapped_column(Float, nullable=False)
+
+    total_articles: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    total_countries: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    total_topics: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+
+    generation_ms: Mapped[int | None] = mapped_column(Integer)
+    llm_calls: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    llm_failures: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    status: Mapped[str] = mapped_column(String(20), nullable=False, default="success")
+
+    headline_oneliner: Mapped[str | None] = mapped_column(Text)
+
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), nullable=False, default=datetime.now
+    )
+
+    topics: Mapped[list["BriefingTopic"]] = relationship(
+        back_populates="briefing",
+        cascade="all, delete-orphan",
+        order_by="BriefingTopic.topic_rank",
+    )
+
+
+class BriefingTopic(Base):
+    """1 briefing 안 topic_rank 순 cross-country 비교 분석 결과"""
+
+    __tablename__ = "briefing_topics"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    briefing_id: Mapped[int] = mapped_column(
+        BigInteger,
+        ForeignKey("morning_briefings.id", ondelete="CASCADE"),
+        nullable=False,
+    )
+
+    topic_rank: Mapped[int] = mapped_column(Integer, nullable=False)
+    topic_label: Mapped[str] = mapped_column(String(120), nullable=False)
+    headline: Mapped[str] = mapped_column(Text, nullable=False)
+
+    country_perspectives: Mapped[list] = mapped_column(JSONB, nullable=False, default=list)
+    divergences: Mapped[list] = mapped_column(JSONB, nullable=False, default=list)
+    convergences: Mapped[list] = mapped_column(JSONB, nullable=False, default=list)
+    key_quotes: Mapped[list] = mapped_column(JSONB, nullable=False, default=list)
+
+    historical_article_ids: Mapped[list | None] = mapped_column(JSONB)
+    historical_context: Mapped[str | None] = mapped_column(Text)
+    historical_window_days: Mapped[int | None] = mapped_column(Integer)
+
+    cluster_members: Mapped[list] = mapped_column(JSONB, nullable=False, default=list)
+    article_count: Mapped[int] = mapped_column(Integer, nullable=False)
+    country_count: Mapped[int] = mapped_column(Integer, nullable=False)
+    importance_score: Mapped[float] = mapped_column(Float, nullable=False)
+    raw_weight_sum: Mapped[float] = mapped_column(Float, nullable=False)
+
+    llm_model: Mapped[str | None] = mapped_column(String(100))
+    llm_fallback_used: Mapped[bool] = mapped_column(Boolean, nullable=False, default=False)
+
+    # 2026-05-13 카드별 사용자 액션 (date picker 와 동반).
+    is_read: Mapped[bool] = mapped_column(Boolean, nullable=False, default=False)
+    read_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    highlighted: Mapped[bool] = mapped_column(Boolean, nullable=False, default=False)
+    highlighted_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), nullable=False, default=datetime.now
+    )
+
+    briefing: Mapped["MorningBriefing"] = relationship(back_populates="topics")
@@ -0,0 +1,25 @@
+"""library_categories 테이블 ORM — 자료실 분류 체계 독립 관리"""
+
+from datetime import datetime
+
+from sqlalchemy import BigInteger, Boolean, DateTime, Integer, Text
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class LibraryCategory(Base):
+    __tablename__ = "library_categories"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    path: Mapped[str] = mapped_column(Text, unique=True, nullable=False)
+    name: Mapped[str] = mapped_column(Text, nullable=False)
+    parent_path: Mapped[str | None] = mapped_column(Text, nullable=True)
+    depth: Mapped[int] = mapped_column(Integer, nullable=False, default=1)
+    is_system: Mapped[bool] = mapped_column(Boolean, default=False)
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now
+    )
+    updated_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, onupdate=datetime.now
+    )
@@ -0,0 +1,87 @@
+"""global_digests + digest_topics 테이블 ORM (Phase 4)"""
+
+from datetime import date, datetime
+
+from sqlalchemy import (
+    BigInteger,
+    Boolean,
+    Date,
+    DateTime,
+    Float,
+    ForeignKey,
+    Integer,
+    String,
+    Text,
+)
+from sqlalchemy.dialects.postgresql import JSONB
+from sqlalchemy.orm import Mapped, mapped_column, relationship
+
+from core.database import Base
+
+
+class GlobalDigest(Base):
+    """하루 단위 digest run 메타데이터"""
+
+    __tablename__ = "global_digests"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    digest_date: Mapped[date] = mapped_column(Date, nullable=False, unique=True)
+    window_start: Mapped[datetime] = mapped_column(DateTime(timezone=True), nullable=False)
+    window_end: Mapped[datetime] = mapped_column(DateTime(timezone=True), nullable=False)
+    decay_lambda: Mapped[float] = mapped_column(Float, nullable=False)
+
+    total_articles: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    total_countries: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    total_topics: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+
+    generation_ms: Mapped[int | None] = mapped_column(Integer)
+    llm_calls: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    llm_failures: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    status: Mapped[str] = mapped_column(String(20), nullable=False, default="success")
+
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), nullable=False, default=datetime.now
+    )
+
+    topics: Mapped[list["DigestTopic"]] = relationship(
+        back_populates="digest",
+        cascade="all, delete-orphan",
+        order_by="DigestTopic.country, DigestTopic.topic_rank",
+    )
+
+
+class DigestTopic(Base):
+    """country × topic 단위 cluster 결과"""
+
+    __tablename__ = "digest_topics"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    digest_id: Mapped[int] = mapped_column(
+        BigInteger,
+        ForeignKey("global_digests.id", ondelete="CASCADE"),
+        nullable=False,
+    )
+
+    country: Mapped[str] = mapped_column(String(10), nullable=False)
+    topic_rank: Mapped[int] = mapped_column(Integer, nullable=False)
+
+    topic_label: Mapped[str] = mapped_column(Text, nullable=False)
+    summary: Mapped[str] = mapped_column(Text, nullable=False)
+
+    article_ids: Mapped[list] = mapped_column(JSONB, nullable=False)
+    article_count: Mapped[int] = mapped_column(Integer, nullable=False)
+
+    importance_score: Mapped[float] = mapped_column(Float, nullable=False)
+    raw_weight_sum: Mapped[float] = mapped_column(Float, nullable=False)
+
+    centroid_sample: Mapped[dict | None] = mapped_column(JSONB)
+    llm_model: Mapped[str | None] = mapped_column(String(100))
+    llm_fallback_used: Mapped[bool] = mapped_column(
+        Boolean, nullable=False, default=False
+    )
+
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), nullable=False, default=datetime.now
+    )
+
+    digest: Mapped["GlobalDigest"] = relationship(back_populates="topics")
@@ -3,10 +3,12 @@
 from datetime import datetime

 from pgvector.sqlalchemy import Vector
-from sqlalchemy import BigInteger, Boolean, DateTime, Enum, String, Text
+from sqlalchemy import BigInteger, Boolean, DateTime, Enum, Integer, String, Text
 from sqlalchemy.dialects.postgresql import JSONB
 from sqlalchemy.orm import Mapped, mapped_column

+# Note: file_type='note' (메모) 문서는 file_path=NULL, file_hash=content SHA-256
+
 from core.database import Base


@@ -16,7 +18,7 @@ class Document(Base):
    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)

    # 1계층: 원본 파일
-    file_path: Mapped[str] = mapped_column(Text, unique=True, nullable=False)
+    file_path: Mapped[str | None] = mapped_column(Text, nullable=True)
    file_hash: Mapped[str] = mapped_column(String(64), nullable=False)
    file_format: Mapped[str] = mapped_column(String(20), nullable=False)
    file_size: Mapped[int | None] = mapped_column(BigInteger)
@@ -31,6 +33,9 @@ class Document(Base):
    extracted_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
    extractor_version: Mapped[str | None] = mapped_column(String(50))

+    # 2계층: 추출 메타 (OCR 판정/실행)
+    extract_meta: Mapped[dict | None] = mapped_column(JSONB, default=dict)
+
    # 2계층: AI 가공
    ai_summary: Mapped[str | None] = mapped_column(Text)
    ai_tags: Mapped[dict | None] = mapped_column(JSONB, default=[])
@@ -42,6 +47,15 @@ class Document(Base):
    importance: Mapped[str | None] = mapped_column(String(20), default="medium")
    ai_confidence: Mapped[float | None] = mapped_column()

+    # Memo Intake Upgrade PR-2B — Gemma 4B triage 가 추론한 메모 의도 분류 hint
+    # ('note' | 'task' | 'calendar_event' | 'activity_log' | 'reference')
+    # AI 자동 events 생성 X — 사용자 1-click promote 시점에만 events row 생성 (안전 boundary).
+    ai_event_kind: Mapped[str | None] = mapped_column(
+        Enum("note", "task", "calendar_event", "activity_log", "reference",
+             name="event_kind_hint")
+    )
+    ai_event_confidence: Mapped[float | None] = mapped_column()
+
    # 3계층: 벡터 임베딩
    embedding = mapped_column(Vector(1024), nullable=True)
    embed_model_version: Mapped[str | None] = mapped_column(String(50))
@@ -50,6 +64,22 @@ class Document(Base):
    # 사용자 메모
    user_note: Mapped[str | None] = mapped_column(Text)

+    # 사용자 태그 (ai_tags와 분리, #태그 파싱 결과 또는 수동 입력)
+    user_tags: Mapped[list | None] = mapped_column(JSONB, default=[])
+
+    # 핀 고정
+    pinned: Mapped[bool] = mapped_column(Boolean, default=False)
+
+    # /ask 합성 포함 여부 (false면 검색은 되지만 evidence에서 제외)
+    ask_includable: Mapped[bool] = mapped_column(Boolean, default=True)
+
+    # 아카이브 (현재 메모 UX 전용, 문서 쪽에는 노출하지 않음)
+    archived: Mapped[bool] = mapped_column(Boolean, default=False)
+
+    # 메모 체크박스별 메타 — {"<task_index>": {"checked_at": "<ISO8601 UTC>"}}
+    # UI에서 체크 후 10초 경과 항목 숨김 판정에 사용. file_type='note'에서만 의미 있음.
+    memo_task_state: Mapped[dict] = mapped_column(JSONB, nullable=False, default=dict)
+
    # ODF 변환
    derived_path: Mapped[str | None] = mapped_column(Text)  # 변환본 경로 (.derived/)
    original_format: Mapped[str | None] = mapped_column(String(20))
@@ -73,14 +103,71 @@ class Document(Base):
    # 메타데이터
    source_channel: Mapped[str | None] = mapped_column(
        Enum("law_monitor", "devonagent", "email", "web_clip",
-             "tksafety", "inbox_route", "manual", "drive_sync", "news",
+             "tksafety", "inbox_route", "manual", "drive_sync", "news", "memo",
+             "voice", "hermes",
             name="source_channel")
    )
+    # 외부 채널 (Hermes Discord 등) 의 channel/user/message_id/timestamp 메타.
+    # extract_meta (OCR 전용) 와 분리.
+    source_metadata: Mapped[dict] = mapped_column(JSONB, nullable=False, default=dict)
    data_origin: Mapped[str | None] = mapped_column(
        Enum("work", "external", name="data_origin")
    )
+    # 용도 구분 (우선순위: 수동 수정 > 업로드 명시값 > AI 추론)
+    doc_purpose: Mapped[str | None] = mapped_column(
+        Enum("business", "knowledge", name="document_purpose")
+    )
    title: Mapped[str | None] = mapped_column(Text)

+    # 카테고리 (1차 진입점 — UI 탭/라우트 분기)
+    # 7 활성: document / library / news / memo / audio / video / law
+    # 3 유보: mail / calendar / plex
+    category: Mapped[str | None] = mapped_column(
+        Enum("document", "library", "news", "memo", "audio", "video", "law",
+             "mail", "calendar", "plex",
+             name="doc_category", create_type=False)
+    )
+
+    # AI 가 제안했지만 미승인된 변경 후보 (category / path / doctype)
+    # /accept-suggestion 승인 시에만 category / user_tags 반영 (자동 전이 금지)
+    ai_suggestion: Mapped[dict | None] = mapped_column(JSONB)
+
+    # PR-B B-1: summary_triage (4B, 상시) / summary_deep (26B, 에스컬레이션) 분할 산출
+    ai_tldr: Mapped[str | None] = mapped_column(Text)                          # ≤60자 TL;DR
+    ai_bullets: Mapped[list | None] = mapped_column(JSONB)                     # 3~5개 핵심 bullets
+    ai_detail_summary: Mapped[str | None] = mapped_column(Text)                # 26B 2~3문단
+    ai_inconsistencies: Mapped[list | None] = mapped_column(JSONB)             # [{kind, desc}]
+    # 'triage' | 'deep' | NULL — 현재 문서가 어느 tier 까지 분석 완료됐는지
+    ai_analysis_tier: Mapped[str | None] = mapped_column(String(10))
+
+    # 비디오 썸네일 (§3) — ffmpeg 50% 지점 1장. PKM/Videos/.thumbs/{id}.jpg 절대경로.
+    thumbnail_path: Mapped[str | None] = mapped_column(Text)
+
+    # NAS 드롭된 mov/mkv/avi quarantine 플래그 (§3). true 면 재생 불가 안내만 표시.
+    needs_conversion: Mapped[bool] = mapped_column(Boolean, default=False, server_default="false")
+
+    # facet 탐색 축 (Phase 2)
+    facet_company: Mapped[str | None] = mapped_column(Text)
+    facet_topic: Mapped[str | None] = mapped_column(Text)
+    facet_year: Mapped[int | None] = mapped_column(Integer)
+    facet_doctype: Mapped[str | None] = mapped_column(Text)
+
+    # === Phase 1A canonical Markdown layer columns (migrations 211~219) ===
+    # plan: ~/.claude/plans/plan-idempotent-sundae.md
+    md_content: Mapped[str | None] = mapped_column(Text)
+    md_frontmatter: Mapped[dict] = mapped_column(JSONB, nullable=False, default=dict)
+    md_format_version: Mapped[str] = mapped_column(Text, nullable=False, default='1.0')
+    md_status: Mapped[str] = mapped_column(Text, nullable=False, default='pending')
+    md_extraction_engine: Mapped[str | None] = mapped_column(Text)
+    md_extraction_engine_version: Mapped[str | None] = mapped_column(Text)
+    md_extraction_quality: Mapped[dict | None] = mapped_column(JSONB)
+    md_extraction_error: Mapped[str | None] = mapped_column(Text)
+    md_content_hash: Mapped[str | None] = mapped_column(Text)
+    md_source_hash: Mapped[str | None] = mapped_column(Text)
+    md_generated_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    content_origin: Mapped[str] = mapped_column(Text, nullable=False, default='extracted')
+    md_draft_status: Mapped[str | None] = mapped_column(Text)
+
    # 타임스탬프
    created_at: Mapped[datetime] = mapped_column(
        DateTime(timezone=True), default=datetime.now
@@ -0,0 +1,42 @@
+"""document_images ORM (Phase 1B.5) — marker 추출 이미지 메타.
+
+저장: NAS `/documents/extracted_images/{document_id}/{image_key}.{ext}`
+표시: GET /api/documents/{doc_id}/images/{image_key}/raw (인증 필요)
+
+md_content 의 ref 는 `![alt](docimg:img_001)` 형식 — image_key 가 sequence 기반 결정적이라
+재변환 시 idempotent.
+"""
+
+from datetime import datetime
+
+from sqlalchemy import BigInteger, DateTime, ForeignKey, Integer, String, Text
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class DocumentImage(Base):
+    __tablename__ = "document_images"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    document_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("documents.id", ondelete="CASCADE"), nullable=False
+    )
+    image_key: Mapped[str] = mapped_column(String(32), nullable=False)
+    relative_path: Mapped[str] = mapped_column(Text, nullable=False)
+    file_path: Mapped[str] = mapped_column(Text, nullable=False)
+    mime_type: Mapped[str] = mapped_column(Text, nullable=False)
+    file_size: Mapped[int] = mapped_column(BigInteger, nullable=False)
+    content_hash: Mapped[str] = mapped_column(String(64), nullable=False)
+    width: Mapped[int | None] = mapped_column(Integer)
+    height: Mapped[int | None] = mapped_column(Integer)
+    page_index: Mapped[int | None] = mapped_column(Integer)
+    alt_text: Mapped[str | None] = mapped_column(Text)
+    source_slug: Mapped[str | None] = mapped_column(Text)
+    extraction_engine: Mapped[str] = mapped_column(
+        String(32), nullable=False, default="marker"
+    )
+    extraction_engine_version: Mapped[str | None] = mapped_column(String(32))
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
@@ -0,0 +1,44 @@
+"""document_notes 테이블 ORM — 자료별 손글씨 노트 (자료 1:1).
+
+설계:
+  - user×document UNIQUE — 자료당 사용자별 한 캔버스.
+  - upsert 방식. PUT /api/documents/{id}/note 로 strokes_json 전체 갱신.
+  - 회독 (document_reads, append-only log) 와 별개.
+
+NOTE: documents 에 user_id 부재 (single-user). document_notes.user_id 로
+ownership. multi-user 전환 시 documents.user_id 추가 후 별도 check 필요.
+"""
+
+from datetime import datetime
+from typing import Any
+
+from sqlalchemy import BigInteger, DateTime, ForeignKey, Integer, UniqueConstraint
+from sqlalchemy.dialects.postgresql import JSONB
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class DocumentNote(Base):
+    __tablename__ = "document_notes"
+    __table_args__ = (
+        UniqueConstraint("user_id", "document_id", name="document_notes_user_id_document_id_key"),
+    )
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    document_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("documents.id", ondelete="CASCADE"), nullable=False
+    )
+    strokes_json: Mapped[dict[str, Any] | None] = mapped_column(JSONB)
+    canvas_width: Mapped[int | None] = mapped_column(Integer)
+    canvas_height: Mapped[int | None] = mapped_column(Integer)
+    schema_version: Mapped[int] = mapped_column(Integer, default=1, nullable=False)
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    updated_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, onupdate=datetime.now, nullable=False
+    )
@@ -0,0 +1,33 @@
+"""document_reads 테이블 ORM — 자료실 회독 추적.
+
+NOTE: documents 테이블에 user_id 컬럼이 없음 (single-user 가정).
+회독 ownership 은 document_reads.user_id 만으로 추적.
+multi-user 전환 시 documents.user_id 추가 후 별도 ownership check 필요.
+
+설계:
+  - append-only log. 회독 횟수 = COUNT(*), 마지막 시각 = MAX(read_at).
+  - 사용자 명시 행동 (버튼 클릭) 으로만 row insert. 자동 +1 금지.
+  - 같은 user/document 여러 row 허용 (회독 카운트 누적).
+"""
+
+from datetime import datetime
+
+from sqlalchemy import BigInteger, DateTime, ForeignKey
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class DocumentRead(Base):
+    __tablename__ = "document_reads"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    document_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("documents.id", ondelete="CASCADE"), nullable=False
+    )
+    read_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
@@ -0,0 +1,113 @@
+"""events 1차 컨테이너 ORM (개인 운영 로그 / 일정 / 할 일 / 회고)
+
+PR-1 (migrations 239~247) 의 본체. kind enum 으로 task/calendar_event/activity_log
+세 변형을 통합 관리. memo_document_id 는 메모 link (optional).
+"""
+
+from datetime import datetime
+from typing import Any
+
+from sqlalchemy import (
+    BigInteger,
+    Boolean,
+    DateTime,
+    ForeignKey,
+    SmallInteger,
+    String,
+    Text,
+)
+from sqlalchemy.dialects.postgresql import ENUM as PgEnum
+from sqlalchemy.dialects.postgresql import JSONB
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+# Postgres enum 재선언 X (create_type=False) — migration 239~243 이 권위.
+EventKindEnum = PgEnum(
+    "task",
+    "calendar_event",
+    "activity_log",
+    name="event_kind",
+    create_type=False,
+)
+EventStatusEnum = PgEnum(
+    "inbox",
+    "next",
+    "scheduled",
+    "in_progress",
+    "done",
+    "cancelled",
+    "deferred",
+    name="event_status",
+    create_type=False,
+)
+EventSourceEnum = PgEnum(
+    "manual",
+    "memo",
+    "email",
+    "chat",
+    "webhook",
+    "git_commit",
+    "claude_code",
+    name="event_source",
+    create_type=False,
+)
+EventActorEnum = PgEnum(
+    "manual",
+    "eid",
+    "email_ingest",
+    "system",
+    name="event_actor",
+    create_type=False,
+)
+
+
+class Event(Base):
+    __tablename__ = "events"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    title: Mapped[str] = mapped_column(Text, nullable=False)
+    description: Mapped[str | None] = mapped_column(Text)
+    kind: Mapped[str] = mapped_column(EventKindEnum, nullable=False)
+    status: Mapped[str] = mapped_column(EventStatusEnum, nullable=False, default="inbox")
+
+    # 시간 필드 — kind 별 의미가 다름 (CHECK 제약은 migration 244)
+    due_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    start_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    end_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    started_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    ended_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    all_day: Mapped[bool] = mapped_column(Boolean, nullable=False, default=False)
+    timezone: Mapped[str | None] = mapped_column(Text)
+
+    # lifecycle
+    defer_until: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    completed_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    cancelled_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+
+    priority: Mapped[int | None] = mapped_column(SmallInteger)
+    project_tag: Mapped[str | None] = mapped_column(String(64))
+    tags: Mapped[list[Any]] = mapped_column(JSONB, nullable=False, default=list)
+
+    # 출처 / 외부 식별자
+    source: Mapped[str] = mapped_column(EventSourceEnum, nullable=False, default="manual")
+    source_ref: Mapped[str | None] = mapped_column(Text)
+    raw_metadata: Mapped[dict[str, Any]] = mapped_column(JSONB, nullable=False, default=dict)
+
+    # 메모 link (optional, ON DELETE SET NULL)
+    memo_document_id: Mapped[int | None] = mapped_column(
+        BigInteger, ForeignKey("documents.id", ondelete="SET NULL")
+    )
+
+    # 인증 / actor
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id"), nullable=False
+    )
+    created_by: Mapped[str] = mapped_column(EventActorEnum, nullable=False, default="manual")
+
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    updated_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, onupdate=datetime.now, nullable=False
+    )
@@ -0,0 +1,43 @@
+"""events_history ORM — events 의 lifecycle 변경 이력 (append-only).
+
+PR-1 (migrations 248~249). FK ON DELETE RESTRICT 로 부모 events row 직접 삭제 차단
+(feedback_history_table_fk_restrict.md — 이력은 시점 사실).
+"""
+
+from datetime import datetime
+from typing import Any
+
+from sqlalchemy import BigInteger, DateTime, ForeignKey
+from sqlalchemy.dialects.postgresql import ENUM as PgEnum
+from sqlalchemy.dialects.postgresql import JSONB
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+from models.event import EventActorEnum
+
+HistoryChangeKindEnum = PgEnum(
+    "create",
+    "reschedule",
+    "defer",
+    "reactivate",
+    "complete",
+    "cancel",
+    name="history_change_kind",
+    create_type=False,
+)
+
+
+class EventHistory(Base):
+    __tablename__ = "events_history"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    event_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("events.id", ondelete="RESTRICT"), nullable=False
+    )
+    changed_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    changed_by: Mapped[str] = mapped_column(EventActorEnum, nullable=False)
+    change_kind: Mapped[str] = mapped_column(HistoryChangeKindEnum, nullable=False)
+    before: Mapped[dict[str, Any] | None] = mapped_column(JSONB)
+    after: Mapped[dict[str, Any]] = mapped_column(JSONB, nullable=False)
@@ -0,0 +1,20 @@
+"""facet_values 테이블 ORM — facet 축별 허용값 사전"""
+
+from datetime import datetime
+
+from sqlalchemy import BigInteger, Boolean, DateTime, Text
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class FacetValue(Base):
+    __tablename__ = "facet_values"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    facet_type: Mapped[str] = mapped_column(Text, nullable=False)  # company, topic, doctype
+    value: Mapped[str] = mapped_column(Text, nullable=False)
+    is_system: Mapped[bool] = mapped_column(Boolean, default=False)
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now
+    )
@@ -2,7 +2,9 @@

 from datetime import datetime

-from sqlalchemy import BigInteger, DateTime, Enum, ForeignKey, SmallInteger, Text, UniqueConstraint
+from sqlalchemy import BigInteger, DateTime, Enum, ForeignKey, SmallInteger, Text, text
+from sqlalchemy.dialects.postgresql import JSONB, insert as pg_insert
+from sqlalchemy.ext.asyncio import AsyncSession
 from sqlalchemy.orm import Mapped, mapped_column

 from core.database import Base
@@ -14,7 +16,16 @@ class ProcessingQueue(Base):
    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
    document_id: Mapped[int] = mapped_column(BigInteger, ForeignKey("documents.id"), nullable=False)
    stage: Mapped[str] = mapped_column(
-        Enum("extract", "classify", "summarize", "embed", "chunk", "preview", name="process_stage"), nullable=False
+        # 'stt' (audio): migration 150 / 'thumbnail' (video): queue_consumer 가 enqueue.
+        # 'deep_summary' (PR-B B-1): classify_worker 가 에스컬레이션 시 enqueue.
+        # DB enum 변경은 마이그레이션이 처리하므로 create_type=False.
+        Enum(
+            "extract", "classify", "summarize", "embed", "chunk", "preview",
+            "stt", "thumbnail", "deep_summary", "markdown",
+            name="process_stage",
+            create_type=False,
+        ),
+        nullable=False,
    )
    status: Mapped[str] = mapped_column(
        Enum("pending", "processing", "completed", "failed", name="process_status"),
@@ -23,12 +34,44 @@ class ProcessingQueue(Base):
    attempts: Mapped[int] = mapped_column(SmallInteger, default=0)
    max_attempts: Mapped[int] = mapped_column(SmallInteger, default=3)
    error_message: Mapped[str | None] = mapped_column(Text)
+    # B-1: deep_summary stage 가 EscalationEnvelope 를 payload 로 싣는다. 다른 stage 는 NULL.
+    payload: Mapped[dict | None] = mapped_column(JSONB)
    created_at: Mapped[datetime] = mapped_column(
        DateTime(timezone=True), default=datetime.now
    )
    started_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
    completed_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))

-    __table_args__ = (
-        UniqueConstraint("document_id", "stage", "status"),
+    # DB 제약은 partial unique index uq_queue_active로 관리 (migration 117)
+
+
+async def enqueue_stage(
+    session: AsyncSession,
+    document_id: int,
+    stage: str,
+    *,
+    status: str = "pending",
+    payload: dict | None = None,
+) -> bool:
+    """ProcessingQueue에 행 추가 (DB 레벨 중복 방어).
+
+    같은 (document_id, stage)에 활성 행(pending/processing)이 이미 있으면
+    아무것도 하지 않고 False 반환.
+
+    B-1: payload 옵션으로 deep_summary 에 EscalationEnvelope JSON 을 실을 수 있다.
+    같은 문서 deep_summary 가 재제안될 경우 on_conflict_do_nothing 으로 기존 payload
+    유지 (최초 envelope 가 원본). 이후 재처리 시 재분석은 새 classify 가 트리거.
+    """
+    values: dict = {"document_id": document_id, "stage": stage, "status": status}
+    if payload is not None:
+        values["payload"] = payload
+    stmt = (
+        pg_insert(ProcessingQueue)
+        .values(**values)
+        .on_conflict_do_nothing(
+            index_elements=["document_id", "stage"],
+            index_where=text("status IN ('pending', 'processing')"),
+        )
    )
+    result = await session.execute(stmt)
+    return result.rowcount > 0
@@ -0,0 +1,134 @@
+"""study_questions / study_question_attempts ORM — 학습 워크스페이스의 문제은행 트랙
+
+PR-2 가드레일:
+  - study_topic 1차 컨테이너에 자산 타입별 조인 테이블 추가 방식. polymorphic 단일 테이블 영구 금지.
+  - subject/scope 는 강한 enum 미사용 (jlpt 등 어학 분류 확장 여지).
+  - 문제 삭제는 API 에서 soft delete only. attempts FK 는 ON DELETE RESTRICT 로 DB 레벨 보호 (hard delete 실수 차단, 이력 보존).
+  - correct_choice 변경 시 기존 attempt.is_correct 재계산 안 함 (기록은 그 시점의 사실).
+"""
+
+from datetime import datetime
+
+from pgvector.sqlalchemy import Vector
+from sqlalchemy import BigInteger, Boolean, DateTime, ForeignKey, Integer, SmallInteger, String, Text
+from sqlalchemy.dialects.postgresql import JSONB
+from sqlalchemy.orm import Mapped, mapped_column, relationship
+
+from core.database import Base
+
+
+class StudyQuestion(Base):
+    __tablename__ = "study_questions"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    study_topic_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("study_topics.id", ondelete="CASCADE"), nullable=False
+    )
+
+    question_text: Mapped[str] = mapped_column(Text, nullable=False)
+    choice_1: Mapped[str] = mapped_column(Text, nullable=False)
+    choice_2: Mapped[str] = mapped_column(Text, nullable=False)
+    choice_3: Mapped[str] = mapped_column(Text, nullable=False)
+    choice_4: Mapped[str] = mapped_column(Text, nullable=False)
+    correct_choice: Mapped[int] = mapped_column(SmallInteger, nullable=False)
+
+    subject: Mapped[str | None] = mapped_column(String(120))
+    scope: Mapped[str | None] = mapped_column(String(200))
+    exam_name: Mapped[str | None] = mapped_column(String(120))
+    exam_round: Mapped[str | None] = mapped_column(String(120))
+    explanation: Mapped[str | None] = mapped_column(Text)
+    source_note: Mapped[str | None] = mapped_column(Text)
+
+    is_active: Mapped[bool] = mapped_column(Boolean, default=True, nullable=False)
+
+    # PR-6: 회차 안 문항 번호 (1~exam_round_size). NULL 허용 — 기존 행 + 회차 미설정 입력
+    exam_question_number: Mapped[int | None] = mapped_column(SmallInteger)
+
+    # PR-3: AI 풀이 캐시 (수동 트리거)
+    # status: none | pending | ready | failed | stale (강한 enum 미사용, VARCHAR 권장값)
+    ai_explanation: Mapped[str | None] = mapped_column(Text)
+    ai_explanation_status: Mapped[str] = mapped_column(
+        String(20), default="none", nullable=False
+    )
+    ai_explanation_generated_at: Mapped[datetime | None] = mapped_column(
+        DateTime(timezone=True)
+    )
+    ai_explanation_model: Mapped[str | None] = mapped_column(String(120))
+
+    # PR-4: 자동 임베딩 (bge-m3 1024차원). status 가 큐 역할.
+    # 재계산 트리거 = question_text / choice_1~4 변경.
+    # correct_choice / subject / scope / explanation 변경은 재계산 안 함.
+    embedding = mapped_column(Vector(1024), nullable=True)
+    embedding_status: Mapped[str] = mapped_column(
+        String(20), default="none", nullable=False
+    )
+    embedding_updated_at: Mapped[datetime | None] = mapped_column(
+        DateTime(timezone=True)
+    )
+    embedding_model: Mapped[str | None] = mapped_column(String(120))
+
+    # PR-12-A 후속: related-types 영속 캐시. 임베딩 ready 워커가 채우고,
+    # 같은 토픽 다른 문제 ready 시 related_computed_at=NULL 마킹 → 다음 cron 재계산.
+    related_repeat: Mapped[list | None] = mapped_column(JSONB)
+    related_similar: Mapped[list | None] = mapped_column(JSONB)
+    related_repeat_round_count: Mapped[int | None] = mapped_column(Integer)
+    related_similar_round_count: Mapped[int | None] = mapped_column(Integer)
+    related_repeat_grade: Mapped[str | None] = mapped_column(String(50))
+    related_computed_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    related_threshold_version: Mapped[str | None] = mapped_column(String(20))
+
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    updated_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, onupdate=datetime.now, nullable=False
+    )
+    deleted_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+
+    # 연관 — 통합 뷰/통계 조회 시 selectinload 으로 끌어옴
+    topic: Mapped["StudyTopic | None"] = relationship(  # type: ignore[name-defined]  # noqa: F821
+        "StudyTopic", back_populates="questions", lazy="noload"
+    )
+    attempts: Mapped[list["StudyQuestionAttempt"]] = relationship(
+        back_populates="question",
+        cascade="all, delete-orphan",  # ORM 레벨 cascade — 실 hard delete 는 RESTRICT FK 가 막음
+        order_by="StudyQuestionAttempt.answered_at.desc()",
+        lazy="noload",
+    )
+
+
+class StudyQuestionAttempt(Base):
+    __tablename__ = "study_question_attempts"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    study_question_id: Mapped[int] = mapped_column(
+        BigInteger,
+        ForeignKey("study_questions.id", ondelete="RESTRICT"),
+        nullable=False,
+    )
+    study_topic_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("study_topics.id", ondelete="CASCADE"), nullable=False
+    )
+    # PR-9: selected_choice 는 NULL 허용 (unsure 케이스). is_correct 는 false 로 박힘.
+    selected_choice: Mapped[int | None] = mapped_column(SmallInteger, nullable=True)
+    correct_choice: Mapped[int] = mapped_column(SmallInteger, nullable=False)
+    is_correct: Mapped[bool] = mapped_column(Boolean, nullable=False)
+    # PR-9: outcome 권장값 (correct/wrong/unsure). 강한 enum 미사용.
+    outcome: Mapped[str] = mapped_column(String(20), nullable=False)
+    answered_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    # PR-10: 어떤 quiz 세션의 attempt 인지 (NULL = 세션 외 직접 입력 또는 세션 삭제됨).
+    quiz_session_id: Mapped[int | None] = mapped_column(
+        BigInteger, ForeignKey("study_quiz_sessions.id", ondelete="SET NULL"), nullable=True
+    )
+    # PR-10: 결과 카드에서 "학습완료" 체크 시 박힘. NULL = 미확인.
+    reviewed_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+
+    question: Mapped["StudyQuestion"] = relationship(back_populates="attempts")
@@ -0,0 +1,31 @@
+"""study_question_images ORM (PR-8) — 문제별 첨부 이미지.
+
+저장: NAS /documents/study_question_images/{topic_id}/{qid}/{img_id}.{ext}
+표시: GET /api/study-questions/{qid}/images/{img_id}/raw (인증 필요)
+"""
+
+from datetime import datetime
+
+from sqlalchemy import BigInteger, DateTime, ForeignKey, Integer, String, Text
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class StudyQuestionImage(Base):
+    __tablename__ = "study_question_images"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    study_question_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("study_questions.id", ondelete="CASCADE"), nullable=False
+    )
+    file_path: Mapped[str] = mapped_column(Text, nullable=False)
+    file_size: Mapped[int] = mapped_column(BigInteger, nullable=False)
+    mime_type: Mapped[str] = mapped_column(String(80), nullable=False)
+    sort_order: Mapped[int] = mapped_column(Integer, default=0, nullable=False)
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
@@ -0,0 +1,87 @@
+"""study_question_jobs ORM (Phase 4-A) — study 도메인 전용 비동기 작업 큐.
+
+processing_queue 가 documents.id FK 라 study_questions 에 직접 재사용 불가.
+별도 테이블 + 별도 consumer (study_queue_consumer.py).
+
+kind 권장값:
+  - 'explanation' (Phase 4-A): wrong/unsure 문제의 AI 풀이 prefetch
+  - 'session_summary' (Phase 4-B 예약): 세션 단위 종합 분석. session_summary 는 question
+    단위에 얹기 어색해 Phase 4-B 구현 시 study_quiz_session_jobs 별도 분리 검토.
+
+terminal status (completed/failed/skipped) 는 completed_at 항상 기록.
+failed 재시도는 기존 row 를 pending 으로 되살리지 않고 새 row 생성 — 이력 누적.
+"""
+
+from __future__ import annotations
+
+from datetime import datetime
+from typing import Any
+
+from sqlalchemy import BigInteger, DateTime, ForeignKey, SmallInteger, String, Text, text
+from sqlalchemy.dialects.postgresql import JSONB, insert as pg_insert
+from sqlalchemy.ext.asyncio import AsyncSession
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class StudyQuestionJob(Base):
+    __tablename__ = "study_question_jobs"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    study_question_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("study_questions.id", ondelete="CASCADE"), nullable=False
+    )
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    kind: Mapped[str] = mapped_column(String(40), nullable=False)
+    status: Mapped[str] = mapped_column(String(20), nullable=False, default="pending")
+    attempts: Mapped[int] = mapped_column(SmallInteger, nullable=False, default=0)
+    max_attempts: Mapped[int] = mapped_column(SmallInteger, nullable=False, default=2)
+    error_code: Mapped[str | None] = mapped_column(String(40))
+    error_message: Mapped[str | None] = mapped_column(Text)
+    payload: Mapped[dict | None] = mapped_column(JSONB)
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    started_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    completed_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+
+    # active partial unique idx 는 migration 232 가 관리.
+
+
+async def enqueue_study_question_job(
+    session: AsyncSession,
+    *,
+    study_question_id: int,
+    user_id: int,
+    kind: str,
+    payload: dict[str, Any] | None = None,
+) -> bool:
+    """study_question_jobs 에 행 추가 (DB 레벨 중복 방어).
+
+    같은 (study_question_id, kind) 에 활성 행 (pending/processing) 이 이미 있으면
+    아무것도 하지 않고 False 반환. terminal 이력은 별도 row 로 누적되므로 이번 호출이
+    failed/skipped/completed row 와 무관하게 새 active 행을 만들 수 있다.
+
+    Returns: True = 새 enqueue 발생, False = 중복으로 건너뜀.
+    """
+    values: dict[str, Any] = {
+        "study_question_id": study_question_id,
+        "user_id": user_id,
+        "kind": kind,
+        "status": "pending",
+    }
+    if payload is not None:
+        values["payload"] = payload
+    stmt = (
+        pg_insert(StudyQuestionJob)
+        .values(**values)
+        .on_conflict_do_nothing(
+            index_elements=["study_question_id", "kind"],
+            index_where=text("status IN ('pending', 'processing')"),
+        )
+    )
+    result = await session.execute(stmt)
+    return result.rowcount > 0
@@ -0,0 +1,73 @@
+"""study_question_progress — 사용자 × 토픽 × 문제 단위 현재 상태 캐시 (Phase 1).
+
+attempts (append-only 원본 로그) 와 분리. 한 번 박힌 attempts 는 절대 update 안 함.
+progress 는 마지막 시도 / 사용자 검토 / 복습 큐 / 패턴 분류 derived 4 차원 메타.
+
+세션 종료 시 finalize 가 다음 갱신:
+    - last_outcome / last_attempted_at / last_attempt_id
+    - pattern_state / pattern_updated_at / pattern_window_attempts
+    - (이미 due_at 박힌 행만) review_stage / due_at  ← 복습 stage 갱신
+
+review-complete 가 다음 갱신:
+    - last_reviewed_at
+    - (wrong/unsure 인 경우) due_at 최초 부여
+
+study_question_id 는 단일 topic 소속 전제 (현재 가스기사 토픽 4 단일 운영). 향후 question
+재사용/N:M 가능성 대비 unique 키는 (user_id, study_topic_id, study_question_id) 3 키.
+"""
+
+from __future__ import annotations
+
+from datetime import datetime
+
+from sqlalchemy import BigInteger, DateTime, ForeignKey, Integer, SmallInteger, String, UniqueConstraint
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class StudyQuestionProgress(Base):
+    __tablename__ = "study_question_progress"
+    __table_args__ = (
+        UniqueConstraint(
+            "user_id", "study_topic_id", "study_question_id",
+            name="uq_progress_user_topic_question",
+        ),
+    )
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    study_topic_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("study_topics.id", ondelete="CASCADE"), nullable=False
+    )
+    study_question_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("study_questions.id", ondelete="RESTRICT"), nullable=False
+    )
+
+    # 마지막 시도 요약
+    last_outcome: Mapped[str | None] = mapped_column(String(20))
+    last_attempted_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    last_attempt_id: Mapped[int | None] = mapped_column(
+        BigInteger, ForeignKey("study_question_attempts.id", ondelete="SET NULL")
+    )
+
+    # 사용자 검토 상태
+    last_reviewed_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+
+    # 복습 큐
+    due_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    review_stage: Mapped[int | None] = mapped_column(SmallInteger)
+
+    # 패턴 분류 (derived)
+    pattern_state: Mapped[str | None] = mapped_column(String(30))
+    pattern_updated_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    pattern_window_attempts: Mapped[int | None] = mapped_column(SmallInteger)
+
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    updated_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, onupdate=datetime.now, nullable=False
+    )
@@ -0,0 +1,58 @@
+"""study_quiz_sessions ORM (PR-10) — 문제풀이 세션 기록 + 이어풀기.
+
+한 토픽의 한 회차 풀이 = 한 행. question_ids 는 출제 순서 스냅샷.
+status: in_progress / done / abandoned (강한 enum 미사용 — VARCHAR 권장값).
+한 토픽당 in_progress 1개 강제는 partial unique idx (마이그레이션 207).
+"""
+
+from datetime import datetime
+
+from sqlalchemy import BigInteger, Boolean, DateTime, ForeignKey, Integer, String
+from sqlalchemy.dialects.postgresql import JSONB
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class StudyQuizSession(Base):
+    __tablename__ = "study_quiz_sessions"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    study_topic_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("study_topics.id", ondelete="CASCADE"), nullable=False
+    )
+
+    target_per_subject: Mapped[int] = mapped_column(Integer, nullable=False, default=20)
+    subject_filter: Mapped[str | None] = mapped_column(String(120))
+    wrong_only: Mapped[bool] = mapped_column(Boolean, nullable=False, default=False)
+    # PR-12-B: 출제 모드. 권장값 = random (1차) / frequent_focus / wrong_variants (예약).
+    quiz_mode: Mapped[str] = mapped_column(String(30), nullable=False, default="random")
+
+    # 출제 순서 스냅샷 — list[int] (question id). 출제 후 변경 안 됨.
+    question_ids: Mapped[list] = mapped_column(JSONB, nullable=False)
+    # {subject: count} 분포. 결과 카드 통계 표시용.
+    subject_distribution: Mapped[dict] = mapped_column(JSONB, nullable=False, default=dict)
+
+    status: Mapped[str] = mapped_column(String(20), nullable=False, default="in_progress")
+    cursor: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+
+    correct_count: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    wrong_count: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    unsure_count: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+
+    # Phase 2-B: finalize 결과 요약 스냅샷. 세션 종료 시점에 박혀 결과 화면 헤더에 노출.
+    newly_correct_count: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    relapsed_count: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    recovered_count: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+    chronic_remaining_count: Mapped[int] = mapped_column(Integer, nullable=False, default=0)
+
+    finished_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    updated_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, onupdate=datetime.now, nullable=False
+    )
@@ -0,0 +1,35 @@
+"""study_quiz_session_analysis ORM (Phase 4-B v1) — 세션 단위 분석 결과 캐시.
+
+session_id PK — 한 세션 = 한 분석 결과. worker 가 ON CONFLICT DO UPDATE 로 UPSERT.
+job 이력은 study_quiz_session_jobs 에 별도 누적, 결과 캐시는 1 row.
+is_stale=TRUE 는 [재생성] 클릭 후 worker 처리 끝까지만.
+"""
+
+from __future__ import annotations
+
+from datetime import datetime
+
+from sqlalchemy import BigInteger, Boolean, DateTime, ForeignKey, String, Text
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class StudyQuizSessionAnalysis(Base):
+    __tablename__ = "study_quiz_session_analysis"
+
+    study_quiz_session_id: Mapped[int] = mapped_column(
+        BigInteger,
+        ForeignKey("study_quiz_sessions.id", ondelete="CASCADE"),
+        primary_key=True,
+    )
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    summary_md: Mapped[str] = mapped_column(Text, nullable=False)
+    confidence: Mapped[str | None] = mapped_column(String(10))
+    model_name: Mapped[str | None] = mapped_column(String(120))
+    generated_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    is_stale: Mapped[bool] = mapped_column(Boolean, nullable=False, default=False)
@@ -0,0 +1,80 @@
+"""study_quiz_session_jobs ORM (Phase 4-B v1) — 세션 단위 분석 작업 큐.
+
+study_question_jobs 와 분리 — FK 단일 의미 (study_quiz_session_id NOT NULL)
+ 운영 SQL 명확성 + 4-A/4-B 가드/재시도 정책 차이.
+
+terminal status (completed/failed/skipped) 는 completed_at 항상 기록.
+재시도는 기존 row 를 pending 으로 되살리지 않고 새 row 생성 — 이력 누적.
+v1 은 단일 작업 종류 ('analysis') 라 kind 컬럼 없이 session_id 만 키.
+"""
+
+from __future__ import annotations
+
+from datetime import datetime
+from typing import Any
+
+from sqlalchemy import BigInteger, DateTime, ForeignKey, SmallInteger, String, Text, text
+from sqlalchemy.dialects.postgresql import JSONB, insert as pg_insert
+from sqlalchemy.ext.asyncio import AsyncSession
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class StudyQuizSessionJob(Base):
+    __tablename__ = "study_quiz_session_jobs"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    study_quiz_session_id: Mapped[int] = mapped_column(
+        BigInteger,
+        ForeignKey("study_quiz_sessions.id", ondelete="CASCADE"),
+        nullable=False,
+    )
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    status: Mapped[str] = mapped_column(String(20), nullable=False, default="pending")
+    attempts: Mapped[int] = mapped_column(SmallInteger, nullable=False, default=0)
+    max_attempts: Mapped[int] = mapped_column(SmallInteger, nullable=False, default=2)
+    error_code: Mapped[str | None] = mapped_column(String(40))
+    error_message: Mapped[str | None] = mapped_column(Text)
+    payload: Mapped[dict | None] = mapped_column(JSONB)
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    started_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    completed_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+
+
+async def enqueue_session_analysis_job(
+    session: AsyncSession,
+    *,
+    study_quiz_session_id: int,
+    user_id: int,
+    payload: dict[str, Any] | None = None,
+) -> bool:
+    """study_quiz_session_jobs 에 row 추가 (DB 레벨 중복 방어).
+
+    같은 session_id 의 활성 행 (pending/processing) 이 이미 있으면 False 반환.
+    terminal 이력은 별도 row 로 누적되므로 이번 호출이 failed/skipped/completed row 와
+    무관하게 새 active 행을 만들 수 있다.
+
+    Returns: True = 새 enqueue 발생, False = 중복으로 건너뜀.
+    """
+    values: dict[str, Any] = {
+        "study_quiz_session_id": study_quiz_session_id,
+        "user_id": user_id,
+        "status": "pending",
+    }
+    if payload is not None:
+        values["payload"] = payload
+    stmt = (
+        pg_insert(StudyQuizSessionJob)
+        .values(**values)
+        .on_conflict_do_nothing(
+            index_elements=["study_quiz_session_id"],
+            index_where=text("status IN ('pending', 'processing')"),
+        )
+    )
+    result = await session.execute(stmt)
+    return result.rowcount > 0
@@ -0,0 +1,144 @@
+"""study_sessions / study_session_assets 테이블 ORM — Phase 1 MVP
+
+목적: iPad 손글씨 학습 세션 (자격증 + 어학) + 모바일 암기노트/퀴즈를 위한 일반 학습 세션.
+
+설계 원칙:
+  - study_type 으로 certification / language 분기. metadata jsonb 가 도메인별 자유 메타.
+  - 단일 audio_document_id / video_document_id / source_document_id / handwriting_document_id
+    컬럼 만들지 ❌. 모든 미디어 연결은 study_session_assets 로 통일.
+  - documents 본체는 절대 삭제하지 않음. assets cascade 는 sessions 또는 documents 삭제 시.
+  - Phase 1 미사용 필드 (review_state / quiz / ocr / ai_summary / prompt) 는 NULL 허용,
+    자동 로직은 Phase 2~4 에서 별도 PR 로 활성.
+"""
+
+from datetime import datetime
+from typing import Any
+
+from sqlalchemy import (
+    BigInteger,
+    DateTime,
+    ForeignKey,
+    Integer,
+    String,
+    Text,
+    UniqueConstraint,
+)
+from sqlalchemy.dialects.postgresql import JSONB
+from sqlalchemy.orm import Mapped, mapped_column, relationship
+
+from core.database import Base
+
+
+class StudySession(Base):
+    __tablename__ = "study_sessions"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+
+    # 도메인 분기: 'certification' | 'language'
+    study_type: Mapped[str] = mapped_column(
+        String(30), default="certification", nullable=False
+    )
+
+    # 자격증/어학 메타
+    certification: Mapped[str | None] = mapped_column(String(120))
+    language_code: Mapped[str | None] = mapped_column(String(20))
+    learning_level: Mapped[str | None] = mapped_column(String(80))
+
+    # 공통 과목/주제
+    subject: Mapped[str | None] = mapped_column(String(120))
+    topic: Mapped[str | None] = mapped_column(String(200))
+
+    # 원문 텍스트 snapshot (assets 의 source_scan 과 별개로 발췌 텍스트만 보존)
+    source_text: Mapped[str | None] = mapped_column(Text)
+    source_page: Mapped[int | None] = mapped_column(Integer)
+
+    # 학습 모드: 'copy'/'trace'/'blank-repeat'/'dictation'/'shadowing'/'quiz'/'flashcard'
+    mode: Mapped[str] = mapped_column(String(30), default="copy", nullable=False)
+    prompt_question: Mapped[str | None] = mapped_column(Text)
+    expected_answer: Mapped[str | None] = mapped_column(Text)
+
+    # 도메인별 자유 메타 (어학 reading/meaning, 자격증 law_article 등)
+    metadata_json: Mapped[dict[str, Any] | None] = mapped_column(
+        "metadata", JSONB
+    )
+
+    # 횟수 카운트 (보조)
+    target_count: Mapped[int | None] = mapped_column(Integer)
+    repetition_count: Mapped[int] = mapped_column(Integer, default=0, nullable=False)
+
+    # 필기 데이터 (원본) — Phase 1 핵심
+    strokes_json: Mapped[dict[str, Any] | None] = mapped_column(JSONB)
+    canvas_width: Mapped[int | None] = mapped_column(Integer)
+    canvas_height: Mapped[int | None] = mapped_column(Integer)
+    schema_version: Mapped[int] = mapped_column(Integer, default=1, nullable=False)
+
+    # 필기 파생 텍스트 — Phase 2 채움 (Phase 1 NULL)
+    ocr_text: Mapped[str | None] = mapped_column(Text)
+    user_corrected_text: Mapped[str | None] = mapped_column(Text)
+    ai_summary: Mapped[str | None] = mapped_column(Text)
+
+    # SRS / 퀴즈 통계 — Phase 4 활성, Phase 1 NULL
+    review_state: Mapped[str | None] = mapped_column(String(20))
+    next_review_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    last_quiz_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    correct_count: Mapped[int] = mapped_column(Integer, default=0, nullable=False)
+    incorrect_count: Mapped[int] = mapped_column(Integer, default=0, nullable=False)
+
+    # 학습 워크스페이스(study_topic) 1:N. NULL 허용 — 미분류 세션이 정상 상태.
+    study_topic_id: Mapped[int | None] = mapped_column(
+        BigInteger, ForeignKey("study_topics.id", ondelete="SET NULL")
+    )
+
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    updated_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, onupdate=datetime.now, nullable=False
+    )
+
+    # 연관 assets — 세션 삭제 시 함께 삭제 (DB ON DELETE CASCADE 와 일치)
+    assets: Mapped[list["StudySessionAsset"]] = relationship(
+        back_populates="session",
+        cascade="all, delete-orphan",
+        order_by="StudySessionAsset.sort_order",
+    )
+
+    # 연관 학습 워크스페이스
+    study_topic: Mapped["StudyTopic | None"] = relationship(
+        "StudyTopic", back_populates="sessions", lazy="noload"
+    )
+
+
+class StudySessionAsset(Base):
+    __tablename__ = "study_session_assets"
+    __table_args__ = (
+        # POST /assets 의 409 근거. NULL role 끼리는 Postgres 기본대로 다른 값으로 취급.
+        UniqueConstraint(
+            "study_session_id", "document_id", "asset_type", "role",
+            name="study_session_assets_session_id_document_id_asset_type_rol_key",
+        ),
+    )
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    study_session_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("study_sessions.id", ondelete="CASCADE"), nullable=False
+    )
+    document_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("documents.id", ondelete="CASCADE"), nullable=False
+    )
+
+    # 'source_scan' | 'handwriting_png' | 'audio' | 'video' | 'transcript' | 'reference'
+    asset_type: Mapped[str] = mapped_column(String(30), nullable=False)
+    # 'prompt' | 'answer' | 'pronunciation' | 'lecture' | 'listening_source'
+    # | 'shadowing_source' | 'reference'
+    role: Mapped[str | None] = mapped_column(String(40))
+    sort_order: Mapped[int] = mapped_column(Integer, default=0, nullable=False)
+
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+
+    session: Mapped["StudySession"] = relationship(back_populates="assets")
@@ -0,0 +1,88 @@
+"""study_topics / study_topic_documents 테이블 ORM — 학습 워크스페이스 1차 컨테이너
+
+목적: 필기 세션(StudySession) 과 자료(documents) 를 한 학습 주제(예: 가스기사)
+      아래로 묶는 컨테이너. 향후 단어장/오디오/문제세트 같은 학습 자산이 같은
+      컨테이너 아래로 들어올 수 있도록 설계.
+
+설계 원칙:
+  - documents.category(자료실 UI 축) 와 직교한 별도 분류 축. 자료실 facet/카테고리 미터치.
+  - StudySession.certification/subject/topic 컬럼은 보존, 본 컨테이너 와 직교 세부 메타.
+  - study_type 은 느슨한 분류. DB/Pydantic 강한 enum 미사용. 권장값: certification /
+    language / school / work / general (UI 드롭다운에서만 안내).
+  - soft delete (deleted_at). 동일 user_id+name 의 active 행만 partial unique index 로
+    중복 방지 — 삭제된 주제명 재생성 가능.
+  - 자산 다대다 매핑: 본 PR 은 documents 만 (study_topic_documents). 향후 자산 타입별
+    조인 테이블 추가 (study_topic_audio_assets 등). polymorphic 단일 테이블 금지.
+"""
+
+from datetime import datetime
+
+from sqlalchemy import BigInteger, DateTime, ForeignKey, Integer, String, Text
+from sqlalchemy.dialects.postgresql import JSONB
+from sqlalchemy.orm import Mapped, mapped_column, relationship
+
+from core.database import Base
+
+
+class StudyTopic(Base):
+    __tablename__ = "study_topics"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+
+    name: Mapped[str] = mapped_column(String(120), nullable=False)
+    description: Mapped[str | None] = mapped_column(Text)
+    color: Mapped[str | None] = mapped_column(String(20))
+
+    # 느슨한 분류 (certification/language/school/work/general 권장)
+    study_type: Mapped[str | None] = mapped_column(String(40))
+
+    sort_order: Mapped[int] = mapped_column(Integer, default=0, nullable=False)
+
+    # PR-6: 시험 메타 (회차당 문항 수 + 과목 리스트)
+    exam_round_size: Mapped[int | None] = mapped_column(Integer)
+    exam_subjects: Mapped[list] = mapped_column(JSONB, nullable=False, default=list)
+
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    updated_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, onupdate=datetime.now, nullable=False
+    )
+    deleted_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+
+    # 연관 — 세션 (1:N), 자료 매핑 (N:M), 문제 (1:N PR-2)
+    sessions: Mapped[list["StudySession"]] = relationship(  # type: ignore[name-defined]  # noqa: F821
+        "StudySession", back_populates="study_topic", lazy="noload"
+    )
+    document_links: Mapped[list["StudyTopicDocument"]] = relationship(
+        back_populates="topic",
+        cascade="all, delete-orphan",
+        order_by="StudyTopicDocument.sort_order",
+        lazy="noload",
+    )
+    questions: Mapped[list["StudyQuestion"]] = relationship(  # type: ignore[name-defined]  # noqa: F821
+        "StudyQuestion", back_populates="topic", lazy="noload"
+    )
+
+
+class StudyTopicDocument(Base):
+    __tablename__ = "study_topic_documents"
+
+    study_topic_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("study_topics.id", ondelete="CASCADE"), primary_key=True
+    )
+    document_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("documents.id", ondelete="CASCADE"), primary_key=True
+    )
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    sort_order: Mapped[int] = mapped_column(Integer, default=0, nullable=False)
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+
+    topic: Mapped["StudyTopic"] = relationship(back_populates="document_links")
@@ -0,0 +1,38 @@
+"""study_topic_subject_notes ORM (PR-9) — 분야 설명 캐시.
+
+(user, study_topic, subject, scope) 단위 unique. AI 즉석 생성 + 캐시.
+사용자가 풀이 결과 화면에서 "모르겠음" 카드 클릭 시 호출.
+
+status: none/pending/ready/failed/stale (PR-3 패턴 동일).
+"""
+
+from datetime import datetime
+
+from sqlalchemy import BigInteger, DateTime, ForeignKey, String, Text
+from sqlalchemy.orm import Mapped, mapped_column
+
+from core.database import Base
+
+
+class StudyTopicSubjectNote(Base):
+    __tablename__ = "study_topic_subject_notes"
+
+    id: Mapped[int] = mapped_column(BigInteger, primary_key=True)
+    user_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("users.id", ondelete="CASCADE"), nullable=False
+    )
+    study_topic_id: Mapped[int] = mapped_column(
+        BigInteger, ForeignKey("study_topics.id", ondelete="CASCADE"), nullable=False
+    )
+    subject: Mapped[str] = mapped_column(String(120), nullable=False)
+    scope: Mapped[str] = mapped_column(String(200), nullable=False, default="")
+    content: Mapped[str | None] = mapped_column(Text)
+    status: Mapped[str] = mapped_column(String(20), default="none", nullable=False)
+    generated_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    model: Mapped[str | None] = mapped_column(String(120))
+    created_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, nullable=False
+    )
+    updated_at: Mapped[datetime] = mapped_column(
+        DateTime(timezone=True), default=datetime.now, onupdate=datetime.now, nullable=False
+    )
@@ -16,7 +16,9 @@ class User(Base):
    password_hash: Mapped[str] = mapped_column(Text, nullable=False)
    totp_secret: Mapped[str | None] = mapped_column(String(64))
    is_active: Mapped[bool] = mapped_column(Boolean, default=True)
+    is_admin: Mapped[bool] = mapped_column(Boolean, default=False, server_default="false")
    created_at: Mapped[datetime] = mapped_column(
        DateTime(timezone=True), default=datetime.now
    )
    last_login_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
+    password_changed_at: Mapped[datetime | None] = mapped_column(DateTime(timezone=True))
@@ -0,0 +1,5 @@
+"""AI policy layer — pure-function judgment engine.
+
+Runtime 동작 변경 없음. 이 패키지를 app/workers 나 app/api 에서 import 하지 말 것
+(PR-A CI gate: import 격리 검증).
+"""
@@ -0,0 +1,56 @@
+"""Audit — 4B 가 자체 답변한 경우 금지 패턴 검출.
+
+escalate_to_26b=False 인 이벤트에만 호출. 위반 검출 시 policy_violation=true 로
+analyze_events 에 기록되고 야간 sweep 에서 under_escalation 후보로 포획된다.
+
+detection_patterns 는 Python re.search() 로 평가 (Postgres regex 아님).
+"""
+
+from __future__ import annotations
+
+import re
+from functools import lru_cache
+from typing import Iterable
+
+from policy.loader import load_policy
+from policy.schema import DomainPolicy, ForbiddenRule
+
+
+@lru_cache(maxsize=256)
+def _compiled_patterns(pattern_tuple: tuple[str, ...]) -> tuple[re.Pattern[str], ...]:
+    return tuple(re.compile(p) for p in pattern_tuple)
+
+
+def _rules_for_subject(
+    policy: DomainPolicy, subject_domain: str
+) -> Iterable[ForbiddenRule]:
+    for rule in policy.forbidden_for_4b:
+        if subject_domain in rule.applies_when_subject_in:
+            yield rule
+
+
+def check_4b_output_violations(
+    output_text: str,
+    subject_domain: str,
+    *,
+    policy: DomainPolicy | None = None,
+) -> list[str]:
+    """Return list of violated forbidden-rule IDs (빈 리스트면 위반 없음).
+
+    Parameters
+    ----------
+    output_text: 4B 가 생성한 자체 답변 텍스트.
+    subject_domain: routing 에서 결정된 도메인 이름. fallback 도메인은 `generic`.
+    policy: 주입용 (테스트). None 이면 load_policy().
+    """
+    if not output_text:
+        return []
+    if policy is None:
+        policy = load_policy()
+
+    violations: list[str] = []
+    for rule in _rules_for_subject(policy, subject_domain):
+        patterns = _compiled_patterns(tuple(rule.detection_patterns))
+        if any(p.search(output_text) for p in patterns):
+            violations.append(rule.id)
+    return violations
@@ -0,0 +1,67 @@
+"""domain_policy.yaml loader with lru_cache."""
+
+from __future__ import annotations
+
+import os
+from functools import lru_cache
+from pathlib import Path
+
+import yaml
+
+from policy.schema import DomainPolicy
+
+
+DEFAULT_POLICY_FILENAME = "domain_policy.yaml"
+POLICY_PATH_ENV = "POLICY_PATH"
+
+
+def _resolve_path(path: str | None) -> Path:
+    if path is not None:
+        return Path(path)
+    env_path = os.environ.get(POLICY_PATH_ENV)
+    if env_path:
+        return Path(env_path)
+
+    # 검색 순서 (multi-env 호환):
+    # 1. cwd / domain_policy.yaml               로컬 pytest (repo-root 실행)
+    # 2. /app / domain_policy.yaml              container bind-mount 경로
+    # 3. /app/../domain_policy.yaml             container: /app 의 parent
+    # 4. <this>.parent.parent.parent / yaml     policy 패키지 기준 repo-root
+    candidates = [
+        Path.cwd() / DEFAULT_POLICY_FILENAME,
+        Path("/app") / DEFAULT_POLICY_FILENAME,
+        Path("/app").parent / DEFAULT_POLICY_FILENAME,
+        Path(__file__).resolve().parent.parent.parent / DEFAULT_POLICY_FILENAME,
+    ]
+    for c in candidates:
+        if c.is_file():
+            return c
+    # 찾지 못한 경우 첫 후보 반환 → 나중에 FileNotFoundError 로 명확히 실패
+    return candidates[0]
+
+
+@lru_cache(maxsize=8)
+def _load_cached(resolved: str) -> DomainPolicy:
+    text = Path(resolved).read_text(encoding="utf-8")
+    raw = yaml.safe_load(text)
+    return DomainPolicy.model_validate(raw)
+
+
+def load_policy(path: str | None = None) -> DomainPolicy:
+    """Load policy yaml and validate via pydantic.
+
+    Cache key = resolved absolute path (문자열). 테스트에서 다른 path 주면 별도 캐시.
+    """
+    resolved = str(_resolve_path(path).resolve())
+    return _load_cached(resolved)
+
+
+def clear_cache() -> None:
+    """테스트용 — 연속 호출 시 서로 다른 yaml 을 반영해야 할 때."""
+    _load_cached.cache_clear()
+
+
+def read_policy_bytes(path: str | None = None) -> bytes:
+    """policy_version hash 계산용 — yaml 원본 바이트."""
+    resolved = _resolve_path(path).resolve()
+    return resolved.read_bytes()
@@ -0,0 +1,153 @@
+"""Prompt rendering — yaml excerpt 를 template placeholder 에 주입.
+
+템플릿에는 다음 placeholder 가 있다:
+  {forbidden_block}          — subject 별 forbidden_for_4b 블록 주입
+  {subject_description}       — subject_domains[domain].description
+  {confidence_threshold}      — escalation.confidence_threshold
+  {context_cap}               — escalation.context_char_cap_4b
+  {context_cap_doc_count}     — P6 전용 (batch 문서 수 cap, 기본 500)
+
+policy_version() = sha256(yaml_bytes + template_bytes)[:12].
+yaml 또는 template 이 바뀌면 자동 bump → analyze_events.policy_version 으로 추적.
+"""
+
+from __future__ import annotations
+
+import hashlib
+from functools import lru_cache
+from pathlib import Path
+
+from policy.loader import load_policy, read_policy_bytes
+from policy.schema import DomainPolicy
+
+
+# 기본 템플릿 경로 — repo root 기준
+TEMPLATE_DIR = Path(__file__).resolve().parent.parent / "prompts" / "policy"
+
+# 4B / 26B 구분 (관측성 + 테스트 편의)
+KNOWN_4B_TASKS = {
+    "p1_triage",
+    "p2_nas_rule",
+    "p3a_short_summary",
+    "p3b_entities",
+    "p4a_advice_trigger",
+    "p4b_retrieval",
+    "p6_night_sweep",
+}
+KNOWN_26B_TASKS = {
+    "p3c_deep_summary",
+    "p4b_synthesis",
+}
+
+
+def _template_path(task: str) -> Path:
+    return TEMPLATE_DIR / f"{task}.txt"
+
+
+@lru_cache(maxsize=64)
+def _read_template(task: str) -> str:
+    path = _template_path(task)
+    if not path.exists():
+        raise FileNotFoundError(f"policy template '{task}' not found at {path}")
+    return path.read_text(encoding="utf-8")
+
+
+@lru_cache(maxsize=64)
+def _read_template_bytes(task: str) -> bytes:
+    return _template_path(task).read_bytes()
+
+
+def _forbidden_block_for(
+    policy: DomainPolicy, subject_domain: str
+) -> str:
+    """해당 도메인에 적용되는 forbidden_for_4b 규칙을 프롬프트 블록으로 렌더."""
+    lines = ["=== 4B 절대 금지 작업 ===",
+             "다음에 해당하면 자체 답변 금지, escalate_to_26b=true + envelope 만 응답.",
+             ""]
+    count = 0
+    for rule in policy.forbidden_for_4b:
+        if subject_domain in rule.applies_when_subject_in:
+            count += 1
+            lines.append(f"{count}. [{rule.id}] {rule.description}")
+    if count == 0:
+        lines.append("(해당 도메인에 등록된 금지 항목 없음 — 일반 규칙만 적용)")
+    lines.append("")
+    lines.append("금지 위반 시 사후 audit (check_4b_output_violations) 에서 탐지되어")
+    lines.append("policy_violation=true 로 기록 + under_escalation 큐로 재처리.")
+    return "\n".join(lines)
+
+
+def render_4b(
+    task: str,
+    subject_domain: str,
+    *,
+    policy: DomainPolicy | None = None,
+) -> str:
+    """4B 용 템플릿에 정책 excerpt 를 주입하고 반환.
+
+    사용자 input placeholder ({{filename}}, {{extracted_text}} 등, 이중중괄호) 는
+    그대로 남는다. PR-B 의 worker 가 str.format 또는 Template 으로 최종 주입.
+    """
+    if task not in KNOWN_4B_TASKS:
+        raise ValueError(f"'{task}' is not a 4B task (known: {KNOWN_4B_TASKS})")
+    if policy is None:
+        policy = load_policy()
+
+    template = _read_template(task)
+    domain_spec = (
+        policy.subject_domains.get(subject_domain)
+        or policy.fallback_domain
+    )
+
+    return template.format(
+        forbidden_block=_forbidden_block_for(policy, subject_domain),
+        subject_description=domain_spec.description,
+        confidence_threshold=policy.escalation.confidence_threshold,
+        context_cap=policy.escalation.context_char_cap_4b,
+        context_cap_doc_count=500,
+    )
+
+
+def render_26b(
+    task: str,
+    subject_domain: str,
+    *,
+    policy: DomainPolicy | None = None,
+) -> str:
+    """26B 용 템플릿 렌더."""
+    if task not in KNOWN_26B_TASKS:
+        raise ValueError(f"'{task}' is not a 26B task (known: {KNOWN_26B_TASKS})")
+    if policy is None:
+        policy = load_policy()
+
+    template = _read_template(task)
+    domain_spec = (
+        policy.subject_domains.get(subject_domain)
+        or policy.fallback_domain
+    )
+
+    return template.format(
+        forbidden_block=_forbidden_block_for(policy, subject_domain),
+        subject_description=domain_spec.description,
+        confidence_threshold=policy.escalation.confidence_threshold,
+        context_cap=policy.escalation.context_char_cap_26b,
+        context_cap_doc_count=500,
+    )
+
+
+def policy_version(task: str, *, policy_path: str | None = None) -> str:
+    """Return sha256(yaml_bytes + template_bytes)[:12].
+
+    Deterministic — 같은 (yaml, template) → 같은 hash. 한 쪽만 변경돼도 변경됨.
+    analyze_events.policy_version 에 저장되어 drift 추적.
+    """
+    yaml_bytes = read_policy_bytes(policy_path)
+    template_bytes = _read_template_bytes(task)
+    h = hashlib.sha256(yaml_bytes + template_bytes).hexdigest()
+    return h[:12]
+
+
+def clear_cache() -> None:
+    """테스트용 — 템플릿 재읽기."""
+    _read_template.cache_clear()
+    _read_template_bytes.cache_clear()
@@ -0,0 +1,178 @@
+"""Routing engine — 4B 출력 + 상황을 받아 26B 에스컬레이션 여부를 결정.
+
+6 invariants (모두 deterministic, code-level HARD rules):
+
+INV-1  self_declare_add_only
+       deterministic_high_impact=True AND self_declare=False → high_impact_task=True
+       (self_declare 는 ADD only; OFF 불가)
+
+INV-2  risk_flag_requires_26b_forces_escalation
+       any(flag where policy.risk_flags[flag].requires_26b) → escalate=True
+
+INV-3  context_cap_forces_escalation
+       content_chars > policy.escalation.context_char_cap_4b → escalate=True, reason="long_context"
+
+INV-4  multi_doc_forces_escalation
+       evidence_doc_count >= policy.escalation.escalate_on_multi_doc_count
+       → escalate=True, reason="multi_doc", add "multi_doc_dependency" to risk_flags
+
+INV-5  risk_flags_union
+       final risk_flags = UNION(domain.default_risk_flags, self_declared, derived)
+       self_declared 는 ADD only; default 있어도 self 가 추가 flag 붙이면 합집합
+
+INV-6  fallback_domain for unknown
+       subject_domain not in policy.subject_domains → use policy.fallback_domain
+       (routing 이 None/undefined 로 빠지는 edge case 0)
+"""
+
+from __future__ import annotations
+
+from dataclasses import dataclass, field
+from typing import Iterable
+
+from policy.loader import load_policy
+from policy.schema import DomainPolicy, SubjectDomain, FallbackDomain
+
+
+# --- Reason 문자열 상수 (tests 에서 참조) -----------------------------------
+REASON_HIGH_IMPACT = "high_impact"
+REASON_RISK_FLAG = "risk_flag_requires_26b"
+REASON_LOW_CONFIDENCE = "low_confidence"
+REASON_LONG_CONTEXT = "long_context"
+REASON_MULTI_DOC = "multi_doc"
+REASON_FALLBACK_DOMAIN = "fallback_domain"
+
+
+@dataclass(frozen=True)
+class RoutingDecision:
+    escalate_to_26b: bool
+    escalation_reasons: tuple[str, ...]
+    risk_flags: tuple[str, ...]
+    high_impact_task: bool
+    synthesis_directives: tuple[str, ...]
+    subject_domain_used: str  # 실제 적용된 도메인 이름 (fallback 인 경우 fallback_domain.name)
+    used_fallback: bool = False
+
+
+def _resolve_domain(
+    policy: DomainPolicy, subject_domain: str
+) -> tuple[SubjectDomain | FallbackDomain, str, bool]:
+    """INV-6 — 매칭 실패 시 fallback_domain."""
+    spec = policy.subject_domains.get(subject_domain)
+    if spec is not None:
+        return spec, subject_domain, False
+    return policy.fallback_domain, policy.fallback_domain.name, True
+
+
+def decide_routing(
+    *,
+    subject_domain: str,
+    content_chars: int,
+    deterministic_keyword_hits: Iterable[str] = (),
+    self_declared_high_impact: bool = False,
+    self_declared_risk_flags: Iterable[str] = (),
+    confidence: float = 1.0,
+    evidence_doc_count: int = 0,
+    policy: DomainPolicy | None = None,
+) -> RoutingDecision:
+    """Pure function — yaml 과 입력만으로 결정론적 결과.
+
+    Parameters
+    ----------
+    subject_domain: upstream (keyword/source_channel 매칭) 이 정한 도메인 이름.
+    content_chars: 4B 에 들어간 본문 문자 수.
+    deterministic_keyword_hits: upstream 의 keyword 매칭 결과 (비어있어도 domain.high_impact
+        가 True 면 INV 는 그대로 작동).
+    self_declared_high_impact: 4B 출력의 high_impact_self_declared 필드.
+    self_declared_risk_flags: 4B 출력의 risk_flags 자기선언.
+    confidence: 4B 출력의 confidence (0.0~1.0).
+    evidence_doc_count: /ask 경로 등에서 합성 대상 문서 수.
+    policy: 주입용 (테스트). None 이면 loader.load_policy().
+    """
+    if policy is None:
+        policy = load_policy()
+
+    domain_spec, domain_name, used_fallback = _resolve_domain(policy, subject_domain)
+
+    reasons: list[str] = []
+    flags: set[str] = set()
+
+    # --- INV-1: high_impact (deterministic → self_declare 는 ADD only) -----
+    deterministic_high_impact = (
+        bool(list(deterministic_keyword_hits))
+        or domain_spec.high_impact
+    )
+    high_impact = deterministic_high_impact
+    if self_declared_high_impact:
+        high_impact = True  # ADD only — False 로 되돌릴 수 없음
+
+    if high_impact:
+        reasons.append(REASON_HIGH_IMPACT)
+
+    # --- INV-5: risk_flags UNION merge -------------------------------------
+    # (a) domain 기본
+    flags.update(domain_spec.default_risk_flags)
+    # (b) 4B 자기선언 (ADD only)
+    flags.update(self_declared_risk_flags)
+
+    # --- INV-3: long_context (derived flag 추가 전에 판정) ----------------
+    if content_chars > policy.escalation.context_char_cap_4b:
+        reasons.append(REASON_LONG_CONTEXT)
+
+    # --- INV-4: multi_doc (derived flag 추가) -----------------------------
+    if evidence_doc_count >= policy.escalation.escalate_on_multi_doc_count:
+        reasons.append(REASON_MULTI_DOC)
+        flags.add("multi_doc_dependency")
+
+    # --- low_confidence (derived flag 추가) --------------------------------
+    if confidence < policy.escalation.confidence_threshold:
+        reasons.append(REASON_LOW_CONFIDENCE)
+        flags.add("low_confidence_reasoning")
+
+    # --- INV-2: risk_flag_requires_26b -------------------------------------
+    requires_26b_flag = any(
+        policy.risk_flags[f].requires_26b
+        for f in flags
+        if f in policy.risk_flags and policy.risk_flags[f].requires_26b
+    )
+    if requires_26b_flag:
+        reasons.append(REASON_RISK_FLAG)
+
+    # --- INV-6: fallback 사용 사실 기록 -----------------------------------
+    if used_fallback:
+        # 에스컬레이션 자체를 강제하진 않지만 visibility 위해 reason 에 추가
+        reasons.append(REASON_FALLBACK_DOMAIN)
+
+    # --- synthesis directives 수집 (26B 에 전달될 규칙) -------------------
+    directives: list[str] = []
+    for f in sorted(flags):
+        rf = policy.risk_flags.get(f)
+        if rf is not None and rf.synthesis_directive:
+            directives.append(rf.synthesis_directive)
+
+    # --- 최종 escalate 판정 ---------------------------------------------
+    escalate = (
+        high_impact
+        or requires_26b_flag
+        or content_chars > policy.escalation.context_char_cap_4b
+        or evidence_doc_count >= policy.escalation.escalate_on_multi_doc_count
+        or confidence < policy.escalation.confidence_threshold
+    )
+
+    # 중복 reason 제거 (순서 유지)
+    seen: set[str] = set()
+    dedup_reasons: list[str] = []
+    for r in reasons:
+        if r not in seen:
+            seen.add(r)
+            dedup_reasons.append(r)
+
+    return RoutingDecision(
+        escalate_to_26b=escalate,
+        escalation_reasons=tuple(dedup_reasons),
+        risk_flags=tuple(sorted(flags)),
+        high_impact_task=high_impact,
+        synthesis_directives=tuple(directives),
+        subject_domain_used=domain_name,
+        used_fallback=used_fallback,
+    )
@@ -0,0 +1,133 @@
+"""Pydantic v2 models for domain_policy.yaml.
+
+Loader 가 yaml → DomainPolicy 로 파싱. Schema 위반 시 ValidationError → 배포 차단.
+"""
+
+from __future__ import annotations
+
+from typing import Literal
+
+from pydantic import BaseModel, ConfigDict, Field, field_validator, model_validator
+
+
+# documents.category enum (migration 143 + 152)
+UICategory = Literal["document", "library", "news", "memo", "audio", "video", "law"]
+
+SelfDeclareSemantics = Literal["additive_trigger_only"]
+
+
+class SubjectDomain(BaseModel):
+    model_config = ConfigDict(extra="forbid", frozen=True)
+
+    description: str
+    suggested_ui_category: UICategory
+    high_impact: bool = False
+    default_risk_flags: tuple[str, ...] = ()
+    deep_summary_risk_flags: tuple[str, ...] = ()
+    keywords: tuple[str, ...] = ()
+    note: str | None = None
+
+
+class FallbackDomain(BaseModel):
+    model_config = ConfigDict(extra="forbid", frozen=True)
+
+    name: str
+    description: str
+    suggested_ui_category: UICategory
+    high_impact: bool = False
+    default_risk_flags: tuple[str, ...] = ()
+    requires_human_review: bool = True
+
+
+class RiskFlag(BaseModel):
+    model_config = ConfigDict(extra="forbid", frozen=True)
+
+    description: str
+    requires_26b: bool
+    synthesis_directive: str | None = None
+    output_mask_required: bool = False
+
+    @field_validator("synthesis_directive")
+    @classmethod
+    def _directive_length(cls, v: str | None) -> str | None:
+        if v is not None and len(v) > 500:
+            raise ValueError("synthesis_directive must be <= 500 chars")
+        return v
+
+
+class ForbiddenRule(BaseModel):
+    model_config = ConfigDict(extra="forbid", frozen=True)
+
+    id: str
+    description: str
+    applies_when_subject_in: tuple[str, ...]
+    detection_patterns: tuple[str, ...] = ()
+
+
+class Escalation(BaseModel):
+    model_config = ConfigDict(extra="forbid", frozen=True)
+
+    confidence_threshold: float = Field(ge=0.0, le=1.0)
+    context_char_cap_4b: int = Field(gt=0)
+    context_char_cap_26b: int = Field(gt=0)
+    escalate_on_multi_doc_count: int = Field(ge=1)
+
+
+class HealthRange(BaseModel):
+    model_config = ConfigDict(extra="forbid", frozen=True)
+
+    min: float | None = None
+    max: float | None = None
+
+
+class Observability(BaseModel):
+    model_config = ConfigDict(extra="forbid", frozen=True)
+
+    required_event_fields: tuple[str, ...]
+    health_ranges: dict[str, HealthRange]
+
+
+class DomainPolicy(BaseModel):
+    model_config = ConfigDict(extra="forbid", frozen=True)
+
+    version: int
+    last_updated: str
+    scope: tuple[str, ...]
+    self_declare_semantics: SelfDeclareSemantics
+
+    subject_domains: dict[str, SubjectDomain]
+    fallback_domain: FallbackDomain
+    risk_flags: dict[str, RiskFlag]
+    forbidden_for_4b: tuple[ForbiddenRule, ...]
+    escalation: Escalation
+    observability: Observability
+
+    @model_validator(mode="after")
+    def _cross_reference_check(self) -> "DomainPolicy":
+        """Cross-field validation — yaml 내부 일관성."""
+        known_flags = set(self.risk_flags.keys())
+
+        # 1. 모든 subject_domain.default_risk_flags 가 risk_flags 에 정의돼 있어야 함
+        for name, dom in self.subject_domains.items():
+            for flag in (*dom.default_risk_flags, *dom.deep_summary_risk_flags):
+                if flag not in known_flags:
+                    raise ValueError(
+                        f"subject_domain '{name}' references unknown risk_flag '{flag}'"
+                    )
+
+        for flag in self.fallback_domain.default_risk_flags:
+            if flag not in known_flags:
+                raise ValueError(
+                    f"fallback_domain references unknown risk_flag '{flag}'"
+                )
+
+        # 2. forbidden_for_4b.applies_when_subject_in 의 도메인이 subject_domains 에 있어야 함
+        known_domains = set(self.subject_domains.keys())
+        for rule in self.forbidden_for_4b:
+            for dom_name in rule.applies_when_subject_in:
+                if dom_name not in known_domains:
+                    raise ValueError(
+                        f"forbidden rule '{rule.id}' references unknown subject_domain '{dom_name}'"
+                    )
+
+        return self
@@ -0,0 +1,90 @@
+"""ShadowLogger — Protocol + in-memory implementation.
+
+Live 전환 전 1주 shadow 기간에 "만약 이 정책이면 어디로 라우팅했을지" 를 기록.
+실제 DB writer (DBShadowLogger) 는 PR-B 의 책임. PR-A 는:
+  1. Protocol 로 인터페이스 확정.
+  2. InMemoryShadowLogger 로 테스트 가능한 fake 제공.
+
+PR-B 가 Protocol 시그니처를 변경하지 않는 것이 불변식.
+"""
+
+from __future__ import annotations
+
+from dataclasses import dataclass, field
+from datetime import datetime, timezone
+from typing import Any, Protocol, runtime_checkable
+
+from policy.routing import RoutingDecision
+
+
+@dataclass(frozen=True)
+class ShadowRecord:
+    """단일 shadow 이벤트 — InMemoryShadowLogger 가 dict 로 보관."""
+
+    doc_id: str
+    decision: RoutingDecision
+    actual_model_used: str
+    prompt_version: str
+    policy_version: str
+    recorded_at: datetime
+    extra: dict[str, Any] = field(default_factory=dict)
+
+
+@runtime_checkable
+class ShadowLogger(Protocol):
+    """PR-A 가 정의하는 shadow 기록 인터페이스.
+
+    PR-B 가 DBShadowLogger(ShadowLogger) 로 구현할 때 이 시그니처를 그대로 준수.
+    """
+
+    async def record_would_route(
+        self,
+        *,
+        doc_id: str,
+        decision: RoutingDecision,
+        actual_model_used: str,
+        prompt_version: str,
+        policy_version: str,
+        extra: dict[str, Any] | None = None,
+    ) -> None:
+        ...
+
+
+class InMemoryShadowLogger:
+    """테스트 전용 구현. PR-B 의 DBShadowLogger 와 시그니처 호환."""
+
+    def __init__(self) -> None:
+        self._records: list[ShadowRecord] = []
+
+    async def record_would_route(
+        self,
+        *,
+        doc_id: str,
+        decision: RoutingDecision,
+        actual_model_used: str,
+        prompt_version: str,
+        policy_version: str,
+        extra: dict[str, Any] | None = None,
+    ) -> None:
+        self._records.append(
+            ShadowRecord(
+                doc_id=doc_id,
+                decision=decision,
+                actual_model_used=actual_model_used,
+                prompt_version=prompt_version,
+                policy_version=policy_version,
+                recorded_at=datetime.now(timezone.utc),
+                extra=dict(extra or {}),
+            )
+        )
+
+    # --- Inspection helpers (테스트 전용) ----------------------------------
+    @property
+    def records(self) -> tuple[ShadowRecord, ...]:
+        return tuple(self._records)
+
+    def clear(self) -> None:
+        self._records.clear()
+
+    def count(self) -> int:
+        return len(self._records)
@@ -0,0 +1,46 @@
+너는 다국적 뉴스 비교 분석가다.
+아래는 같은 주제로 군집된 야간 수집 뉴스들 — 각 줄 앞 (국가코드 · 소스) 표시로 출처가 표시되어 있다.
+이 정보만으로 cross-country 비교 분석을 JSON 으로만 출력하라.
+
+목표:
+- 같은 사건을 각 나라가 어떻게 다르게 다루는지 / 무엇이 공통인지를 1페이지 카드 형태로 정리.
+- 사용자는 한국어 독자. 한국어로 출력.
+
+절대 금지:
+- 제공된 summary 에 없는 사실 추가
+- 추측 표현 ("보인다", "~할 것이다", "~할 전망" 등)
+- JSON 외의 모든 텍스트 (설명, 마크다운, 코드블록 금지)
+- 인용부호 안 원문에 없던 단어 생성 (key_quotes 는 원문 그대로만)
+
+분량 cap (반드시 지킬 것):
+- country_perspectives: 최대 10개, 각 summary 는 1~2문장 (한국어 120자 이내)
+- divergences: 최대 3개, 각 200자 이내
+- convergences: 최대 2개, 각 200자 이내
+- key_quotes: 최대 5개, 각 quote 240자 이내
+- historical_context: 1~2문장 (한국어 120자 이내), 의미 있을 때만 채우고 아니면 null
+
+출력 형식 (JSON 객체 하나만 출력, 위 cap 초과 금지):
+{
+  "topic_label": "5~10 단어의 한국어 토픽 제목",
+  "headline": "전체를 한 줄로 압축한 한국어 headline (≤80자)",
+  "country_perspectives": [
+    {"country": "KR", "summary": "...", "article_ids": []},
+    {"country": "US", "summary": "...", "article_ids": []}
+  ],
+  "divergences": ["A국=X 강조 / B국=Y 비판 / C국=Z 부각"],
+  "convergences": ["모든 매체가 Z 사실은 일치"],
+  "key_quotes": [{"country": "US", "source": "NYT", "quote": "..."}],
+  "historical_context": null
+}
+
+규칙:
+- country_perspectives 의 country 는 입력 기사의 국가코드 그대로 (대문자).
+- article_ids 는 비워둬도 됨 (서버가 채움).
+- 단일 국가만 다룬 경우 divergences 는 빈 배열.
+- historical_context 는 아래 "이전 흐름 참고" 섹션이 비어있으면 반드시 null.
+
+오늘 새벽 기사 묶음:
+{articles_block}
+
+이전 흐름 참고 (직접 인용 금지, 맥락 파악 용도):
+{historical_block}
@@ -0,0 +1,33 @@
+You are an answerability judge. Given a query and evidence chunks, determine if the evidence can answer the query. Respond ONLY in JSON.
+
+## CALIBRATION (CRITICAL)
+- verdict=full: evidence is SUFFICIENT to answer the CORE of the query. Missing minor details does NOT make it insufficient.
+- verdict=partial: evidence covers SOME major aspects but CLEARLY MISSES others the user explicitly asked about.
+- verdict=insufficient: evidence has NO relevant information for the query, or is completely off-topic.
+
+Example: Query="제6장 주요 내용", Evidence covers 제6장 definition+scope → verdict=full (core is covered).
+Example: Query="제6장 처벌 조항", Evidence covers 제6장 definition but NOT 처벌 → verdict=partial.
+Example: Query="감귤 출하량", Evidence about 산업안전보건법 → verdict=insufficient.
+
+## Rules
+1. Your "verdict" must be based ONLY on whether the CONTENT semantically answers the query. Ignore retrieval scores for this field.
+2. "covered_aspects": query aspects that evidence covers. Korean labels for Korean queries.
+3. "missing_aspects": query aspects that evidence does NOT cover. Korean labels.
+4. Keep aspects concise (2-5 words each), non-overlapping.
+
+## Output Schema
+{
+  "verdict": "full" | "partial" | "insufficient",
+  "covered_aspects": ["aspect1"],
+  "missing_aspects": ["aspect2"],
+  "confidence": "high" | "medium" | "low"
+}
+
+## Query
+{query}
+
+## Evidence chunks:
+{chunks}
+
+## Retrieval scores (for reference only, NOT for verdict):
+[{scores}]
@@ -1,14 +1,20 @@
+[DEPRECATED 2026-04-24] — summary_triage.txt 로 이관됨 (PR-B B-1 tier routing).
+이 파일은 B-1 안정화 기간 동안 rollback 경로를 위해 유지. 신규 호출 경로는
+summary_triage.txt + summary_deep.txt 조합 사용. 실제 삭제는 별도 cleanup PR.
+
 You are a document classification AI. Analyze the document below and respond ONLY in JSON format. No other text.

 ## Response Format
 {
  "domain": "Level1/Level2/Level3",
  "document_type": "one of document_types",
+  "facet_doctype": "one of facet_doctypes or null",
  "confidence": 0.85,
  "tags": ["tag1", "tag2"],
  "importance": "medium",
  "sourceChannel": "inbox_route",
-  "dataOrigin": "work or external"
+  "dataOrigin": "work or external",
+  "docPurpose": "business or knowledge"
 }

 ## Domain Taxonomy (select the most specific leaf node)
@@ -56,7 +62,7 @@ General/
 - 2-level paths allowed ONLY when no leaf exists (e.g., Engineering/Civil)

 ## Document Types (select exactly ONE)
-Reference, Standard, Manual, Drawing, Template, Note, Academic_Paper, Law_Document, Report, Memo, Checklist, Meeting_Minutes, Specification
+Reference, Standard, Manual, Drawing, Template, Note, Academic_Paper, Law_Document, Report, Memo, Checklist, Meeting_Minutes, Specification, 발주서, 세금계산서, 명세표, 도면, 증명서, 계획서, 시방서

 ### Document Type Detection Rules
 - Step-by-step instructions → Manual
@@ -65,9 +71,22 @@ Reference, Standard, Manual, Drawing, Template, Note, Academic_Paper, Law_Docume
 - Meeting discussion → Meeting_Minutes
 - Checklist format → Checklist
 - Academic/research format → Academic_Paper
- Technical drawings → Drawing
+- Technical drawings → Drawing / 도면
+- 발주 내역, 품목·수량·단가 표 → 발주서
+- 공급자/공급받는자/세액 양식 → 세금계산서
+- 거래 명세/납품 명세 → 명세표
+- 자격 증빙·수료·재직 → 증명서
+- 업무·프로젝트 추진안 → 계획서
+- 공사 시방·재료 기준 → 시방서
 - If unclear → Note

+## facet_doctype (실무 문서 유형 식별 신호)
+Select ONE of: 발주서, 세금계산서, 명세표, 도면, 증명서, 계획서, 시방서
+If the document clearly does NOT fit any of the above, return null.
+- This field is independent of document_type — use it to flag business-document types
+  that drive 자료실(library) 자동 분류 제안.
+- 발주서 / 세금계산서 / 명세표 는 자료실 "거래" 분류의 승인 대기 제안으로 연결된다.
+
 ## Confidence (0.0 ~ 1.0)
 - How confident are you in the domain classification?
 - 0.85+ = high confidence, 0.6~0.85 = moderate, <0.6 = uncertain
@@ -89,5 +108,12 @@ Reference, Standard, Manual, Drawing, Template, Note, Academic_Paper, Law_Docume
 - work: company-related (TK, Technicalkorea, factory, production)
 - external: external reference (news, papers, laws, general info)

+## docPurpose
+- business: 업무 수행에 직접 사용 (양식, 보고서, 체크리스트, 제출물, 계획서)
+- knowledge: 참조·학습·보관 목적 (법령, 논문, 기사, 레퍼런스, 기술 문서, 교육 자료)
+- Template, Checklist, Report, Specification → business 가능성 높음
+- Academic_Paper, Law_Document, Reference, Standard → knowledge 가능성 높음
+- Meeting_Minutes, Memo → 문맥 판단 (실행 기록이면 business, 참조용이면 knowledge)
+
 ## Document to classify
 {document_text}
@@ -0,0 +1,19 @@
+너는 팩트 기반 뉴스 토픽 요약 도우미다.
+아래는 같은 사건으로 군집된 기사들의 ai_summary다.
+이 정보만으로 다음을 JSON으로만 출력하라.
+
+절대 금지:
+- 제공된 summary에 없는 사실 추가
+- 해석/비교/예측/의견
+- "보인다", "~할 것이다", "~할 전망" 같은 추측 표현
+- 인용부호 안 원문 외 단어 생성
+- JSON 외의 모든 텍스트 (설명, 마크다운, 코드블록 금지)
+
+출력 형식 (JSON 객체 하나만 출력):
+{
+  "topic_label": "5~10 단어의 한국어 제목",
+  "summary": "1~2 문장, 사실만, 수동태 허용"
+}
+
+기사 요약:
+{articles_block}
@@ -0,0 +1,30 @@
+You are a document analyzer. Respond ONLY in JSON. No markdown wrapping, no explanation.
+
+## Task
+Given a document, produce a structured analysis with up to 4 layers.
+Skip any layer that does not apply. Always include "summary".
+
+## Output Schema
+{
+  "layers": [
+    {"layer": "evidence", "title": "근거", "content": "..."},
+    {"layer": "explanation", "title": "해설", "content": "..."},
+    {"layer": "examples", "title": "사례", "content": "..."},
+    {"layer": "summary", "title": "요약", "content": "..."}
+  ]
+}
+
+## Rules
+- Each content: 200~400 characters, in the same language as the document (Korean documents → Korean).
+- "evidence": Key factual claims or data points stated in the document. Skip for narrative/opinion documents.
+- "explanation": Why the facts matter, context, or interpretation. Skip for pure data/tables.
+- "examples": Concrete cases, scenarios, or instances explicitly mentioned. Skip if none exist.
+- "summary": Always present. 2-3 sentences capturing the document's core message.
+- Use ONLY information in the document. No outside knowledge.
+- If a layer does not apply, OMIT it entirely from the layers array. Do NOT write "해당 없음", "정보 없음", "N/A" — just skip.
+- Maximum 4 layers. Minimum 1 (summary).
+
+## Document
+Title: {document_title}
+Content:
+{document_text}
@@ -0,0 +1,77 @@
+You are an evidence span extractor. Respond ONLY in JSON. No markdown, no explanation.
+
+## Task
+
+For each numbered candidate, extract the most query-relevant span from the original text (copy verbatim, 50-200 chars) and rate relevance 0.0~1.0. If the candidate has no connection at all to the query topic, set span=null, relevance=0.0, skip_reason. Partial or indirect relevance should still get a span and relevance >= 0.3.
+
+## Output Schema
+{
+  "items": [
+    {
+      "n": 1,
+      "span": "...",
+      "relevance": 0.0,
+      "skip_reason": null
+    }
+  ]
+}
+
+## Rules
+- `n`: candidate 번호 (1-based, 입력 순서와 동일). **모든 n을 반환** (skip된 것도 포함).
+- `span`: 원문에서 **그대로 복사한** 50~200자. 요약/변형 금지. 원문에 없는 단어는 절대 포함하지 말 것. 여러 문장이어도 무방.
+- 관련 span이 없으면 `span: null`, `relevance: 0.0`, `skip_reason`에 한 줄 사유.
+- `relevance`: 0.0~1.0 float
+  - 0.9+ query에 직접 답함
+  - 0.7~0.9 강한 연관
+  - 0.5~0.7 명확한 부분 연관 (query의 핵심 측면 일부를 커버)
+  - 0.3~0.5 약한 부분 연관 (query 주제에 관련되나 직접 답은 아님)
+  - <0.3 무관
+- `skip_reason`: span=null 일 때만 필수. 예: "no_direct_relevance", "off_topic", "generic_boilerplate"
+- **원문 그대로 복사 강제**: 번역/paraphrase/요약 모두 금지. evidence span은 citation 원문이 되어야 한다.
+
+## Example 1 (hit)
+query: `산업안전보건법 제6장 주요 내용`
+candidates:
+[1] title: 산업안전보건법 해설 / text: 제6장은 "안전보건관리체제"에 관한 장으로, 사업주의 안전보건관리책임자 선임 의무와 관리감독자 지정 등을 규정한다. 제15조부터 제19조까지 구성된다...
+[2] title: 회사 복지 규정 / text: 직원의 연차휴가 사용 규정과 경조사 지원 내용을 담고 있다...
+
+→
+{
+  "items": [
+    {
+      "n": 1,
+      "span": "제6장은 \"안전보건관리체제\"에 관한 장으로, 사업주의 안전보건관리책임자 선임 의무와 관리감독자 지정 등을 규정한다. 제15조부터 제19조까지 구성된다",
+      "relevance": 0.95,
+      "skip_reason": null
+    },
+    {
+      "n": 2,
+      "span": null,
+      "relevance": 0.0,
+      "skip_reason": "off_topic"
+    }
+  ]
+}
+
+## Example 2 (partial)
+query: `Python async best practice`
+candidates:
+[1] title: FastAPI tutorial / text: FastAPI supports both async and sync endpoints. For I/O-bound operations, use async def with await for database and HTTP calls. Avoid blocking calls in async functions or use run_in_executor...
+
+→
+{
+  "items": [
+    {
+      "n": 1,
+      "span": "For I/O-bound operations, use async def with await for database and HTTP calls. Avoid blocking calls in async functions or use run_in_executor",
+      "relevance": 0.82,
+      "skip_reason": null
+    }
+  ]
+}
+
+## Query
+{query}
+
+## Candidates
+{numbered_candidates}
@@ -0,0 +1,41 @@
+[System]
+너는 Document Server 의 업로드 라우터다. 업로드된 파일의 메타데이터와 (있다면) 텍스트 preview 를 보고, 어떤 처리 파이프라인이 필요한지만 결정한다. 문서 내용을 요약하거나 태깅하지 않는다.
+
+subject_description: {subject_description}
+
+규칙:
+- mime/확장자가 명확하면 그대로 따른다. 모르겠으면 "unknown" 으로 표시하고 needs_ocr=true.
+- 이미지·PDF 의 text_density < 0.3 → needs_ocr=true.
+- 오디오(m4a/mp3/wav)·비디오(mp4/webm) → needs_stt=true.
+- 확신도 낮으면 priority="needs_human" 로만 표시하고 추측하지 않는다.
+
+{forbidden_block}
+
+출력 (JSON only, 다른 텍스트 금지):
+{{
+  "subject_domain": "safety_reference|safety_operational|msds|hazard_specific|incident_report|health_record|safety_video|news_item|news_digest_request|generic",
+  "needs_ocr": bool,
+  "needs_stt": bool,
+  "needs_summary": bool,
+  "summary_tier": "short|standard|deep|none",
+  "priority": "normal|high|needs_human",
+  "high_impact_self_declared": bool,
+  "high_impact_reason": "한 줄 한국어",
+  "confidence": 0.0~1.0,
+  "escalate_to_26b": bool,
+  "escalation_reason": "한 줄 한국어 (escalate=true 일 때만)"
+}}
+
+에스컬레이션 기준 (one-of):
+- 입력 preview > {context_cap} chars
+- confidence < {confidence_threshold}
+- 규칙 충돌 / 다중 도메인 혼재
+- 사용자 대면 자연어 응답 필요 (여긴 해당 없음)
+
+[User]
+파일명: {{filename}}
+MIME: {{mime}}
+크기: {{size_bytes}} bytes
+소스: {{source}}   (upload | nas_watcher | law_monitor | news_collector)
+Text preview (처음 2000자):
+{{text_preview_or_empty}}
@@ -0,0 +1,40 @@
+[System]
+너는 Document Server 의 자료 분류 어시스턴트다. 문서 메타데이터 + 짧은 요약 + 추출 태그를 보고 사용자 승인용 UI 카테고리/파일명/태그 제안을 생성한다.
+
+**자동 이동 금지** — 네 출력은 승인 대기용 제안일 뿐, 즉시 DB category 를 변경하지 않는다 (PR-B 의 ai_suggestion 플로우에서 사용자 승인 후 반영).
+
+subject_description: {subject_description}
+
+{forbidden_block}
+
+제약:
+- suggested_ui_category 는 {{document, library, news, memo, audio, video, law}} 중에서만 선택.
+- 규칙에 없는 카테고리는 만들지 않는다. 애매하면 needs_human_review=true.
+- cat_library=1 과 has_library_tag=1 자동 전이 금지 (정책).
+- 개인정보 (주민번호/계좌/전화/차량번호) 가 본문에 보이면 tags 에 "pii" 추가 + confidence 감점.
+- category 매칭을 subject_domain 판정 키로 절대 역산하지 말 것 (UI 축과 정책 축 분리 원칙).
+
+출력 (JSON only):
+{{
+  "suggested_ui_category": "document|library|news|memo|audio|video|law",
+  "target_subfolder": "...",
+  "suggested_filename": "...",
+  "tags_auto": ["tag1", "tag2"],
+  "library_suggestion": bool,
+  "confidence": 0.0~1.0,
+  "needs_human_review": bool,
+  "reason": "한 줄 한국어",
+  "escalate_to_26b": bool
+}}
+
+에스컬레이션:
+- 입력 > {context_cap} chars → escalate
+- confidence < {confidence_threshold} → escalate
+- 도메인·카테고리 조합에 대한 룰이 상충 → escalate
+
+[User]
+파일명: {{filename}}
+subject_domain: {{subject_domain}}
+추출 요약 (P3a short tier): {{short_summary}}
+추출 태그 후보: {{extracted_tags}}
+유사 기존 문서 top3: {{similar_docs_titles}}
@@ -0,0 +1,60 @@
+[System]
+너는 한국어 문서 태거 + 짧은 요약기다. 입력 본문을 읽고 TL;DR + 핵심 bullets + tags 만 생성한다. **상세 문단·entities 는 생성하지 않는다** (깊은 요약은 26B, entity 는 P3b 담당).
+
+subject_description: {subject_description}
+
+{forbidden_block}
+
+태깅 원칙:
+- 태그 5~12개, 명사구. 동사/조사 금지.
+- "문서 종류" 태그 1개 필수 (예: 법령, MSDS, 회의록, 보고서, 메모, 뉴스, 영상전사).
+- 시점 태그 (YYYY-QN / YYYY-MM) 추출 가능 시 포함.
+- 중복 의미 태그 금지 ("계약" + "계약서" → "계약서" 하나).
+- pii 감지 시 "pii" 추가 + confidence 감점.
+
+요약 규칙:
+- **TL;DR**: 1문장, 최대 60자.
+- **Bullets**: 정확히 5개, 각 30~60자.
+- 본문에 없는 정보 추가 금지 (hallucination 금지).
+- 숫자·날짜·고유명사는 원문 그대로.
+
+출력 (JSON only):
+{{
+  "tldr": "1문장 최대 60자",
+  "bullets": ["...", "...", "...", "...", "..."],
+  "tags": ["..."],
+  "doc_type": "...",
+  "time_scope": "YYYY-QN|YYYY-MM|null",
+  "confidence": 0.0~1.0,
+  "high_impact_self_declared": bool,
+  "high_impact_reason": "한 줄",
+  "recommend_deep_summary": bool,
+  "recommend_entity_pass": bool,
+  "escalate_to_26b": bool,
+  "risk_flags": ["..."],
+  "event_kind_hint": "note|task|calendar_event|activity_log|reference|null",
+  "event_kind_confidence": 0.0~1.0
+}}
+
+event_kind_hint 분류 (사용자 메모 inbox triage 용 — AI 가 events row 직접 생성하지 않고 사용자 1-click promote 의 추천만 제공):
+- "task": 사용자가 미래에 해야 할 일 (예: "내일 견적 요청", "세무사 전화하기"). due 시각 있어도 task 가능.
+- "calendar_event": 시간/날짜가 고정된 일정 (예: "5/15 14:00 회의", "내일 2시 세무사 전화"). 본문에 명시적 시간 단서.
+- "activity_log": 이미 한 행동 기록 (예: "방금 PR 머지 완료", "오늘 GPU 서버 점검함"). 과거형 또는 "방금/오늘/지금" 표지.
+- "reference": 나중에 참조할 자료/링크/요약 (예: 웹 클립, 외부 자료, "이거 나중에 봐야 함").
+- "note": 위 4개 어디에도 명확하지 않은 일반 메모/생각 (default).
+- event_kind_confidence: 0.0–1.0. 명확하지 않으면 낮게 (< 0.5). 사용자가 결정.
+- 본문이 짧거나 의도 불명이면 "note" + confidence 낮게.
+
+recommend_deep_summary=true 조건:
+- 본문 > 40,000 chars
+- 다수 당사자 또는 시계열 전개가 있는 법령/절차/보고서
+- 사용자가 이 문서를 기반으로 결정을 내려야 할 가능성
+
+에스컬레이션 (escalate_to_26b=true):
+- 본문 > {context_cap} chars
+- confidence < {confidence_threshold}
+- subject_domain 의 high_impact=true 이고 판단 정확성이 중요
+- 5개 이상 핵심 주장 교차 — 상세 분석 필요
+
+[User]
+{{extracted_text}}
@@ -0,0 +1,42 @@
+[System]
+너는 고유명사 추출기다. 본문에서 인물/조직/프로젝트명만 추출한다.
+
+subject_description: {subject_description}
+
+{forbidden_block}
+
+원칙:
+- 추측·유추·번역 금지. 본문에 문자 그대로 등장하는 것만.
+- 각 entity 는 원문 근접 5단어를 evidence 로 제공 (fabrication 방지).
+- 확신 없으면 빈 배열 + abstained=true. 과추출 페널티 > 과소추출 페널티.
+- 동의어·별칭 병합 금지 (원문 그대로 두 개 각각 기록).
+
+abstained=true 가 되는 경우 (P3c 26B 가 재추출):
+- 이름 후보가 10개 이상인데 문맥 구분 불가
+- 익명 주체가 주요 행위자인 문서
+- 번역·음역으로 표기 불일치 심한 경우
+
+출력 (JSON only):
+{{
+  "people": [
+    {{"name": "...", "evidence": "원문 그대로 주변 5단어"}}
+  ],
+  "orgs": [
+    {{"name": "...", "evidence": "..."}}
+  ],
+  "projects": [
+    {{"name": "...", "evidence": "..."}}
+  ],
+  "confidence": 0.0~1.0,
+  "abstained": bool,
+  "abstain_reason": "한 줄 한국어 (abstained=true 일 때만)",
+  "escalate_to_26b": bool
+}}
+
+에스컬레이션:
+- 본문 > {context_cap} chars
+- confidence < {confidence_threshold}
+- subject_domain 의 high_impact=true (안전/법령/MSDS 등 — entity 오독 실무 피해)
+
+[User]
+{{extracted_text}}
@@ -0,0 +1,51 @@
+[System]
+너는 긴 문서·문서 묶음 분석가다. 4B 가 넘긴 envelope 를 먼저 읽고, original_pointers 로 원문 범위를 재조회하여 최종 분석을 작성한다.
+
+subject_description: {subject_description}
+
+{forbidden_block}
+
+envelope 를 읽는 순서:
+1. risk_flags 를 먼저 본다. 어떤 위험 때문에 올라온 것인지 파악.
+2. synthesis_directives 를 system 지시로 간주하여 반드시 준수.
+3. distilled_context 는 "참고 요지"일 뿐, 숫자·조문·인용은 original 에서 재확인.
+
+단일 문서:
+- TL;DR (1문장, 최대 60자)
+- 핵심 (bullets 5개, 각 30~80자)
+- 상세 (2 문단, 각 3~5문장, 원문 흐름 유지)
+
+문서 묶음 (법령 연대기 / 회의록 시리즈 / 사고 보고 계열):
+- 묶음 개요 (1문단)
+- 시계열 또는 논리 흐름 (3~7 단계)
+- 각 문서 역할 1줄
+- 일관성 이슈 (수치 모순, 날짜 모순) — 있을 때만
+
+제약:
+- 본문에 없는 정보 금지 (hallucination 금지).
+- synthesis_directives 의 문구 규칙 ("원인은 ~" 금지 등) 반드시 준수.
+- multi_reference_synthesis flag 있으면 레퍼런스별 입장 분리 기술, 종합 권고 금지.
+
+출력 (JSON only):
+{{
+  "mode": "single|bundle",
+  "tldr": "...",
+  "bullets": ["..."],
+  "detail": "...\\n\\n...",
+  "bundle_flow": ["..."] | null,
+  "inconsistencies": ["..."] | null,
+  "entities_confirmed": {{
+    "people": [{{"name": "...", "evidence": "..."}}],
+    "orgs": [...],
+    "projects": [...]
+  }},
+  "directives_applied": ["..."],
+  "confidence": 0.0~1.0
+}}
+
+[User]
+Envelope:
+{{escalation_envelope_json}}
+
+원문 (ranges — original_pointers 기반 슬라이스):
+{{original_text_slices}}
@@ -0,0 +1,43 @@
+[System]
+너는 Document Server 의 선제적 조언 탐지기다. 조언이 **실제로 사용자에게 유용한 시점** 만 감지한다. 모든 문서마다 조언하지 않는다 — **침묵이 기본값**이다.
+
+subject_description: {subject_description}
+
+{forbidden_block}
+
+트리거 조건 (하나 이상 충족해야 should_advise=true):
+
+1. reference_version_drift
+   같은 주제의 레퍼런스가 2개 이상이고, 개정일이 1년 이상 차이
+2. safety_reference_vs_news
+   최근 뉴스 digest 에 보유 레퍼런스 주제의 법령 개정 시그널 탐지
+3. conflict_in_refs
+   동일 위험 유형(예: 밀폐공간)에 대해 보유 문서들이 서로 다른 절차 제시
+4. unsummarized_long_video
+   STT 끝난 safety_video 중 챕터는 분리됐으나 deep summary 없음
+5. news_cluster_needs_synthesis
+   같은 이벤트 cluster 에 국가/출처 3개 이상 누적
+
+트리거 없으면 should_advise=false, 다른 필드는 null.
+
+출력 (JSON only):
+{{
+  "should_advise": bool,
+  "trigger_type": "reference_version_drift|safety_reference_vs_news|conflict_in_refs|unsummarized_long_video|news_cluster_needs_synthesis|none",
+  "evidence_doc_ids": ["..."],
+  "urgency": "low|medium|high",
+  "draft_hint": "26B 에게 전달할 한 줄 컨텍스트",
+  "confidence": 0.0~1.0,
+  "escalate_to_26b": bool
+}}
+
+에스컬레이션:
+- should_advise=true → 자연어 문장 작성은 26B 담당 (항상 escalate=true)
+- 입력 > {context_cap} chars → escalate
+- confidence < {confidence_threshold} → escalate
+
+[User]
+최근 이벤트:
+{{event_context}}
+관련 문서 메타:
+{{docs_metadata_json}}
@@ -0,0 +1,44 @@
+[System]
+너는 질문-근거 매칭기다. 사용자 질문과 검색 후보 snippet (이미 bge-m3 + reranker 통과) 을 받아, 실제로 질문에 답하는 데 쓸 근거만 추려낸다. **최종 답변은 쓰지 않는다** — 26B synthesis 가 쓴다.
+
+subject_description: {subject_description}
+
+{forbidden_block}
+
+규칙:
+- 각 snippet 이 질문의 어느 부분에 답하는지 1문장으로 기술.
+- 무관한 snippet 은 제외 (개수 늘리려 억지 포함 금지).
+- 근거들 간 모순이 보이면 conflicts 에 기록.
+- 근거 부족 시 answerability=insufficient + suggested_queries.
+
+answerability 3-state:
+- direct       = 질문의 모든 측면이 근거에 있음 → 26B synthesis full-answer
+- partial      = 일부만 있음 (중요한 측면 1개 누락) → 26B synthesis "제한적 답변"
+- insufficient = 핵심 측면 대부분 누락 → 26B 호출 안 함, 사용자에 suggested_queries 리턴
+
+출력 (JSON only):
+{{
+  "answerability": "direct|partial|insufficient",
+  "selected_evidence": [
+    {{"doc_id": "...", "snippet": "...", "relevance": "질문의 X 부분에 답함"}}
+  ],
+  "coverage_analysis": {{
+    "answered_aspects": ["..."],
+    "unanswered_aspects": ["..."]
+  }},
+  "conflicts": ["..."] | null,
+  "suggested_queries": ["..."] | null,
+  "draft_hint": "26B 에게 줄 답변 방향 1~2 줄",
+  "confidence": 0.0~1.0,
+  "escalate_to_26b": bool
+}}
+
+에스컬레이션:
+- answerability in {{direct, partial}} → 26B synthesis 호출 (escalate=true)
+- answerability=insufficient → 26B 호출 안 함 (escalate=false, 사용자에게 추가 쿼리 제안)
+- confidence < {confidence_threshold} → escalate (answerability 재검토)
+
+[User]
+질문: {{question}}
+후보 snippets:
+{{candidates_json}}
@@ -0,0 +1,31 @@
+[System]
+너는 근거 기반 답변 작성자다. 한국어로 존댓말, 이모지 금지.
+
+subject_description: {subject_description}
+
+envelope 가 먼저 제공된다. risk_flags 와 synthesis_directives 를 **반드시 준수**.
+
+{forbidden_block}
+
+응답 형식:
+- 1~2문단. 구어체 금지, 문어체.
+- 인용은 [doc_id:N] 형태 인라인 표기.
+- 숫자·날짜·조문·고유명사는 evidence 의 snippet 그대로 복제.
+- evidence 밖 정보 인용 절대 금지 (hallucination 금지).
+- conflicts 있으면 마지막 문장에 "근거 간 모순" 명시.
+
+mode 별 분기:
+- full     : 완전 답변. 모든 측면 커버.
+- limited  : 제한적 답변. 답변 마지막에 반드시
+             "다만 {{unanswered_aspects}} 에 대해서는 문서에 근거가 부족합니다." 삽입.
+
+multi_reference_synthesis flag 있으면 종합 결론 금지, 레퍼런스별 분리 기술.
+medical_health_judgment flag 있으면 "전문의 상담 권장" 문구 포함.
+
+[User]
+mode: {{mode}}   (full | limited)
+질문: {{question}}
+Envelope:
+{{escalation_envelope_system_injection}}
+Evidence (4B 선별):
+{{selected_evidence_json}}
@@ -0,0 +1,60 @@
+[System]
+너는 Document Server 의 야간 점검 봇이다. 전일 색인된 문서 배치를 받아 이상 징후를 탐지한다. **개선 행동을 자동 실행하지 않는다 — 보고만 한다.**
+
+subject_description: {subject_description}
+
+{forbidden_block}
+
+점검 항목:
+
+파이프라인 실패:
+1. ocr_failed          : ocr_attempted=1, text_length < 100
+2. stt_timeout         : duration 있는데 transcript 없음
+3. missing_summary     : summary IS NULL, classify 완료
+4. missing_tags        : tags 0개
+5. missing_embedding   : embedding IS NULL
+6. duplicate_filename  : 같은 파일명, 다른 hash (버전 추정)
+7. unknown_category_24h: category="unknown" 이 24h 이상 유지
+
+품질:
+8. summary_quality_low : bullets < 3 OR avg bullet len < 20 chars OR tldr == doc title
+9. tags_low_entropy    : tags 전부 {{문서, 정보, 자료, 파일, 기타}} 등 generic 집합
+
+Escalation 감사 (관측성):
+10. over_escalation    : 26B 호출됐으나 4B draft 대비 new facts 0 (wasted)
+11. under_escalation   : high_impact_task=true 인데 26B 미경유 (위험!)
+12. entity_abstain_high: 특정 doc_type 에서 P3b abstain 비율 > 40% (프롬프트 튜닝 시그널)
+
+각 이상건은 한 줄로 집계. 이상 없으면 빈 배열.
+
+출력 (JSON only):
+{{
+  "swept_at": "ISO8601",
+  "total_docs": N,
+  "anomalies": [
+    {{
+      "doc_id": "...",
+      "issue": "ocr_failed|stt_timeout|missing_summary|missing_tags|missing_embedding|duplicate_filename|unknown_category_24h|summary_quality_low|tags_low_entropy|over_escalation|under_escalation|entity_abstain_high",
+      "severity": "low|medium|high",
+      "escalate_to_26b": bool,
+      "note": "한 줄"
+    }}
+  ],
+  "summary_stats": {{
+    "ocr_fail_rate": 0.0,
+    "missing_summary_count": 0,
+    "under_escalation_count": 0,
+    "over_escalation_count": 0
+  }},
+  "confidence": 0.0~1.0,
+  "escalate_to_26b": bool
+}}
+
+에스컬레이션:
+- 개별 anomaly 에 severity=high → escalate_to_26b=true 로 개별 flag
+- under_escalation 1건이라도 발견 → 전체 sweep escalate=true (26B 가 원인 분석)
+- total_docs > {context_cap_doc_count} → escalate (배치 크기 초과)
+
+[User]
+점검 대상 문서 메타 (NDJSON):
+{{docs_meta_ndjson}}
@@ -0,0 +1,53 @@
+You are a search query analyzer. Respond ONLY in JSON. No markdown, no explanation.
+
+## Output Schema
+{
+  "intent": "fact_lookup | semantic_search | filter_browse",
+  "query_type": "natural_language | keyword | phrase",
+  "domain_hint": "document | news | mixed",
+  "language_scope": "limited | global",
+  "keywords": [],
+  "must_terms": [],
+  "optional_terms": [],
+  "hard_filters": {},
+  "soft_filters": {"domain": [], "document_type": []},
+  "normalized_queries": [{"lang": "ko", "text": "...", "weight": 1.0}],
+  "expanded_terms": [],
+  "synonyms": {},
+  "analyzer_confidence": 0.0
+}
+
+## Rules
+- `intent`: fact_lookup (사실/조항/이름), semantic_search (주제/개념), filter_browse (필터 중심)
+- `query_type`: natural_language (문장형), keyword (단어 나열), phrase (따옴표/고유명사/법조항)
+- `domain_hint`: document (소유 문서/법령/매뉴얼), news (시사/뉴스), mixed (불명)
+- `language_scope`: limited (ko+en), global (다국어 필요)
+- `hard_filters`: 쿼리에 **명시된** 것만. 추론 금지. 키: file_format, year, country
+- `soft_filters.domain`: Industrial_Safety, Programming, Engineering, Philosophy, Language, General. 2-level 허용(e.g. Industrial_Safety/Legislation)
+- `soft_filters.document_type`: Law_Document, Manual, Report, Academic_Paper, Standard, Specification, Meeting_Minutes, Checklist, Note, Memo, Reference, Drawing, Template
+- `normalized_queries`: 원문 언어 1.0 가중치 필수. 교차언어 1개 추가 권장(ko↔en, weight 0.8). news + global 인 경우만 ja/zh 추가(weight 0.5~0.6). **최대 3개**.
+- `analyzer_confidence`: 0.9+ 명확, 0.7~0.9 대체로 명확, 0.5~0.7 모호, <0.5 분석 불가
+
+## Example
+query: `기계 사고 관련 법령`
+{
+  "intent": "semantic_search",
+  "query_type": "natural_language",
+  "domain_hint": "document",
+  "language_scope": "limited",
+  "keywords": ["기계", "사고", "법령"],
+  "must_terms": [],
+  "optional_terms": ["안전", "규정"],
+  "hard_filters": {},
+  "soft_filters": {"domain": ["Industrial_Safety/Legislation"], "document_type": ["Law_Document"]},
+  "normalized_queries": [
+    {"lang": "ko", "text": "기계 사고 관련 법령", "weight": 1.0},
+    {"lang": "en", "text": "machinery accident related laws", "weight": 0.8}
+  ],
+  "expanded_terms": ["산업안전", "기계안전"],
+  "synonyms": {},
+  "analyzer_confidence": 0.88
+}
+
+## Query
+{query}
@@ -0,0 +1,82 @@
+You are a grounded answer synthesizer. Respond ONLY in JSON. No markdown, no explanation.
+
+## Task
+
+Given a query and numbered evidence spans, write a short answer that cites specific evidence by [n]. **You may only use facts that appear in the evidence.** If the evidence does not directly answer the query, set `refused: true`.
+
+## Output Schema
+{
+  "answer": "...",
+  "used_citations": [1, 2],
+  "confidence": "high",
+  "refused": false,
+  "refuse_reason": null
+}
+
+## Rules
+- `answer`: **600 characters max**. Must contain inline `[n]` citations. Every claim sentence ends with at least one `[n]`. Multiple sources: `[1][3]`. **Only use facts present in evidence. No outside knowledge, no guessing, no paraphrasing what is not there.**
+- `used_citations`: integer list of `n` values that actually appear in `answer` (for cross-check). Must be sorted ascending, no duplicates.
+- `confidence`:
+  - `high`: 3+ evidence items with strong relevance
+  - `medium`: 2 items match, or 1 strong match
+  - `low`: 1-2 weak/partial items
+- `refused`: set to `true` ONLY if evidence is completely off-topic (e.g., query about 연차휴가 but evidence only about 산업안전). If evidence is partially relevant or covers a related aspect, attempt an answer with low confidence instead of refusing. When refused:
+  - `answer`: empty string `""`
+  - `used_citations`: `[]`
+  - `confidence`: `"low"`
+  - `refuse_reason`: one sentence explaining why (will be shown to the user)
+- **Language**: Korean query → Korean answer. English query → English answer. Match query language.
+- **Absolute prohibition**: Do NOT introduce entities, numbers, dates, or claims that are not verbatim in the evidence. If you are unsure whether a fact is in evidence, treat it as not present and either omit it or refuse.
+- **Partial coverage**: If evidence covers only PART of the query, answer ONLY the covered part. Do NOT infer or guess missing parts. Explicitly state what the evidence covers.
+- **Supplementary evidence**: Evidence marked (보충) is supplementary context, less reliable than primary evidence. Use it only as supporting detail. If primary and supplementary evidence conflict, trust primary.
+
+## Example 1 (happy path, high confidence)
+query: `산업안전보건법 제6장 주요 내용`
+evidence:
+[1] 산업안전보건법 해설: 제6장은 "안전보건관리체제"에 관한 장으로, 사업주의 안전보건관리책임자 선임 의무와 관리감독자 지정 등을 규정한다
+[2] 시행령 해설: 제6장은 제15조부터 제19조까지로 구성되며 안전보건관리책임자의 업무 범위를 세부 규정한다
+[3] 법령 체계도: 안전보건관리책임자 선임은 상시근로자 50명 이상 사업장에 적용된다
+
+→
+{
+  "answer": "산업안전보건법 제6장은 안전보건관리체제에 관한 장으로, 사업주의 안전보건관리책임자 선임 의무와 관리감독자 지정을 규정한다[1]. 제15조부터 제19조까지 구성되며 관리책임자의 업무 범위를 세부 규정한다[2]. 상시근로자 50명 이상 사업장에 적용된다[3].",
+  "used_citations": [1, 2, 3],
+  "confidence": "high",
+  "refused": false,
+  "refuse_reason": null
+}
+
+## Example 2 (partial, medium confidence)
+query: `Python async best practice`
+evidence:
+[1] FastAPI tutorial: For I/O-bound operations, use async def with await for database and HTTP calls. Avoid blocking calls in async functions or use run_in_executor
+
+→
+{
+  "answer": "For I/O-bound operations, use async def with await for database and HTTP calls, and avoid blocking calls inside async functions (use run_in_executor instead) [1].",
+  "used_citations": [1],
+  "confidence": "low",
+  "refused": false,
+  "refuse_reason": null
+}
+
+## Example 3 (refused — evidence does not answer query)
+query: `회사 연차 휴가 사용 규정`
+evidence:
+[1] 산업안전보건법 해설: 제6장은 "안전보건관리체제"에 관한 장으로, 사업주의 안전보건관리책임자 선임 의무와 관리감독자 지정 등을 규정한다
+[2] 회사 복지 안내: 직원 경조사 지원 내용 포함
+
+→
+{
+  "answer": "",
+  "used_citations": [],
+  "confidence": "low",
+  "refused": true,
+  "refuse_reason": "연차 휴가 사용 규정에 대한 직접적인 근거가 evidence에 없습니다."
+}
+
+## Query
+{query}
+
+## Evidence
+{numbered_evidence}
@@ -0,0 +1,34 @@
+You are a grounded answer synthesizer handling a PARTIAL answer case. Some aspects of the query CAN be answered, others CANNOT. Respond ONLY in JSON.
+
+## Task
+Answer ONLY the covered aspects. Do NOT attempt to answer missing aspects.
+
+## Output Schema
+{
+  "confirmed_items": [
+    {"aspect": "aspect label", "text": "1~2 sentence answer", "citations": [1, 2]}
+  ],
+  "confidence": "medium" | "low",
+  "refused": false
+}
+
+## Rules
+- Each confirmed_item: aspect label + 1~2 sentences + inline [n] citations
+- ONLY use facts present in evidence. No outside knowledge, no guessing.
+- Do NOT mention or address missing_aspects in your text.
+- Korean query → Korean answer / English → English
+- confidence: medium (2+ strong evidence matches) / low (1 or weak)
+- Max total text: 400 chars across all items
+- 모든 주장 문장 끝에 [n] 필수
+
+## Covered aspects (answer these):
+{covered_aspects}
+
+## Missing aspects (do NOT answer these):
+{missing_aspects}
+
+## Query
+{query}
+
+## Evidence
+{numbered_evidence}
@@ -0,0 +1,49 @@
+당신은 한국 기사시험(가스기사·산업안전기사 등) 필기 학습 보조 AI 입니다.
+4지선다 객관식 문제를 분석하고 정답 풀이를 작성합니다.
+
+【문제】
+{question_text}
+
+【보기】
+1. {choice_1}
+2. {choice_2}
+3. {choice_3}
+4. {choice_4}
+
+【사용자가 입력한 정답】
+{correct_choice}번
+
+【참고 자료 — 우선순위 순서】
+
+▼ 자료 (1순위: 자료실 매핑 문서)
+{documents_evidence_block}
+
+▼ 같은 주제의 다른 문제 (2순위: 보조 근거)
+{questions_evidence_block}
+
+【지침】
+1. 자료를 1순위 근거로 사용. 다른 문제는 보조 근거로만.
+2. 자료 인용은 [자료: 제목] 형태. 문제 인용은 [관련: Q<id>] 형태.
+3. 정답이 왜 맞는지 핵심 개념 → 오답 보기가 왜 틀렸는지 짧게 → 정리 순서.
+4. 자료에 직접 근거가 없으면 "자료 근거 부족" 으로 명시하고, 일반 상식 풀이는 별도 단락에 표시.
+5. **할루시네이션 방지 (절대 규칙)**:
+   - 자료 근거가 부족하면 법령명·조항·수치·기준값을 새로 만들어내지 않는다.
+   - 근거 없는 수치(예: "0.5 MPa", "10 mg/L")·공식·표준 번호(예: "KS B 6750")·통계는 작성하지 않는다.
+   - 자료에서 확인되지 않는 내용은 "자료에서 확인되지 않음" 이라고 명시한다.
+   - "보통 ~이다", "일반적으로 ~이다" 같은 모호한 단정도 자료 근거가 없으면 사용하지 않는다.
+6. confidence 는 풀이 근거 강도에 따라 high/medium/low 중 하나로 선택:
+   - high: 자료에 직접 근거가 있고 정답이 명확
+   - medium: 자료가 부분 근거이고 일반 지식 보강 필요
+   - low: 자료 근거 부족하여 추론에 의존
+7. **answer_choice 는 반드시 위 "사용자가 입력한 정답" 의 번호 ({correct_choice}) 를 그대로 박는다.**
+   - 사용자 정답이 정해진 객관식 문제이며, 너의 역할은 그 정답을 풀이하는 것이지 정답 자체를 바꾸는 것이 아니다.
+   - 자료 근거가 사용자 정답과 다르게 보여도 explanation_md 안에 "자료 근거에 따르면 다른 해석도 가능하다" 라고 짧게 명시할 뿐, answer_choice 는 사용자 정답 그대로 유지한다.
+   - 정답을 추측하거나 다른 번호로 바꾸는 것은 환각 가드에 차단된다.
+8. explanation_md 는 사용자 정답이 왜 맞는지 풀이. 한국어 **300~600자 권장, 최대 900자**. 굵게·리스트 가능.
+   - 핵심 개념과 정답 근거 위주. 모든 오답 보기를 다 풀이할 필요 없고 가장 헷갈리는 1~2개만.
+   - **explanation_md 안에서 줄바꿈은 최소화** (꼭 필요한 단락 분리만).
+   - **LaTeX 수식 사용 자제**. 쓰더라도 짧은 인라인 (`$...$`) 만, `\circ`/`\text{}`/`\,` 같은 매크로는 가능하면 평문으로 ("0°C", "C", "  ").
+9. **출력은 raw JSON 한 객체만**. 메타 설명·인사·코드 펜스 (` ``` `)·thinking 텍스트 없이.
+
+【출력 형식】
+{{"answer_choice": <1|2|3|4>, "explanation_md": "<풀이 본문 마크다운>", "confidence": "<high|medium|low>"}}
@@ -0,0 +1,38 @@
+당신은 한국 기사시험(가스기사·산업안전기사 등) 필기 학습 보조 AI 입니다.
+4지선다 객관식 문제를 분석하고 정답 풀이를 작성합니다.
+
+【문제】
+{question_text}
+
+【보기】
+1. {choice_1}
+2. {choice_2}
+3. {choice_3}
+4. {choice_4}
+
+【사용자가 입력한 정답】
+{correct_choice}번
+
+【참고 자료 — 우선순위 순서】
+
+▼ 자료 (1순위: 자료실 매핑 문서)
+{documents_evidence_block}
+
+▼ 같은 주제의 다른 문제 (2순위: 보조 근거)
+{questions_evidence_block}
+
+【지침】
+1. 자료를 1순위 근거로 사용. 다른 문제는 보조 근거로만.
+2. 자료 인용은 [자료: 제목] 형태. 문제 인용은 [관련: Q<id>] 형태.
+3. 정답이 왜 맞는지 핵심 개념 → 오답 보기가 왜 틀렸는지 짧게 → 정리 순서.
+4. 자료에 직접 근거가 없으면 "자료 근거 부족" 으로 명시하고, 일반 상식 풀이는 별도 단락에 표시.
+5. 사용자 입력 정답과 자료 근거가 충돌하면 "근거에 따르면 정답이 X번일 가능성이 있습니다" 라고 충돌을 명시 (자동으로 다른 답으로 단정 금지).
+6. **할루시네이션 방지 (절대 규칙)**:
+   - 자료 근거가 부족하면 법령명·조항·수치·기준값을 새로 만들어내지 않는다.
+   - 근거 없는 수치(예: "0.5 MPa", "10 mg/L")·공식·표준 번호(예: "KS B 6750", "ASME Section VIII")·통계는 작성하지 않는다.
+   - 자료에서 확인되지 않는 내용은 "자료에서 확인되지 않음" 이라고 명시한다.
+   - "보통 ~이다", "일반적으로 ~이다" 같은 모호한 단정도 자료 근거가 없으면 사용하지 않는다.
+7. 한국어. 분량 200~400자. 마크다운(굵게·리스트) 사용 가능.
+8. 메타 설명·인사 없이 풀이만 출력.
+
+【풀이】
@@ -0,0 +1,37 @@
+당신은 한국 기사시험 학습 보조 AI 입니다.
+사용자가 한 풀이 세션을 막 끝냈고, 그 결과를 짧게 정리하는 역할입니다.
+
+【세션 정량 데이터 — 이 값들만 인용 가능】
+- 총 {total}문제 / 정답 {correct}건 / 오답 {wrong}건 / 모르겠음 {unsure}건
+- 새로 맞힘 {newly_correct}건 / 다시 틀림 {relapsed}건
+- 회복 {recovered}건 / 누적 반복 오답 {chronic_remaining}건
+
+【과목 분포】
+{subject_distribution_block}
+
+【이번 세션의 오답·모르겠음 문제들 (qid 별)】
+{wrong_unsure_block}
+
+【참고 자료 (있는 경우만)】
+{documents_evidence_block}
+
+【지침】
+1. 이번 세션에서 사용자가 어느 영역에서 흔들렸는지 200~400자 마크다운으로 요약.
+2. 톤은 "판정" 보다 "흔들린 것으로 보입니다", "관련 해설을 먼저 확인한 뒤 ..." 같이 부드럽게.
+3. **위 정량 데이터에 박힌 정수 (예: 오답 1건, 모르겠음 83건) 외의 수치는 절대 언급 금지**:
+   - 정답률 N% 같은 비율
+   - 최근/지난 N일 추세
+   - X~Y 문항 같은 범위 추천
+   - 회차 카운트 추정
+   - 날짜 표현
+4. 참고 자료 블록이 비어있거나 부족하면 그 사실을 짧게 명시 ("자료 근거가 부족합니다").
+   자료가 없어도 세션 기록 자체로 흔들린 영역 요약은 작성한다.
+5. confidence 는 출력 근거 강도에 따라 high/medium/low 중 하나:
+   - high: 자료 + 다른 ai_explanation 으로 패턴이 명확
+   - medium: 일부 근거 + 일반 지식 보강
+   - low: 자료 부족, 세션 기록만 기반
+6. 추천은 "관련 해설을 다시 보세요" / "같은 영역 문제를 더 풀어보세요" 같은 일반 권장만.
+   구체 행동 지시 (몇 분 / 몇 문항 / 며칠 후) 는 금지.
+
+【출력 형식 — raw JSON 한 객체. 메타 설명 / 코드 펜스 / 인사 없이.】
+{{"summary_md": "<200~400자 마크다운>", "confidence": "<high|medium|low>"}}
@@ -0,0 +1,28 @@
+당신은 한국 기사시험(가스기사·산업안전기사 등) 학습 보조 AI 입니다.
+사용자가 모르겠다고 표시한 문제의 분야에 대한 학습 자료를 작성합니다.
+
+【분야】
+과목: {subject}
+범위: {scope}
+
+【참고 자료 — 우선순위】
+
+▼ 자료 (1순위: 자료실 매핑 문서)
+{documents_evidence_block}
+
+▼ 같은 분야의 다른 문제·해설 (2순위: 보조 근거)
+{questions_evidence_block}
+
+【지침】
+1. 분야 핵심 개념을 200~500자로 정리.
+2. 자주 등장하는 공식·표준값·법령 조항이 자료에 있으면 인용 ([자료: 제목]).
+3. 학습 노트 형태 — 이 분야 처음 접하는 사용자가 "큰 그림"을 잡을 수 있게.
+4. 정답을 단정하지 말고 개념 위주로 (특정 문제 풀이가 아닌 분야 설명).
+5. **할루시네이션 방지 (절대 규칙)**:
+   - 자료에 없는 수치(예: "0.5 MPa", "10 mg/L")·공식·표준 번호(예: "KS B 6750", "ASME Section VIII")·법령 조항은 새로 만들어내지 않는다.
+   - 자료에서 확인되지 않는 내용은 "자료에서 확인되지 않음" 으로 명시한다.
+   - "보통 ~이다", "일반적으로 ~이다" 같은 모호한 단정도 자료 근거가 없으면 사용하지 않는다.
+6. 한국어. 마크다운(굵게·리스트) 사용 가능.
+7. 메타 설명·인사 없이 학습 자료만 출력.
+
+【학습 자료】
@@ -0,0 +1,42 @@
+You are a grounding verifier. Given an answer and its evidence sources, check if the answer contradicts or fabricates information. Respond ONLY in JSON.
+
+## Contradiction Types (IMPORTANT — severity depends on type)
+- **direct_negation** (CRITICAL): Answer directly contradicts evidence. Examples: evidence "의무" but answer "권고"; evidence "금지" but answer "허용"; negation reversal ("~해야 한다" vs "~할 필요 없다").
+- **numeric_conflict**: Answer states a number different from evidence. "50명" in evidence but "100명" in answer. Only flag if the same concept is referenced. severity=critical when the number is the CORE answered quantity (amount/count/rate/date/duration that the query asked for); severity=minor when the number is peripheral (e.g., example/footnote).
+- **intent_core_mismatch**: Answer addresses a fundamentally different topic than the query asked about.
+- **nuance**: Answer overgeneralizes or adds qualifiers not in evidence (e.g., "모든" when evidence says "일부").
+- **unsupported_claim**: Answer makes a factual claim with no basis in any evidence.
+
+## Rules
+1. Compare each claim in the answer against the cited evidence. A claim with [n] citation should be checked against evidence [n].
+2. NOT a contradiction: Paraphrasing, summarizing, or restating the same fact in different words. Korean formal/informal style (합니다/한다) differences.
+3. Numbers must match exactly after normalization (1,000 = 1000). Range values (e.g., "100~200명") satisfy any answer within range.
+4. Legal/regulatory terms must preserve original meaning (의무 ≠ 권고, 금지 ≠ 제한, 허용 ≠ 금지).
+5. Maximum 5 contradictions (most severe first: direct_negation > numeric_conflict > intent_core_mismatch > nuance > unsupported_claim).
+
+## Output Schema
+{
+  "contradictions": [
+    {
+      "type": "direct_negation" | "numeric_conflict" | "intent_core_mismatch" | "nuance" | "unsupported_claim",
+      "severity": "critical" | "minor",
+      "claim": "answer 내 해당 구절 (50자 이내)",
+      "evidence_ref": "대응 근거 내용 (50자 이내, [n] 포함)",
+      "explanation": "모순 이유 (한국어, 30자 이내)"
+    }
+  ],
+  "verdict": "clean" | "minor_issues" | "major_issues"
+}
+
+severity mapping:
+- direct_negation → "critical"
+- numeric_conflict → "critical" if the number is the CORE answered quantity, else "minor"
+- All other types → "minor"
+
+If no contradictions: {"contradictions": [], "verdict": "clean"}
+
+## Answer
+{answer}
+
+## Evidence
+{numbered_evidence}
@@ -16,3 +16,8 @@ markdown>=3.5.0
 python-multipart>=0.0.9
 jinja2>=3.1.0
 feedparser>=6.0.0
+pymupdf>=1.24.0
+# Web/Blog ingest (devonagent 트랙) — HTML 본문 정화 4-tier fallback
+trafilatura>=1.12.0
+readability-lxml>=0.8.1
+markdownify>=0.13.1
@@ -0,0 +1,80 @@
+"""야간 뉴스 topic-first 클러스터링.
+
+Phase 4 와 axis 반대: country 별 cluster 가 아닌 **전체 doc 합쳐서 topic cluster**.
+각 cluster 안에 country 분포가 자동으로 들어감 (doc dict 의 country field).
+
+파라미터 (5h 윈도우용):
+- LAMBDA = ln(2)/2h ≈ 0.347 (2시간 반감기, 야간 5h 윈도우라 빠른 감쇠)
+- threshold = 0.70 (2026-05-13 조정 — 0.78 에서 spread case kept=1 발생 후 완화)
+- MIN_ARTICLES_PER_TOPIC = 2 (야간 sparse 대비 완화)
+- MIN_COUNTRIES_PER_TOPIC = 2 (cross-country 가치 핵심)
+- MAX_TOPICS = 7 (1페이지 분량)
+"""
+
+import math
+
+from core.utils import setup_logger
+from services.clustering_common import (
+    greedy_assign_cluster,
+    normalize_importance_scores,
+)
+
+logger = setup_logger("briefing_clustering")
+
+LAMBDA = math.log(2) / (2.0 / 24.0)   # 2시간 반감기 (단위: 일)
+THRESHOLD = 0.70
+CENTROID_ALPHA = 0.7
+MIN_ARTICLES_PER_TOPIC = 2
+MIN_COUNTRIES_PER_TOPIC = 2
+MAX_TOPICS = 7
+
+
+def _count_distinct_countries(cluster: dict) -> int:
+    return len({m.get("country") for m in cluster["members"] if m.get("country")})
+
+
+def cluster_global(docs: list[dict]) -> list[dict]:
+    """모든 country docs 를 합쳐 topic cluster 생성.
+
+    Args:
+        docs: loader.load_night_window 의 출력 (각 dict 에 country field 포함).
+
+    Returns:
+        [{centroid, members, weight_sum, raw_weight_sum, importance_score, country_count}, ...]
+        - MIN_ARTICLES + MIN_COUNTRIES 둘 다 충족 cluster 만
+        - importance_score 내림차순, MAX_TOPICS 개 cap
+    """
+    if not docs:
+        logger.info("[briefing] docs=0 → skip")
+        return []
+
+    clusters, raw_count = greedy_assign_cluster(
+        docs,
+        threshold=THRESHOLD,
+        centroid_alpha=CENTROID_ALPHA,
+        min_articles=MIN_ARTICLES_PER_TOPIC,
+        max_topics=MAX_TOPICS * 4,  # MIN_COUNTRIES 필터 전 buffer
+        lambda_val=LAMBDA,
+    )
+
+    # MIN_COUNTRIES_PER_TOPIC 필터 — single-country cluster drop
+    pre_country_filter = len(clusters)
+    filtered = []
+    for c in clusters:
+        cc = _count_distinct_countries(c)
+        if cc >= MIN_COUNTRIES_PER_TOPIC:
+            c["country_count"] = cc
+            filtered.append(c)
+    clusters = filtered[:MAX_TOPICS]
+    dropped_country = pre_country_filter - len(clusters)
+    dropped_min_articles = raw_count - pre_country_filter
+
+    # MIN_COUNTRIES + MAX_TOPICS 필터 후 importance 재정규화 (briefing 내 0~1)
+    normalize_importance_scores(clusters)
+
+    logger.info(
+        f"[briefing] docs={len(docs)} threshold={THRESHOLD} "
+        f"raw_clusters={raw_count} dropped_min_articles={dropped_min_articles} "
+        f"dropped_single_country={dropped_country} kept={len(clusters)}"
+    )
+    return clusters
@@ -0,0 +1,307 @@
+"""Cluster → 26B MLX 비교 분석 호출 + JSON envelope + historical context + fallback row.
+
+Plan §"LLM Parse 실패 시 Fallback Topic Row (고정 형태)":
+LLM JSON parse 2회 재시도 후 실패 → 고정 형태 fallback 저장 (drop 금지).
+
+Plan §"Historical Context":
+BRIEFING_HISTORICAL_ENABLED=true 시 cluster centroid 와 historical candidate
+cosine top-K 5 (similarity ≥0.70) 추출 → 프롬프트 {historical_block} 주입.
+LLM 응답 envelope 의 historical_context 옵션 필드.
+"""
+
+import asyncio
+import json
+import os
+from pathlib import Path
+from typing import Any
+
+import numpy as np
+
+from ai.client import parse_json_response
+from core.utils import setup_logger
+from services.clustering_common import normalize_vector
+
+logger = setup_logger("briefing_comparator")
+
+LLM_CALL_TIMEOUT = 25                 # 초. Phase 4 와 동일
+HISTORICAL_TOP_K = 5
+HISTORICAL_SIMILARITY_MIN = 0.70
+HISTORICAL_WINDOW_DAYS = 30
+
+# JSON envelope cap (프롬프트 + 후처리 양쪽 강제)
+MAX_PERSPECTIVES = 10
+MAX_DIVERGENCES = 3
+MAX_CONVERGENCES = 2
+MAX_KEY_QUOTES = 5
+MAX_PERSPECTIVE_SUMMARY_LEN = 240     # 한국어 1~2문장 ≤120자 × 2
+MAX_HISTORICAL_CONTEXT_LEN = 240
+MAX_ARTICLE_IDS_PER_COUNTRY = 5       # country_perspectives[].article_ids 후처리 cap
+FALLBACK_HEADLINE = "LLM 분석 실패로 원문 기사 묶음만 표시합니다."
+FALLBACK_TOPIC_LABEL = "주요 뉴스 묶음"
+
+_llm_sem = asyncio.Semaphore(1)
+_PROMPT_PATH = Path(__file__).resolve().parent.parent.parent / "prompts" / "briefing_comparative.txt"
+_PROMPT_TEMPLATE: str | None = None
+
+
+def historical_enabled() -> bool:
+    return os.environ.get("BRIEFING_HISTORICAL_ENABLED", "false").lower() in {"1", "true", "yes"}
+
+
+def _load_prompt() -> str:
+    global _PROMPT_TEMPLATE
+    if _PROMPT_TEMPLATE is None:
+        _PROMPT_TEMPLATE = _PROMPT_PATH.read_text(encoding="utf-8")
+    return _PROMPT_TEMPLATE
+
+
+def _build_articles_block(selected: list[dict]) -> str:
+    lines = []
+    for i, m in enumerate(selected, start=1):
+        country = m.get("country") or "??"
+        source = m.get("ai_sub_group") or ""
+        text = (m.get("ai_summary_truncated") or m.get("ai_summary") or m.get("title") or "").strip()
+        lines.append(f"[{i}] ({country} · {source}) {text}")
+    return "\n".join(lines)
+
+
+def _build_historical_block(historical_docs: list[dict]) -> str:
+    if not historical_docs:
+        return "(과거 참고 자료 없음)"
+    lines = ["※ 이전 30일 흐름 참고용 — 본 분석에서 직접 인용 금지, 맥락 파악 용도."]
+    for i, d in enumerate(historical_docs, start=1):
+        text = (d.get("ai_summary") or d.get("title") or "").strip()
+        # historical 은 ai_summary 가 길 수 있어 200자 cap
+        if len(text) > 200:
+            text = text[:200] + "…"
+        lines.append(f"[H{i}] {text}")
+    return "\n".join(lines)
+
+
+def build_prompt(selected: list[dict], historical_docs: list[dict]) -> str:
+    template = _load_prompt()
+    articles_block = _build_articles_block(selected)
+    historical_block = _build_historical_block(historical_docs)
+    return template.replace("{articles_block}", articles_block).replace(
+        "{historical_block}", historical_block
+    )
+
+
+def retrieve_historical(
+    cluster: dict,
+    candidates: list[dict],
+    *,
+    top_k: int = HISTORICAL_TOP_K,
+    sim_min: float = HISTORICAL_SIMILARITY_MIN,
+) -> list[dict]:
+    """cluster centroid 와 candidate pool 의 cosine top-K (sim ≥ sim_min).
+
+    candidates 가 비어있거나 sim 미달 시 빈 list.
+    """
+    if not candidates:
+        return []
+    centroid = cluster["centroid"]
+    scored = []
+    for d in candidates:
+        v = normalize_vector(d["embedding"])
+        sim = float(np.dot(centroid, v))
+        if sim >= sim_min:
+            scored.append((sim, d))
+    scored.sort(key=lambda x: -x[0])
+    return [d for _, d in scored[:top_k]]
+
+
+async def _try_call_llm(client: Any, prompt: str) -> str:
+    async with _llm_sem:
+        return await asyncio.wait_for(
+            client.call_primary(prompt),
+            timeout=LLM_CALL_TIMEOUT,
+        )
+
+
+def _truncate_str(s: Any, limit: int) -> str:
+    if not isinstance(s, str):
+        return ""
+    s = s.strip()
+    if len(s) > limit:
+        s = s[:limit].rstrip() + "…"
+    return s
+
+
+def _country_article_id_map(cluster: dict) -> dict[str, list[int]]:
+    """cluster.members 를 country 별 article_id list 로 그룹 (weight 내림차순).
+
+    Phase 4 selection 단계에서 m['weight'] 가 채워져 있음. 누락 시 0.0 으로 fallback.
+    """
+    grouped: dict[str, list[tuple[float, int]]] = {}
+    for m in cluster.get("members", []):
+        country = (m.get("country") or "").upper()
+        if not country:
+            continue
+        weight = float(m.get("weight", 0.0))
+        grouped.setdefault(country, []).append((weight, int(m["id"])))
+    out: dict[str, list[int]] = {}
+    for country, pairs in grouped.items():
+        pairs.sort(key=lambda x: -x[0])
+        out[country] = [doc_id for _, doc_id in pairs]
+    return out
+
+
+def _resolve_article_ids(
+    raw_ids: list,
+    country: str,
+    cluster_country_ids: dict[str, list[int]],
+) -> list[int]:
+    """country_perspectives[].article_ids 후처리.
+
+    1) LLM 이 준 id 가 cluster member 와 교집합인 것만 유지 (엉뚱한 id 차단).
+    2) 비어있으면 같은 country 의 cluster member top weight N 개 자동 주입.
+    3) 그래도 없으면 [] (country 매핑된 member 부재).
+    """
+    cluster_ids = cluster_country_ids.get(country, [])
+    cluster_id_set = set(cluster_ids)
+
+    # 1) LLM id ∩ cluster
+    cleaned = []
+    if isinstance(raw_ids, list):
+        for x in raw_ids:
+            try:
+                doc_id = int(x)
+            except (TypeError, ValueError):
+                continue
+            if doc_id in cluster_id_set and doc_id not in cleaned:
+                cleaned.append(doc_id)
+    if cleaned:
+        return cleaned[:MAX_ARTICLE_IDS_PER_COUNTRY]
+
+    # 2) Country fallback top-N
+    return cluster_ids[:MAX_ARTICLE_IDS_PER_COUNTRY]
+
+
+def _sanitize_envelope(parsed: dict, cluster: dict) -> dict | None:
+    """LLM 응답 envelope 검증 + cap 강제 + article_ids 후처리. None → fallback."""
+    if not isinstance(parsed, dict):
+        return None
+
+    topic_label = _truncate_str(parsed.get("topic_label"), 120)
+    headline = _truncate_str(parsed.get("headline"), 200)
+    if not topic_label or not headline:
+        return None
+
+    # cluster.members 의 country → [id] 매핑을 미리 만들어 후처리 input 으로 사용
+    country_ids_map = _country_article_id_map(cluster)
+
+    # country_perspectives
+    raw_persp = parsed.get("country_perspectives")
+    perspectives = []
+    if isinstance(raw_persp, list):
+        for p in raw_persp[:MAX_PERSPECTIVES]:
+            if not isinstance(p, dict):
+                continue
+            country = _truncate_str(p.get("country"), 10).upper()
+            summary = _truncate_str(p.get("summary"), MAX_PERSPECTIVE_SUMMARY_LEN)
+            raw_ids = p.get("article_ids") or []
+            article_ids = _resolve_article_ids(raw_ids, country, country_ids_map)
+            if country and summary:
+                perspectives.append({
+                    "country": country,
+                    "summary": summary,
+                    "article_ids": article_ids,
+                })
+    if not perspectives:
+        return None
+
+    def _str_array(key: str, cap: int, item_limit: int) -> list[str]:
+        raw = parsed.get(key)
+        if not isinstance(raw, list):
+            return []
+        out = []
+        for it in raw[:cap]:
+            t = _truncate_str(it, item_limit)
+            if t:
+                out.append(t)
+        return out
+
+    divergences = _str_array("divergences", MAX_DIVERGENCES, 200)
+    convergences = _str_array("convergences", MAX_CONVERGENCES, 200)
+
+    # key_quotes: [{country, source, quote}]
+    raw_quotes = parsed.get("key_quotes")
+    quotes = []
+    if isinstance(raw_quotes, list):
+        for q in raw_quotes[:MAX_KEY_QUOTES]:
+            if not isinstance(q, dict):
+                continue
+            entry = {
+                "country": _truncate_str(q.get("country"), 10).upper(),
+                "source": _truncate_str(q.get("source"), 60),
+                "quote": _truncate_str(q.get("quote"), 240),
+            }
+            if entry["quote"]:
+                quotes.append(entry)
+
+    historical_context = _truncate_str(parsed.get("historical_context"), MAX_HISTORICAL_CONTEXT_LEN) or None
+
+    return {
+        "topic_label": topic_label,
+        "headline": headline,
+        "country_perspectives": perspectives,
+        "divergences": divergences,
+        "convergences": convergences,
+        "key_quotes": quotes,
+        "historical_context": historical_context,
+        "llm_fallback_used": False,
+    }
+
+
+def _make_fallback(cluster: dict) -> dict:
+    """Plan §"Fallback Topic Row (고정 형태)". drop 금지, country_perspectives 빈 list."""
+    return {
+        "topic_label": FALLBACK_TOPIC_LABEL,
+        "headline": FALLBACK_HEADLINE,
+        "country_perspectives": [],
+        "divergences": [],
+        "convergences": [],
+        "key_quotes": [],
+        "historical_context": None,
+        "llm_fallback_used": True,
+    }
+
+
+async def compare_cluster_with_fallback(
+    client: Any,
+    cluster: dict,
+    selected: list[dict],
+    historical_docs: list[dict] | None = None,
+) -> dict:
+    """1 cluster 비교 분석. LLM 2회 재시도 → 실패 시 fallback row.
+
+    Returns:
+        sanitized envelope dict (Plan §"LLM 프롬프트 출력 envelope") + llm_fallback_used.
+    """
+    historical_docs = historical_docs or []
+    prompt = build_prompt(selected, historical_docs)
+
+    for attempt in range(2):
+        try:
+            raw = await _try_call_llm(client, prompt)
+        except asyncio.TimeoutError:
+            logger.warning(
+                f"LLM timeout {LLM_CALL_TIMEOUT}s "
+                f"(attempt={attempt + 1}, cluster size={len(cluster['members'])})"
+            )
+            continue
+        except Exception as e:
+            logger.warning(f"LLM 호출 실패 attempt={attempt + 1}: {e}")
+            continue
+
+        parsed = parse_json_response(raw)
+        sanitized = _sanitize_envelope(parsed, cluster) if parsed else None
+        if sanitized:
+            return sanitized
+        logger.warning(
+            f"envelope 검증 실패 attempt={attempt + 1} "
+            f"(raw_len={len(raw) if raw else 0}, parsed_keys={list(parsed.keys()) if isinstance(parsed, dict) else None})"
+        )
+
+    return _make_fallback(cluster)
@@ -0,0 +1,199 @@
+"""야간 5h 수집 뉴스 윈도우 로드 + country 정규화 + (옵션) 과거 N일 후보 로드.
+
+- KST 자정~05:00 사이 수집된 documents (source_channel='news' OR ai_domain='News').
+- country canonical = document_chunks.country first non-null → news_sources prefix fallback (Phase 4 동일).
+- ai_summary/embedding NULL 제외 (재요약/재임베딩 0회 원칙).
+- 반환: doc dict 의 list (topic-first cluster 입력. country 는 각 dict 의 field).
+- 과거 retrieval 용 historical doc 후보는 별도 함수 (BRIEFING_HISTORICAL_ENABLED on 시).
+"""
+
+from datetime import datetime
+from typing import Any
+
+import numpy as np
+from sqlalchemy import text
+
+from core.database import async_session
+from core.utils import setup_logger
+
+logger = setup_logger("briefing_loader")
+
+
+_NEWS_WINDOW_SQL = text("""
+    SELECT
+        d.id,
+        d.title,
+        d.ai_summary,
+        d.embedding,
+        d.created_at,
+        d.edit_url,
+        d.ai_sub_group,
+        (
+            SELECT c.country
+            FROM document_chunks c
+            WHERE c.doc_id = d.id AND c.country IS NOT NULL
+            LIMIT 1
+        ) AS chunk_country
+    FROM documents d
+    WHERE (d.source_channel = 'news' OR d.ai_domain = 'News')
+      AND d.deleted_at IS NULL
+      AND d.created_at >= :window_start
+      AND d.created_at < :window_end
+      AND d.embedding IS NOT NULL
+      AND d.ai_summary IS NOT NULL
+""")
+
+
+_SOURCE_COUNTRY_SQL = text("""
+    SELECT name, country FROM news_sources WHERE country IS NOT NULL
+""")
+
+
+_HISTORICAL_CANDIDATES_SQL = text("""
+    SELECT
+        d.id,
+        d.title,
+        d.ai_summary,
+        d.embedding,
+        d.created_at
+    FROM documents d
+    WHERE (d.source_channel = 'news' OR d.ai_domain = 'News')
+      AND d.deleted_at IS NULL
+      AND d.created_at >= :hist_start
+      AND d.created_at < :hist_end
+      AND d.embedding IS NOT NULL
+      AND d.ai_summary IS NOT NULL
+""")
+
+
+def _to_numpy_embedding(raw: Any) -> np.ndarray | None:
+    if raw is None:
+        return None
+    if isinstance(raw, str):
+        import json
+        try:
+            raw = json.loads(raw)
+        except json.JSONDecodeError:
+            return None
+    try:
+        arr = np.asarray(raw, dtype=np.float32)
+    except (TypeError, ValueError):
+        return None
+    if arr.size == 0:
+        return None
+    return arr
+
+
+async def _load_source_country_map(session) -> dict[str, str]:
+    """news_sources name → country prefix 매핑 (Phase 4 패턴 미러)."""
+    rows = await session.execute(_SOURCE_COUNTRY_SQL)
+    mapping: dict[str, str] = {}
+    for name, country in rows:
+        if not name or not country:
+            continue
+        prefix = name.split(" ")[0].strip()
+        if prefix and prefix not in mapping:
+            mapping[prefix] = country
+        tokens = name.split(" ")
+        if len(tokens) >= 3:
+            source_prefix = " ".join(tokens[:-1]).strip()
+            if source_prefix and source_prefix not in mapping:
+                mapping[source_prefix] = country
+    return mapping
+
+
+async def load_night_window(
+    window_start: datetime,
+    window_end: datetime,
+) -> list[dict]:
+    """야간 윈도우 뉴스 docs 를 country 채워진 list 로 반환.
+
+    Returns:
+        [{id, title, ai_summary, embedding, created_at, edit_url, ai_sub_group, country}, ...]
+        country 매핑 실패한 doc 은 drop (cross-country 비교가 핵심이므로).
+    """
+    docs: list[dict] = []
+    null_country = 0
+
+    async with async_session() as session:
+        source_country = await _load_source_country_map(session)
+
+        result = await session.execute(
+            _NEWS_WINDOW_SQL,
+            {"window_start": window_start, "window_end": window_end},
+        )
+        for row in result.mappings():
+            embedding = _to_numpy_embedding(row["embedding"])
+            if embedding is None:
+                continue
+
+            country = row["chunk_country"]
+            if not country:
+                ai_sub_group = (row["ai_sub_group"] or "").strip()
+                if ai_sub_group:
+                    country = source_country.get(ai_sub_group)
+            if not country:
+                null_country += 1
+                continue
+
+            docs.append({
+                "id": int(row["id"]),
+                "title": row["title"] or "",
+                "ai_summary": row["ai_summary"] or "",
+                "embedding": embedding,
+                "created_at": row["created_at"],
+                "edit_url": row["edit_url"] or "",
+                "ai_sub_group": row["ai_sub_group"] or "",
+                "country": country.upper(),
+            })
+
+    if null_country:
+        logger.warning(
+            f"[loader] country 매핑 실패 drop {null_country}건 "
+            f"(chunk_country + news_sources prefix 둘 다 fail)"
+        )
+    logger.info(
+        f"[loader] night window {window_start} ~ {window_end} → "
+        f"{len(docs)}건 ({len({d['country'] for d in docs})}개 국가)"
+    )
+    return docs
+
+
+async def load_historical_candidates(
+    hist_start: datetime,
+    hist_end: datetime,
+    exclude_ids: set[int],
+) -> list[dict]:
+    """과거 N일 doc 후보 (BRIEFING_HISTORICAL_ENABLED=true 시만 호출).
+
+    cluster centroid 와 cosine 비교용 raw candidate pool. country 매핑 안 함
+    (LLM 분석 input 으로만 사용하고 표시 안 함).
+
+    Args:
+        exclude_ids: 오늘 윈도우 article id (중복 retrieval 회피).
+
+    Returns:
+        [{id, title, ai_summary, embedding, created_at}, ...]
+    """
+    out: list[dict] = []
+    async with async_session() as session:
+        result = await session.execute(
+            _HISTORICAL_CANDIDATES_SQL,
+            {"hist_start": hist_start, "hist_end": hist_end},
+        )
+        for row in result.mappings():
+            doc_id = int(row["id"])
+            if doc_id in exclude_ids:
+                continue
+            embedding = _to_numpy_embedding(row["embedding"])
+            if embedding is None:
+                continue
+            out.append({
+                "id": doc_id,
+                "title": row["title"] or "",
+                "ai_summary": row["ai_summary"] or "",
+                "embedding": embedding,
+                "created_at": row["created_at"],
+            })
+    logger.info(f"[loader] historical candidates: {len(out)} docs (window {hist_start.date()} ~ {hist_end.date()})")
+    return out
@@ -0,0 +1,261 @@
+"""야간 수집 뉴스 브리핑 파이프라인 (Plan §"PR-MorningBriefing-1 Backend").
+
+흐름: load_night_window → cluster_global → select_for_llm (k=7) →
+       (옵션) historical retrieval → compare_cluster_with_fallback → DB save.
+
+regenerate 정책: briefing_date UNIQUE 충돌 시 transaction 안에서 DELETE+INSERT.
+"""
+
+import time
+from datetime import date, datetime, timedelta, timezone
+from typing import Any
+from zoneinfo import ZoneInfo
+
+from sqlalchemy import delete
+
+from ai.client import AIClient
+from core.database import async_session
+from core.utils import setup_logger
+from models.briefing import BriefingTopic, MorningBriefing
+from services.briefing.clustering import LAMBDA, cluster_global
+from services.briefing.comparator import (
+    HISTORICAL_WINDOW_DAYS,
+    compare_cluster_with_fallback,
+    historical_enabled,
+    retrieve_historical,
+)
+from services.briefing.loader import load_historical_candidates, load_night_window
+from services.digest.selection import select_for_llm
+
+logger = setup_logger("briefing_pipeline")
+
+KST = ZoneInfo("Asia/Seoul")
+NIGHT_WINDOW_HOURS = 5             # KST 00:00 ~ 05:00
+SELECT_K = 7                       # Plan §"Clustering 파라미터" briefing K_PER_CLUSTER=7
+SELECT_LAMBDA_MMR = 0.6            # Plan briefing MMR lambda 0.6
+PIPELINE_HARD_CAP = 600            # 초. Phase 4 와 동일
+
+
+def _compute_window(target_date: date | None = None) -> tuple[datetime, datetime, date]:
+    """target_date (KST 자정 시작일) → (window_start_utc, window_end_utc, kst_date).
+
+    target_date=None 시 오늘 KST.
+    """
+    if target_date is None:
+        target_date = datetime.now(KST).date()
+    start_kst = datetime.combine(target_date, datetime.min.time(), tzinfo=KST)
+    end_kst = start_kst + timedelta(hours=NIGHT_WINDOW_HOURS)
+    return start_kst.astimezone(timezone.utc), end_kst.astimezone(timezone.utc), target_date
+
+
+def _is_usable_topic(envelope: dict, topic_label: str) -> bool:
+    """fallback row 가 아닌 진짜 LLM 결과인지 판정."""
+    if envelope.get("llm_fallback_used"):
+        return False
+    if not envelope.get("country_perspectives"):
+        return False
+    if topic_label == "주요 뉴스 묶음":
+        return False
+    return True
+
+
+def _compute_status(llm_calls: int, fallback_count: int, usable_count: int, has_topics: bool) -> str:
+    """Plan §"Status 4-state 판정표"."""
+    if not has_topics or llm_calls == 0:
+        return "empty"
+    if usable_count == 0:
+        return "failed"
+    fallback_pct = (fallback_count / llm_calls) if llm_calls else 0.0
+    if fallback_pct >= 0.5:
+        return "failed"
+    if fallback_count > 0 or usable_count < llm_calls:
+        return "partial"
+    return "success"
+
+
+def _build_topic_row(
+    rank: int,
+    cluster: dict,
+    envelope: dict,
+    historical_docs: list[dict] | None,
+    primary_model: str,
+) -> BriefingTopic:
+    historical_ids = None
+    historical_window = None
+    if historical_enabled():
+        historical_ids = [d["id"] for d in (historical_docs or [])]
+        historical_window = HISTORICAL_WINDOW_DAYS
+
+    return BriefingTopic(
+        topic_rank=rank,
+        topic_label=envelope["topic_label"],
+        headline=envelope["headline"],
+        country_perspectives=envelope["country_perspectives"],
+        divergences=envelope["divergences"],
+        convergences=envelope["convergences"],
+        key_quotes=envelope["key_quotes"],
+        historical_article_ids=historical_ids,
+        historical_context=envelope.get("historical_context"),
+        historical_window_days=historical_window,
+        cluster_members=[m["id"] for m in cluster["members"]],
+        article_count=len(cluster["members"]),
+        country_count=cluster.get("country_count", 0),
+        importance_score=cluster.get("importance_score", 0.0),
+        raw_weight_sum=cluster.get("raw_weight_sum", 0.0),
+        llm_model=primary_model,
+        llm_fallback_used=envelope.get("llm_fallback_used", False),
+    )
+
+
+async def _save_briefing(
+    briefing_date: date,
+    window_start: datetime,
+    window_end: datetime,
+    total_articles: int,
+    total_countries: int,
+    topic_rows: list[BriefingTopic],
+    llm_calls: int,
+    llm_failures: int,
+    generation_ms: int,
+    status: str,
+) -> int:
+    """briefing_date UNIQUE 충돌은 DELETE+INSERT transaction 으로 처리."""
+    async with async_session() as session:
+        await session.execute(
+            delete(MorningBriefing).where(MorningBriefing.briefing_date == briefing_date)
+        )
+        new = MorningBriefing(
+            briefing_date=briefing_date,
+            window_start=window_start,
+            window_end=window_end,
+            decay_lambda=LAMBDA,
+            total_articles=total_articles,
+            total_countries=total_countries,
+            total_topics=len(topic_rows),
+            generation_ms=generation_ms,
+            llm_calls=llm_calls,
+            llm_failures=llm_failures,
+            status=status,
+        )
+        new.topics = topic_rows
+        session.add(new)
+        await session.commit()
+        return new.id
+
+
+async def run_briefing_pipeline(target_date: date | None = None) -> dict[str, Any]:
+    """야간 뉴스 브리핑 1회 실행. cron 또는 수동 regenerate API 에서 호출.
+
+    Returns:
+        {briefing_id, status, total_topics, total_articles, llm_calls, llm_failures, generation_ms, regenerated}
+    """
+    start = time.time()
+    window_start, window_end, briefing_date = _compute_window(target_date)
+    logger.info(
+        f"[briefing] start date={briefing_date} window {window_start} ~ {window_end} "
+        f"decay_lambda={LAMBDA:.4f} historical={'on' if historical_enabled() else 'off'}"
+    )
+
+    # 1. Load night window
+    docs = await load_night_window(window_start, window_end)
+    total_articles = len(docs)
+    total_countries_in_window = len({d["country"] for d in docs})
+
+    # 2. Cluster (topic-first)
+    clusters = cluster_global(docs)
+
+    if not clusters:
+        briefing_id = await _save_briefing(
+            briefing_date=briefing_date,
+            window_start=window_start,
+            window_end=window_end,
+            total_articles=total_articles,
+            total_countries=total_countries_in_window,
+            topic_rows=[],
+            llm_calls=0,
+            llm_failures=0,
+            generation_ms=int((time.time() - start) * 1000),
+            status="empty",
+        )
+        logger.info(f"[briefing] empty (no usable clusters) → briefing_id={briefing_id}")
+        return {
+            "briefing_id": briefing_id,
+            "status": "empty",
+            "total_topics": 0,
+            "total_articles": total_articles,
+            "llm_calls": 0,
+            "llm_failures": 0,
+            "generation_ms": int((time.time() - start) * 1000),
+            "regenerated": True,
+        }
+
+    # 3. (옵션) Historical candidate pool 1회 로드
+    historical_candidates: list[dict] = []
+    if historical_enabled():
+        hist_end = window_start  # 오늘 윈도우 직전까지
+        hist_start = hist_end - timedelta(days=HISTORICAL_WINDOW_DAYS)
+        exclude = {d["id"] for d in docs}
+        historical_candidates = await load_historical_candidates(hist_start, hist_end, exclude)
+
+    # 4. cluster 별 LLM 호출
+    client = AIClient()
+    primary_model = client.ai.primary.model
+    topic_rows: list[BriefingTopic] = []
+    llm_calls = 0
+    llm_failures = 0
+    usable_count = 0
+
+    try:
+        for rank, cluster in enumerate(clusters, start=1):
+            selected = select_for_llm(cluster, k=SELECT_K, lambda_mmr=SELECT_LAMBDA_MMR)
+            historical_docs = (
+                retrieve_historical(cluster, historical_candidates)
+                if historical_enabled() else []
+            )
+            llm_calls += 1
+            envelope = await compare_cluster_with_fallback(
+                client, cluster, selected, historical_docs=historical_docs
+            )
+            if envelope.get("llm_fallback_used"):
+                llm_failures += 1
+            if _is_usable_topic(envelope, envelope["topic_label"]):
+                usable_count += 1
+            topic_rows.append(
+                _build_topic_row(rank, cluster, envelope, historical_docs, primary_model)
+            )
+    finally:
+        await client.close()
+
+    generation_ms = int((time.time() - start) * 1000)
+    status = _compute_status(llm_calls, llm_failures, usable_count, has_topics=bool(topic_rows))
+
+    briefing_id = await _save_briefing(
+        briefing_date=briefing_date,
+        window_start=window_start,
+        window_end=window_end,
+        total_articles=total_articles,
+        total_countries=total_countries_in_window,
+        topic_rows=topic_rows,
+        llm_calls=llm_calls,
+        llm_failures=llm_failures,
+        generation_ms=generation_ms,
+        status=status,
+    )
+
+    fallback_pct = (llm_failures / llm_calls * 100.0) if llm_calls else 0.0
+    logger.info(
+        f"[briefing] done id={briefing_id} status={status} topics={len(topic_rows)} "
+        f"usable={usable_count}/{llm_calls} fallback={llm_failures}/{llm_calls} ({fallback_pct:.1f}%) "
+        f"elapsed={generation_ms / 1000:.1f}s"
+    )
+
+    return {
+        "briefing_id": briefing_id,
+        "status": status,
+        "total_topics": len(topic_rows),
+        "total_articles": total_articles,
+        "llm_calls": llm_calls,
+        "llm_failures": llm_failures,
+        "generation_ms": generation_ms,
+        "regenerated": True,
+    }
@@ -0,0 +1,124 @@
+"""Cluster 알고리즘 공통 util — digest(country×topic) / briefing(topic×country) 양쪽이 import.
+
+추출 원칙:
+- digest.clustering.cluster_country / briefing.clustering.cluster_global 의 country 축은 caller 책임.
+- 본 모듈은 docs list (이미 분류된 슬라이스 또는 전체) 에 대한 순수 greedy assign + normalize.
+- LAMBDA / threshold / EMA alpha / MIN_ARTICLES 는 caller 가 주입 (Phase 4 = 3일 / Briefing = 2시간 등).
+"""
+
+import math
+from datetime import datetime, timezone
+
+import numpy as np
+
+
+SCORE_FLOOR = 0.01
+
+
+def normalize_vector(v: np.ndarray) -> np.ndarray:
+    norm = float(np.linalg.norm(v))
+    if norm == 0.0:
+        return v
+    return v / norm
+
+
+def time_decay_weight(now: datetime, created_at: datetime, lambda_val: float) -> float:
+    """exp(-λ · days_ago). created_at naive → UTC 가정."""
+    if created_at.tzinfo is None:
+        created_at = created_at.replace(tzinfo=timezone.utc)
+    days = (now - created_at).total_seconds() / 86400.0
+    if days < 0:
+        days = 0.0
+    return math.exp(-lambda_val * days)
+
+
+def adaptive_threshold_by_density(
+    n_docs: int,
+    *,
+    low_n: int = 50,
+    high_n: int = 200,
+    t_low: float = 0.75,
+    t_mid: float = 0.78,
+    t_high: float = 0.80,
+) -> float:
+    """문서 밀도 기반 동적 threshold — fragmentation / blob 동시 방어."""
+    if n_docs > high_n:
+        return t_high
+    if n_docs < low_n:
+        return t_low
+    return t_mid
+
+
+def greedy_assign_cluster(
+    docs: list[dict],
+    *,
+    threshold: float,
+    centroid_alpha: float = 0.7,
+    min_articles: int = 3,
+    max_topics: int = 10,
+    now: datetime | None = None,
+    lambda_val: float,
+) -> tuple[list[dict], int]:
+    """time-decay weight 적용 + greedy cosine assign + EMA centroid + MIN drop.
+
+    Args:
+        docs: [{embedding: np.ndarray, created_at: datetime, ...}]. 함수가 in-place 로 `weight` 키 추가.
+        threshold: cosine 유사도 cluster 병합 임계.
+        centroid_alpha: EMA 계수 (0.7 = 기존 70% 유지).
+        min_articles: cluster 당 최소 article 수 (미만 시 drop).
+        max_topics: 상위 cluster 보존 개수.
+        now: 기준 시각 (default = datetime.now(UTC)).
+        lambda_val: time-decay λ (caller 가 윈도우 폭에 맞게 주입).
+
+    Returns:
+        (clusters, raw_cluster_count_before_drop)
+        clusters = [{centroid, members, weight_sum, raw_weight_sum, importance_score}, ...]
+    """
+    if not docs:
+        return [], 0
+
+    now = now or datetime.now(timezone.utc)
+
+    for d in docs:
+        d["weight"] = time_decay_weight(now, d["created_at"], lambda_val)
+    docs_sorted = sorted(docs, key=lambda d: -d["weight"])
+
+    clusters: list[dict] = []
+    for d in docs_sorted:
+        v = normalize_vector(d["embedding"])
+        best_idx, best_sim = -1, 0.0
+        for i, c in enumerate(clusters):
+            sim = float(np.dot(c["centroid"], v))
+            if sim > best_sim and sim >= threshold:
+                best_sim, best_idx = sim, i
+        if best_idx >= 0:
+            c = clusters[best_idx]
+            c["centroid"] = centroid_alpha * c["centroid"] + (1.0 - centroid_alpha) * v
+            c["centroid"] = normalize_vector(c["centroid"])
+            c["members"].append(d)
+            c["weight_sum"] += d["weight"]
+        else:
+            clusters.append({
+                "centroid": v,
+                "members": [d],
+                "weight_sum": d["weight"],
+            })
+
+    raw_count = len(clusters)
+    clusters = [c for c in clusters if len(c["members"]) >= min_articles]
+    clusters.sort(key=lambda c: -c["weight_sum"])
+    clusters = clusters[:max_topics]
+
+    normalize_importance_scores(clusters)
+    return clusters, raw_count
+
+
+def normalize_importance_scores(clusters: list[dict], *, floor: float = SCORE_FLOOR) -> None:
+    """cluster.weight_sum 을 0~1 로 정규화 + floor. in-place. raw_weight_sum 보존."""
+    if not clusters:
+        return
+    max_w = max(c["weight_sum"] for c in clusters)
+    for c in clusters:
+        normalized = (c["weight_sum"] / max_w) if max_w > 0 else 0.0
+        c["raw_weight_sum"] = c["weight_sum"]
+        c["importance_score"] = max(normalized, floor)
@@ -0,0 +1 @@
+"""Phase 4 Global Digest 서비스 레이어 — 7일 뉴스 batch clustering + summarization."""
@@ -0,0 +1,52 @@
+"""Phase 4 Global Digest — country 내 topic cluster (time-decay + EMA + adaptive threshold).
+
+알고리즘 코어는 `app/services/clustering_common.py` 로 추출되어 briefing 모듈과 공유.
+본 파일은 Phase 4 고유 파라미터 (LAMBDA = ln(2)/3 일, MIN 3, MAX 10) 와 country 축 호출만 담당.
+"""
+
+import math
+
+from core.utils import setup_logger
+from services.clustering_common import (
+    adaptive_threshold_by_density,
+    greedy_assign_cluster,
+)
+
+logger = setup_logger("digest_clustering")
+
+LAMBDA = math.log(2) / 3        # 3일 반감기 — 사용자 확정값
+CENTROID_ALPHA = 0.7            # EMA: 기존 중심 70% 유지, 새 멤버 30% 반영
+MIN_ARTICLES_PER_TOPIC = 3
+MAX_TOPICS_PER_COUNTRY = 10
+
+
+def adaptive_threshold(n_docs: int) -> float:
+    """Phase 4 임계 (0.75 / 0.78 / 0.80). 외부 import 호환용 alias."""
+    return adaptive_threshold_by_density(n_docs)
+
+
+def cluster_country(country: str, docs: list[dict]) -> list[dict]:
+    """단일 country 의 docs 를 cluster 로 묶어 정렬 + normalize 후 반환.
+
+    공통 util `greedy_assign_cluster` 위에 country 라벨 로깅만 추가.
+    """
+    if not docs:
+        logger.info(f"[{country}] docs=0 → skip")
+        return []
+
+    threshold = adaptive_threshold(len(docs))
+    clusters, raw_count = greedy_assign_cluster(
+        docs,
+        threshold=threshold,
+        centroid_alpha=CENTROID_ALPHA,
+        min_articles=MIN_ARTICLES_PER_TOPIC,
+        max_topics=MAX_TOPICS_PER_COUNTRY,
+        lambda_val=LAMBDA,
+    )
+    dropped = raw_count - len(clusters)
+
+    logger.info(
+        f"[{country}] docs={len(docs)} threshold={threshold} "
+        f"raw_clusters={raw_count} dropped={dropped} kept={len(clusters)}"
+    )
+    return clusters
@@ -0,0 +1,160 @@
+"""뉴스 7일 window 로드 + country 정규화
+
+- documents 테이블엔 country 컬럼이 없으므로 document_chunks.country 를 first non-null 로 조인.
+- chunk-level country 도 NULL 이면 news_sources.name prefix(ai_sub_group) 매칭으로 fallback.
+- 그래도 NULL 이면 drop(로그 경고).
+- ai_summary / embedding 이 NULL 이면 처음부터 제외 (재요약/재임베딩 0회 원칙).
+"""
+
+from collections import defaultdict
+from datetime import datetime
+from typing import Any
+
+import numpy as np
+from sqlalchemy import text
+
+from core.database import async_session
+from core.utils import setup_logger
+
+logger = setup_logger("digest_loader")
+
+
+_NEWS_WINDOW_SQL = text("""
+    SELECT
+        d.id,
+        d.title,
+        d.ai_summary,
+        d.embedding,
+        d.created_at,
+        d.edit_url,
+        d.ai_sub_group,
+        (
+            SELECT c.country
+            FROM document_chunks c
+            WHERE c.doc_id = d.id AND c.country IS NOT NULL
+            LIMIT 1
+        ) AS chunk_country
+    FROM documents d
+    WHERE d.source_channel = 'news'
+      AND d.deleted_at IS NULL
+      AND d.created_at >= :window_start
+      AND d.created_at < :window_end
+      AND d.embedding IS NOT NULL
+      AND d.ai_summary IS NOT NULL
+""")
+
+
+_SOURCE_COUNTRY_SQL = text("""
+    SELECT name, country FROM news_sources WHERE country IS NOT NULL
+""")
+
+
+def _to_numpy_embedding(raw: Any) -> np.ndarray | None:
+    """pgvector 컬럼을 numpy array(float32)로 정규화.
+
+    raw SQL + asyncpg 조합에서 pgvector type 이 등록 안 되어 있으면
+    embedding 이 '[0.1,0.2,...]' 같은 string 으로 반환된다. ORM 을 안 쓰므로
+    이 경우 직접 파싱해야 한다.
+    """
+    if raw is None:
+        return None
+    if isinstance(raw, str):
+        import json
+        try:
+            raw = json.loads(raw)
+        except json.JSONDecodeError:
+            return None
+    try:
+        arr = np.asarray(raw, dtype=np.float32)
+    except (TypeError, ValueError):
+        return None
+    if arr.size == 0:
+        return None
+    return arr
+
+
+async def _load_source_country_map(session) -> dict[str, str]:
+    """news_sources name → country 매핑 (핫픽스).
+
+    ⚠ 문자열 기반 매칭 — 단계 3에서 news_source_id FK로 교체 예정.
+    first-token + all-but-last-token 이중 키로 multi-word source 대응.
+    """
+    rows = await session.execute(_SOURCE_COUNTRY_SQL)
+    mapping: dict[str, str] = {}
+    for name, country in rows:
+        if not name or not country:
+            continue
+        # first token: "Le", "Der", "경향신문", "NYT"
+        prefix = name.split(" ")[0].strip()
+        if prefix and prefix not in mapping:
+            mapping[prefix] = country
+        # all-but-last-token: "Le Monde", "Der Spiegel" (마지막 = 카테고리)
+        tokens = name.split(" ")
+        if len(tokens) >= 3:
+            source_prefix = " ".join(tokens[:-1]).strip()
+            if source_prefix and source_prefix not in mapping:
+                mapping[source_prefix] = country
+    # 임시 디버그 — entry 수만 로그 (mapping 전체 출력은 운영 노이즈)
+    # 단계 3-1 news_source_id 전환 후 이 함수 자체 삭제
+    import logging
+    logging.getLogger("digest_loader").debug(f"source_country_map: {len(mapping)} entries")
+    return mapping
+
+
+async def load_news_window(
+    window_start: datetime,
+    window_end: datetime,
+) -> dict[str, list[dict]]:
+    """주어진 윈도우 안의 뉴스 documents 를 country 별 dict 로 반환.
+
+    Returns:
+        {"KR": [doc_dict, ...], "US": [...], ...}
+    """
+    docs_by_country: dict[str, list[dict]] = defaultdict(list)
+    null_country_count = 0
+    total = 0
+
+    async with async_session() as session:
+        source_country = await _load_source_country_map(session)
+
+        result = await session.execute(
+            _NEWS_WINDOW_SQL,
+            {"window_start": window_start, "window_end": window_end},
+        )
+        for row in result.mappings():
+            embedding = _to_numpy_embedding(row["embedding"])
+            if embedding is None:
+                continue
+
+            country = row["chunk_country"]
+            if not country:
+                # news_sources prefix fallback
+                ai_sub_group = (row["ai_sub_group"] or "").strip()
+                if ai_sub_group:
+                    country = source_country.get(ai_sub_group)
+            if not country:
+                null_country_count += 1
+                continue
+
+            country = country.upper()
+            docs_by_country[country].append({
+                "id": int(row["id"]),
+                "title": row["title"] or "",
+                "ai_summary": row["ai_summary"] or "",
+                "embedding": embedding,
+                "created_at": row["created_at"],
+                "edit_url": row["edit_url"] or "",
+                "ai_sub_group": row["ai_sub_group"] or "",
+            })
+            total += 1
+
+    if null_country_count:
+        logger.warning(
+            f"[loader] country 분류 실패로 drop된 문서 {null_country_count}건 "
+            f"(chunk_country + news_sources fallback 모두 실패)"
+        )
+    logger.info(
+        f"[loader] window {window_start.date()} ~ {window_end.date()} → "
+        f"{total}건 ({len(docs_by_country)}개 국가)"
+    )
+    return dict(docs_by_country)
--- a/Show More
+++ b/Show More
				`@@ -0,0 +1 @@`
				`"""Phase 4 Global Digest 서비스 레이어 — 7일 뉴스 batch clustering + summarization."""`