hyungi_document_server

Author	SHA1	Message	Date
Hyungi Ahn	9094b2dbc5	feat(study): Phase 1-E 풀이 선별 알고리즘 — bucket + stage 비율 vision 의 단일 풀이 진입점 — stage (intro/learning/pre_exam) + size 옵션으로 같은 endpoint 가 다른 분포의 문제 출제. services/study/quiz_selection.py: - bucket: unattempted / wrong_or_unsure / due_review / regressed / frequent / random - stage 별 비율: - intro: unattempted 55, wrong_or_unsure 30, frequent 15 - learning: due_review 20, wrong_or_unsure 40, unattempted 30, frequent 10 - pre_exam: due_review 20, wrong_or_unsure 30, regressed 10, frequent 20, random 20 - bucket 우선순위 (dict 순서) — 다음 bucket 은 이미 뽑힌 qid 제외 - 후보 부족 시 random backfill, 그래도 부족 시 ValueError api/study_topics.py: - QuizSessionStartRequest 에 stage / size 옵션 추가 - stage 명시 시 select_questions_for_quiz 사용 - stage 미명시 시 기존 PR-12-B 경로 (subject bucket + spacing) 호환 유지 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 09:30:11 +09:00
Hyungi Ahn	e5982ebde4	feat(study): Phase 1 학습 루프 데이터 계층 — progress 캐시 + finalize + review API vision (풀이 → 확인 → 학습 → 복습 → 다음 풀이 가중치) 의 데이터 계층. 데이터 모델 (migrations 222~225): - study_question_progress 테이블 — user × topic × question 단위 현재 상태 캐시 - 마지막 시도: last_outcome, last_attempted_at, last_attempt_id - 검토 상태: last_reviewed_at - 복습 큐: due_at, review_stage - 패턴 분류 (derived): pattern_state, pattern_updated_at, pattern_window_attempts - 3 partial idx (due / topic_pattern / pending_review) — 탭별 빠른 조회 패턴 분류 (services/study/learning_pattern.py): - 7 분류: unattempted/unsure/chronic_wrong/regressed/recovered/stable/unstable - 윈도우 = 최근 3회 + 과거 correct/wrong 존재 여부 - chronic_wrong > regressed > recovered 우선순위 (보수적 학습) - 가드: wrong 1회만으로 regressed 안 됨 (이전 correct 이력 필요) - stable 은 3 연속 correct 부터 세션 종료 집계 (services/study/session_finalize.py): - attempts append-only 원본 보존, progress upsert 만 - 마지막 attempt 직후 finalize hook 자동 발동 - finalize 는 last_* + pattern_state 만 갱신, due_at 미진입 문제는 NULL 유지 - 이미 due_at 박힌 문제는 finalize 가 stage 갱신 (correct → +1 / wrong → 리셋) API (api/study_question_progress.py): - POST /study-topics/{tid}/questions/{qid}/review-complete → last_reviewed_at + (wrong/unsure 인 경우만) due_at 최초 부여 - GET /study-topics/{tid}/review-queue?tab=due_today\|pending_review\|chronic\|regressed\|mastered → 5 탭 paginated 조회 → pending_review 는 last_reviewed_at < last_attempted_at 까지 포함 (이전 확인완료 후 다시 wrong 잡힘) Phase 1-E (풀이 선별 알고리즘) 은 후속 commit. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 09:28:46 +09:00
Hyungi Ahn	daaf18bdae	fix(canonical): add markdown to process_stage ORM enum (Phase 1B follow-up) migration 222 가 DB enum 에 markdown 을 추가했지만 SQLAlchemy ORM 측 enum 정의 (app/models/queue.py) 에 누락되어 LookupError 발생. 테스트 enqueue → consumer 실행 시: LookupError: 'markdown' is not among the defined enum values. DB enum 마이그레이션은 migration 222 가 처리. ORM 측은 SQLAlchemy 가 직렬화/역직렬화에 사용하는 Python 측 enum mirror 역할. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 00:16:03 +00:00
Hyungi Ahn	e50869cbda	feat(canonical): Phase 1B marker-service + marker_worker for PDF→markdown (222) 신규 컨테이너 marker-service (port 3300, Marker 1.10.2 + surya 0.17.1 + HF cache volume). marker_worker 가 markdown stage 큐 소비: classify_worker → enqueue 'markdown' (leaf, embed/chunk 와 독립) → SKIP_DOC_TYPES (발주서/세금계산서/명세표) 스킵 → 확장자 != .pdf 스킵 (Phase 1B = PDF only) → page_count > 200 스킵 → marker-service POST /convert → 422/404 = doc-level failed, 5xx = queue retry 안정성 장치: - migration 222: ALTER TYPE process_stage ADD VALUE markdown (단일 statement) - md_extraction_quality JSONB dict 직접 저장 - skip 시 md_content/hash NULL 클리어 - /ready Response.status_code + warmup_error 가시화 - HF cache volume (build-time download 0) - file_path 는 NAS 상대경로 → /documents prefix prepend 성공 기준: 파이프라인 안정성. markdown 품질은 Phase 1D pilot. Pre-flight (2026-05-01): - marker-pdf 1.10.2 stable - file_path 9503건 NAS 상대경로 - DOCUMENT_TYPES 한국어 7종 → SKIP alias 보강 - queue retry max_attempts=3 + reset_stale_items 확인 - main 220/221 study_q_related 선점 → 222 rebump Plan: ~/.claude/plans/plan-idempotent-sundae.md (Round 5 approved) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 00:06:23 +00:00
Hyungi Ahn	219e233a48	feat(study): related-types DB 캐시 — HNSW 매번 재계산 제거 - migrations 220/221: study_questions 에 related_repeat/similar JSONB + 카운트/grade/computed_at/threshold_version + partial idx - 임베딩 워커: ready 처리 직후 같은 트랜잭션에서 related 계산·저장 + 같은 토픽 ready 행들의 related_computed_at=NULL invalidation - 신규 cron study_q_related_refresh (1분, batch=20) — stale 캐시 일괄 재계산 - API list_related_types: cache hit (computed_at + threshold version 일치) 시 SELECT 1번으로 응답. miss 면 즉시 계산+저장 후 응답 - update_question PATCH: 본문/exam_round 변경 시 related_computed_at=NULL - soft delete: 같은 토픽 ready 행 invalidation threshold 변경 시: related_types.THRESHOLD_VERSION 갱신 + UPDATE WHERE version != '<신>' SET computed_at=NULL 한 번이면 cron 자동 일괄 재계산. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 07:22:31 +09:00
Hyungi Ahn	fc8aea1649	feat(study): 반복 출제 라벨 등급 + cosine 임계값 0.85 조정 - round_count 별 등급 매핑 (단골/잘 나오는 반복 출제/반복 출제/신출/빈출) - ≥7 단골, 5–6 잘 나오는 반복 출제, 3–4 반복 출제, 2 + max(연도)≥2024 신출, 2 + 모두 옛 빈출 - SIMILAR_THRESHOLD 0.88 → 0.85 (5-source 분포 측정 결과 자연 갭 위치 반영) - API 응답 + 프론트 3곳 (보기/통합뷰/결과 카드) 라벨 일괄 통일 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-30 08:50:39 +09:00
Hyungi Ahn	b20c4f933b	feat(study): exam_round 필터 + 일괄 import 스크립트 — 1천+ 문제 대비 (P0) 문제: 1천+ 문항 토픽에서 보기 페이지 prev/next 가 page_size=200 cap 으로 회차 외 문항만 받아 같은 회차 prev/next 누락 회귀. 해결: - /study-topics/{tid}/questions 에 exam_round Query 파라미터 추가 (exact match). - StudyQuestionSummary 응답에 exam_question_number 필드 추가. - exam_round 필터 시 정렬 = exam_question_number asc NULLS LAST, created_at asc. - 보기 페이지 loadRoundSiblings 가 ?exam_round= 로 한 회차만 fetch. - 토스트 문구 "토픽 200문제 초과" → "이 회차에 200문항 초과" (의미 일치). 추가 — 가스기사 기출 일괄 import 스크립트: - scripts/import_gas_questions.py: md 파서 + dry-run + apply. · exam_question_number 3소스 (파일명/제목/메타) 일치 검증. · subject 정규화 (괄호 세부분류는 scope 로 이동, 5과목 통일). · 이미지 4케이스 판정 + import_reports/{회차}_image_required.md 생성. · 첫 실패 abort 기본, --skip-existing/--continue-on-error 옵션. · 토큰 사전 검사 (GET /study-topics/{tid}). - import_reports/: 2019년 1~3회 + 2020년 1~2회 리포트. - 운영: 4회분 360문항 자동 import 완료 (이미지 4건 자동 첨부). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-29 14:39:02 +09:00
Hyungi Ahn	13404cd366	feat(study): 같은 유형 과밀 방지 — 출제 단계 spacing (PR-12-B) 학습 의미: 한 quiz 세션 안에서 같은 유형 문제가 과도하게 몰리지 않게 분산. 같은 유형을 없애는 게 아니라 펼치는 것 — dedup/제거 프레임 금지. - 마이그레이션 210: study_quiz_sessions.quiz_mode VARCHAR(30) DEFAULT 'random' - ORM: StudyQuizSession.quiz_mode 필드 - service.related_types: apply_type_spacing helper 추가 - SPACING_THRESHOLD=0.88 (회차 무관 — PR-12-A 회차 필터 재사용 X) - PER_TYPE_CAP=2 (local neighbor cap, transitive cluster 보장 X) - SPACING_BUFFER_RATIO=2.0 - 3단계 fallback: ready spacing → pending 보충 → hold cap 위반 fallback - debug 로그 type_spacing_applied subject=... ready=N selected=M ... - _select_questions_for_topic: subject bucket 단위 spacing (과목 균등 보호) - QuizMode Enum (random) — 향후 frequent_focus/wrong_variants 예약 - start_quiz_session 에 quiz_mode 받기 + apply_spacing 전달 - 프론트 startNewQuiz body 에 quiz_mode='random' 명시 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-29 08:45:15 +09:00
Hyungi Ahn	cbe852bb37	feat(study): 반복 출제 / 유사 유형 분리 표시 (PR-12-A) 학습 의미가 회차 간 반복성 — 차단/제거가 아니라 패턴 표시 frame. - 신규 service `related_types.py` — threshold/회차 필터/round_count 계산 공유 - REPEAT >= 0.95 / SIMILAR 0.88~0.95 - 회차 조건 백엔드 강제 (자기 자신/같은 회차/null exam_round candidate 제외) - round_count: related_count == 0 → 0 (현재 회차만 1로 채우지 않음) - GET /study-questions/{qid}/related-types — 단건 분류 (repeat_questions / similar_questions) - POST /study-topics/{tid}/related-types-bulk — 카드 배지용 카운트 batch - 비교 대상 = 토픽 전체 ready pool (입력 qid 끼리 비교 X) - 응답 키 보존 — 권한 없음/임베딩 미준비 등도 (0,0,0,0) - 보기 페이지: PR-11 비슷한 문제 토글 제거 + 🔥 반복 출제 / 🧩 유사 유형 두 섹션 자동 노출 - 헤더 = round_count "N개 회차", 본문 위 = related_count "관련 N문제" - source_status / source_exam_round 안내 분기 - 결과 페이지 (틀린/모르겠음 카드): bulk 호출 후 round_count >= 2 일 때만 배지 - 통합뷰 회차 expand 시 lazy bulk 호출 — 같은 회차 캐시 - 기존 /similar 엔드포인트 유지 (raw 디버깅용) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-29 08:09:14 +09:00
Hyungi Ahn	1cf64fd11e	feat(study): 문제 회차별 그룹 + 읽기전용 보기 페이지 (PR-11) - 통합뷰 문제 섹션: 평면 리스트 → 회차별 아코디언 (디폴트 모두 접힘) - 회차 정렬: "YYYY년 N회" 파싱 → year desc / round desc (localeCompare 단독 회귀 차단) - 회차 행 라벨: "총 시도 N건 · 마지막 결과: 정답 K / 오답 M" (누적/마지막 혼동 회피) - 회차 미지정 그룹은 노란 톤 + 안내, 표시 문자열은 UI 전용 (원본 NULL 분리) - 본문 / [편집] 링크 구조 분리로 이벤트 버블링 충돌 차단 - /study/topics/{tid}/questions/{qid} 신규 — KaTeX 마크다운 렌더 + 정답 표시 + AI 해설 5상태 (idle/loading/success/stale/error) + 비슷한 문제 + prev/next - prev/next URL 직접 접근 — 단건 fetch + 같은 회차 목록 fetch 자체 처리 - page_size=200 만땅 + total>200 시 토스트 안내 (조용히 자르지 않음) - 사용자 입력 해설/이미지 없으면 섹션 숨김, exam_round NULL 이면 prev/next 비활성 - StudyTopicQuestionSummary 에 exam_question_number 추가 (회차 안 정렬 키) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-29 07:01:27 +09:00
Hyungi Ahn	6e25523600	fix(study): quiz_session 결과 — StudyQuestionImage.position → sort_order 재사용 PR-10 결과 페이지에서 GET /quiz-sessions/{sid} 가 500. 이미지 batch 호출에서 존재하지 않는 컬럼 position 사용 → AttributeError. 기존 _images_for_questions_batch 헬퍼 (sort_order 기준 + served_url 포함) 재사용. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 16:52:52 +09:00
Hyungi Ahn	7f4d64c6df	feat(study): 문제풀이 세션 + 결과 카드 + 학습완료 체크 (PR-10) - study_quiz_sessions 테이블 (한 토픽 in_progress 1개 partial unique) - study_question_attempts 에 quiz_session_id + reviewed_at 컬럼 - 풀이 진행률 서버 단일 진실 (cursor) — 나갔다 와도 이어풀기 가능 - 통합뷰: 진행 중 카드(이어풀기) + 최근 완료 결과 카드(미확인 N건 배지) - 신규 /quiz-sessions/[sid] 결과 페이지 (3 카테고리 + AI 해설 + 분야 설명 + 학습완료 토글) - /review 페이지는 풀이만, 마지막 문제 풀이 후 결과 페이지로 redirect - 마이그레이션 206~209 (single-statement, asyncpg 호환) - API: POST/GET/PATCH /study-topics/{tid}/quiz-sessions(/{sid}), PATCH /study-question-attempts/{aid}/review-mark - AttemptCreate.quiz_session_id 추가 — submit_attempt 가 같은 트랜잭션에서 세션 cursor + count 증가, 마지막이면 status='done' + finished_at Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 16:49:21 +09:00
Hyungi Ahn	d968b2d901	feat(study): 문제풀이 모드 개편 + 결과 분류 + 분야 설명 (PR-9) - 라벨 "복습 시작" → "문제풀이" - attempts.outcome 컬럼 + selected_choice nullable (correct/wrong/unsure) - 풀이 중 정답·해설·AI·비슷한 문제 모두 비노출, 답 클릭 시 자동 진행 - "모르겠음" 5번째 옵션 추가 - 결과 화면 = 정답/틀린/모르겠음 3 카테고리 탭, 카드 클릭 expand - 틀린 → PR-3 AI 해설 (RAG) - 모르겠음 → 분야(subject+scope) 설명 AI 즉석 생성 + 캐시 (PR-9 신규) - 분야 설명 RAG: 매핑 documents 청크 + 같은 분야 다른 문제·해설 → bge-reranker - 마이그레이션 200~205 (single-statement, asyncpg 호환) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 15:58:35 +09:00
Hyungi Ahn	8b15e6e019	feat(study): 문제 첨부 이미지 (PR-8) 문제별 N개 이미지 첨부. 회로도/그래프 등이 필요한 시험 문제 지원. 입력·편집·복습 모두에서 표시. 데이터 모델 (migration 198): - study_question_images: id, user_id FK CASCADE, study_question_id FK CASCADE, file_path, file_size, mime_type, sort_order, created_at - partial idx (study_question_id, sort_order, id) 저장: NAS /documents/study_question_images/{topic_id}/{qid}/{img_id}.{ext} file_watcher 가 보는 PKM 경로와 분리 — 자동 인덱싱 안 됨. API: - POST /api/study-questions/{qid}/images (multipart, MIME PNG/JPEG/WEBP/GIF, 10MB/파일 제한, sort_order 자동 max+1) - GET /api/study-questions/{qid}/images/{img_id}/raw (FileResponse, Bearer 인증) - DELETE /api/study-questions/{qid}/images/{img_id} (DB row + 파일 시스템 정리) - StudyQuestionResponse / ReviewQuestionItem 응답에 images 배열 포함 - StudyQuestionSummary 응답에 has_images bool 추가 프론트: - 신규 lib/components/ImgAuth.svelte — Bearer 인증 endpoint 의 이미지를 fetch + blob URL 로 변환해 <img> 표시. unmount 시 URL.revokeObjectURL. - /questions/new: 입력 폼에 이미지 dropzone (client-side 보유) → POST /questions 받은 qid 로 자동 multipart 업로드. "저장 후 계속 입력" 시 reset. - /questions/[qid]/edit: 별도 카드 — 기존 이미지 grid + 추가/삭제. 즉시 업로드. - /review: 문제 본문 아래 이미지 grid (max-h-72 object-contain). - 모든 표시는 ImgAuth 컴포넌트 — accessToken 만료 케이스 대비. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 13:41:50 +09:00
Hyungi Ahn	7dd77ec926	fix(classify): data_origin enum 검증 — knowledge 등 잘못된 값 cascade fail 방지 AI 응답에서 dataOrigin='knowledge' 같은 doc_purpose enum 값이 data_origin 컬럼에 잘못 매핑되면 asyncpg InvalidTextRepresentationError 발생. 같은 classify_worker session 의 후속 autoflush 호출이 PendingRollbackError 로 cascade 되어 batch 안 다른 문서까지 모두 실패. doc_purpose 처럼 enum 허용값(work/external) 검증 후 박도록 수정. 외 값은 skip (data_origin NULL 유지). 가스기사 토픽 결손 15건의 RAG 결손 root cause.	2026-04-28 10:01:45 +09:00
Hyungi Ahn	8803e6a0fd	feat(study): 시험·회차·문항 관리 (PR-6) 기사시험 회차별 100문제 채워가기 시나리오. 문제 입력 페이지를 단순 폼에서 "회차 진행률 추적·재개" 도구로 보강. 데이터 모델 (migrations 195~197): - study_topics: exam_round_size INT CHECK 1~300 (회차당 문항 수, NULL=미설정) + exam_subjects JSONB DEFAULT '[]' (과목 리스트, 입력 페이지 드롭다운 옵션) - study_questions: exam_question_number SMALLINT CHECK >0 (회차 안 문항 번호) - partial idx (study_topic_id, exam_round, exam_question_number) WHERE deleted_at IS NULL AND exam_round IS NOT NULL — 회차별 max+count 고속화 백엔드: - POST /questions: exam_round 명시 + exam_question_number 미명시 시 서버가 같은 토픽·회차의 max+1 자동 채움 - 신규 GET /api/study-topics/{id}/exam-rounds: 회차별 진행률 집계 {exam_round_size, items: [{exam_round, question_count, max_question_number, next_question_number, is_complete}]} - StudyTopic Create/Update/Response/Meta 에 exam_round_size·exam_subjects - StudyQuestion Create/Update/Response 에 exam_question_number - exam_question_number 변경은 embedding stale 트리거에서 제외 (의미 영향 없음) 프론트: - 토픽 생성/편집 모달: "시험 정보" 섹션 (회차당 문항 수 + 과목 리스트 +추가/제거 칩) - /study/topics/[id]/exam-rounds 신규 페이지: 회차 카드 + 진행 바 + [N번부터 이어서] 버튼 + [새 회차 시작] 모달 - 통합뷰 문제 섹션 헤더에 [회차 보기] 진입점 - /questions/new 페이지 전면 개편: - 시험명 = topic.name 자동 prefill - 과목 드롭다운 (topic.exam_subjects + 기존 distinct, "직접 입력" 토글) - 회차 드롭다운 (기존 distinct + "새 회차") - 문항 번호 자동 (회차 선택 시 next_question_number, 새 회차 = 1) - 진행률 바 (현재/exam_round_size) - 출처/메모 자동 합성 "회차 N번" (수정 가능) - "저장 후 계속 입력" → 본문/보기/정답 reset, 회차 유지, 문항 +1 - 회차 변경 감지 시 문항 번호 1로 reset - exam_round_size 도달 시 회차 강조 + "저장 후 계속 입력" 비활성 - query string ?exam_round=&start_qnum= 지원 (회차 목록에서 재개 진입) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 09:31:06 +09:00
Hyungi Ahn	5b55274368	feat(study): 비슷한 문제 검색 (PR-5) study_questions 자동 임베딩(PR-4 bge-m3 1024차원) 기반 cosine 유사도 top-K. 26B 호출 없음, vector search 만. additive UI — 기존 입력·복습 흐름 영향 없음. 백엔드: GET /api/study-questions/{id}/similar?limit=5&topic_only=true - 자기 자신/soft-deleted/embedding_status!=ready 제외 - topic_only=true (default) 면 같은 study_topic 안에서만 - 응답: items[{id, question_text(80자 truncate), subject, scope, exam_round, similarity(1-cosine), attempt_count, last_correct}], source_status, source_id - 현재 문제 embedding 미생성/실패/stale 시 빈 결과 + source_status 안내 - attempt_count + last_correct batch 조회 (N+1 회피) 프론트: - 편집 화면(/questions/[qid]/edit): 페이지 로드 시 자동 GET /similar → 카드 5개. 본문 truncate + subject/scope/exam_round + 유사도 % + attempt 배지 (정/오답 아이콘). 카드 클릭 시 해당 문제 편집 페이지로 이동. - 복습 화면(/review): 답 제출 후 "비슷한 문제 보기" 토글 → expand 5개 카드. 같은 형태. 다음 문제로 cursor 이동 시 자동 닫힘. - 통합뷰: 변경 없음 (이미 편집 진입점이 시각적 cue 역할). source_status별 안내 (pending/failed/stale/none): 임베딩이 아직 준비 안 됐을 때 "약 1분 안에 cron 자동 처리" 메시지 노출. 후속 PR 예정: subject/scope 자동 추천(PR-6), 오답노트/통계(PR-7), AI 풀이 idle batch(PR-8). 현재 PR-5 는 vector search 결과 노출까지만. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 09:05:55 +09:00
Hyungi Ahn	5a8c7595d7	fix(study): 워커 mapper chain — User/Document FK ref 추가	2026-04-28 08:59:33 +09:00
Hyungi Ahn	b0a087ab6f	fix(study): 워커 mapper chain — StudySession 도 defensive import	2026-04-28 08:57:57 +09:00
Hyungi Ahn	de781ed622	fix(study): 워커 단독 진입 시 StudyQuestion mapper 초기화 위해 StudyTopic defensive import	2026-04-28 08:55:55 +09:00
Hyungi Ahn	9d4aa201a8	feat(study): study_questions 자동 임베딩 (PR-4) 문제 본문 + 보기 1~4 → bge-m3 1024차원. status 자체가 큐 역할 (별도 큐 테이블 없음 — ProcessingQueue 인프라 영향 0). APScheduler 1분 cron 이 status in {none, failed, stale} 행을 batch=10 처리. 새 문제는 default 'none' 으로 자동 backfill. 데이터 모델 (migrations 193~194): - study_questions: embedding vector(1024), embedding_status VARCHAR(20) DEFAULT 'none' (none/pending/ready/failed/stale), embedding_updated_at, embedding_model - HNSW partial index (vector_cosine_ops) WHERE deleted_at IS NULL AND embedding IS NOT NULL — bge-m3 cosine 기준, documents.embedding (ivfflat) 과 ops 일관 재계산 트리거: question_text / choice_1~4 변경 시 ready→stale 자동. correct_choice / explanation / subject / scope 변경은 재계산 안 함 (의미 검색에 영향 없음). 워커 (workers/study_question_embed_worker.py): - race-safe pending 마킹 (조건부 UPDATE WHERE status IN none/failed/stale) - AIClient.embed(text) bge-m3 호출, 15s timeout - 실패 시 status='failed', 직전 embedding 보존, 다음 cron 틱에 재시도 - 본문 = "문제: ...\n보기:\n1. ...\n2. ...\n3. ...\n4. ..." (subject/scope 의도 제외 — 분류명이 의미 검색 노이즈) 후속 PR 예정: 비슷한 문제 검색 UI / 중복 입력 감지 / RAG 정확도 향상 / 오답 클러스터링. 본 PR 은 임베딩 저장·재계산·backfill 까지만. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 08:54:02 +09:00
Hyungi Ahn	e1a2cdc677	feat(study): AI 풀이 생성 — 수동 트리거 + RAG (PR-3) 복습 답 제출 후 또는 편집 화면에서 사용자가 명시적으로 누를 때만 AI 가 4지선다 풀이 생성. 자동 일괄 생성 금지 (하루 100문제 입력 시 MLX 부하· 잘못 입력 문제 해설 위험). 데이터 모델 (migrations 191~192): - study_questions 4 컬럼 추가: ai_explanation TEXT, ai_explanation_status VARCHAR(20) DEFAULT 'none' (none/pending/ready/failed/stale), ai_explanation_generated_at, ai_explanation_model - partial idx (study_topic_id, ai_explanation_status) WHERE status != 'none' PATCH stale 자동 전이: question_text/choice_*/correct_choice 변경 시 status='ready' 만 'stale' 로. 본문은 보존, UI 배지 + "다시 생성" 동선. 신규 엔드포인트: POST /api/study-questions/{id}/ai-explanation - regenerate=false + ready/stale → 캐시 즉시 (MLX 호출 없음, is_stale 플래그) - pending → 409 (race-safe 조건부 UPDATE 로 동시 호출 차단) - 그 외 → 새 생성 RAG 입력 풀: - 1순위: study_topic 매핑 documents 청크 + ai_summary, bge-reranker top-5 - 2순위: 같은 토픽 다른 questions (자기 자신 제외, ai_explanation 은 ready 상태만 포함 — 재귀적 hallucination 방지), reranker top-3 - 제외: 필기 OCR / 외부 웹 / Premium 모델 모델: Mac mini MLX gemma-4-26b primary 단독. get_mlx_gate() Semaphore(1) 경유, 30s timeout. 실패 시 status='failed' + 직전 본문 보존. 프롬프트 (app/prompts/study_question_explanation.txt): 자료 우선순위·인용 형식·할루시네이션 방지 절대 규칙 (법령명·조항·수치·표준 번호 단정 금지, "자료에서 확인되지 않음" 명시). 프론트: - 복습 화면 답 제출 후 인라인 expand. status별 버튼 분기 (ready 캐시 / stale "이전 풀이"+"다시 생성" / failed "다시 시도") - 편집 화면 별도 카드. 상태 배지 + "이전 풀이 보기" / "다시 생성" 분리 - 참고 근거 토글 (source_type 별 아이콘 📄/❓ + 제목 + snippet) 후속 PR 보류: 오답노트/통계, AI 일괄 백그라운드 생성, 필기 OCR RAG, Premium/Claude 재생성, /api/search/ask retrieval scope 통합. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 08:41:46 +09:00
Hyungi Ahn	0e2a430a6c	fix(study): 통합뷰 자료 섹션 카테고리 트리 그룹핑 + 접기 가스기사처럼 한 워크스페이스에 273건 자료가 묶이면 평면 리스트로 쭉 나열 되어 통합뷰가 무너졌음. /study/topics/[id] 자료 섹션을 자료실 카테고리 경로 기반 트리로 그룹핑하고 노드별 접기/펼치기 도입. 기본값 모두 접힘. 백엔드: StudyTopicDocumentSummary 에 library_paths(`@library/<path>` 태그 에서 prefix 제거) 필드 추가. 그룹핑은 첫 path 만 사용 (단순화). 프론트: documents 를 path segment 별로 트리 빌드 → snippet 재귀 렌더링. 헤더에 "자료 N개 · 카테고리 K개 · [모두 펼치기/접기]" 컨트롤. 분류 없는 자료는 "분류 없음" 그룹으로 별도. 자료 0건 path 는 자동 누락. 필기/문제 섹션은 분류축이 달라(certification/subject vs subject) 동일 트리 못 쓰므로 본 PR 범위 밖. 후속에서 패턴 일관성 검토.	2026-04-28 08:14:58 +09:00
Hyungi Ahn	4b7156061e	feat(study): 문제은행 + 복습모드 (study_questions) study_topic 워크스페이스에 4지선다 문제은행 자산 트랙 추가. 기사시험 필기 대비 시나리오 — 빠른 반복 입력 + 과목별 균등 추출 복습 + 정오답 누적. 데이터 모델 (migrations 186~190): - study_questions: study_topic 1:N, soft delete, is_active 토글, correct_choice SMALLINT CHECK 1~4 - study_question_attempts: 답 제출 1행 누적. study_question_id FK는 ON DELETE RESTRICT (이력 보존 원칙 — hard delete 실수로 풀이 기록 소실 차단) 설계 원칙: - 문제 삭제는 API 에서 soft delete only. attempts FK RESTRICT 로 DB 레벨도 보호 - correct_choice 변경 시 기존 attempts.is_correct 재계산 안 함 (시점 사실 보존) - 복습 default = 과목별 target_per_subject(20) 무작위 균등 추출. 한 과목이 부족하면 가용한 만큼만 - wrong_only=true 정의 = 가장 최근 attempt 가 오답인 문제 (latest-wrong, ever-wrong 아님) - 출제 응답에서 정답·해설 비공개. 답 제출 시점에만 노출 - subject/scope 강한 enum 미사용 (자유 텍스트, 자동완성은 후속) API: /api/study-topics/{id}/questions, /review/questions, /api/study-questions/{id}, /attempt. 통합뷰(/study-topics/{id}) 응답에 sections.questions / stats.question_count 추가. 기존 question_set_count 는 후속 PR(회차/모의고사 묶음)용으로 보존. 프론트: /study/topics/[id]에 문제 섹션 + "새 문제"/"복습 시작" 진입. /questions/new (저장 후 계속 입력 + sessionStorage persistent), /questions/[qid]/edit (정답 변경 시 attempts 재계산 안 됨 안내 배너), /review (시작 옵션 → 풀이 → 마지막 요약). 후속 PR 예정: 오답노트/취약 과목 리포트, AI 해설/클러스터링, spaced repetition, 이미지 OCR 입력, CSV import, study_question_sets 묶음. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 08:00:37 +09:00
Hyungi Ahn	62afc571c0	feat(study): 카테고리 트리에서 자료 일괄 추가 자료 추가 모달이 1건씩 검색·체크박스만 지원해서 같은 카테고리에 자료가 많을 때 비효율적. /api/library/tree 의 카테고리 구조를 모달 좌측에 띄우고, 노드 옆 아이콘 한 번으로 그 path 하위 자료 전체를 한 번에 매핑. 백엔드: POST /api/study-topics/{id}/documents/by-path 추가. user_tags @library/<path> prefix 매칭(documents.py 의 list_library_documents 와 동일한 EXISTS 쿼리)으로 100건 limit 우회. 응답은 linked_count / skipped_existing_count / total_in_path 카운트만 노출. 프론트: 모달을 max-w-4xl + grid(트리/자료) 레이아웃으로 개편. 트리 노드 클릭 = 우측 자료 목록 path 필터링, 노드 옆 FolderPlus 버튼 = 즉시 일괄 추가. 검색·체크박스·전체선택은 그대로. 모바일은 트리가 상단 max-h-40vh 영역으로 stack.	2026-04-28 07:29:59 +09:00
Hyungi Ahn	63ed4d81e5	feat(study): study_topics 학습 워크스페이스 컨테이너 도입 필기 세션과 자료(library document)를 한 학습 주제(예: 가스기사) 아래로 묶는 1차 컨테이너. 향후 단어장/오디오/문제세트 등 학습 자산이 같은 묶음으로 들어올 수 있도록 응답 구조(sections + stats)를 dict 기반으로 설계. 데이터 모델 (migrations 179~185): - study_topics: user_id × name partial unique (active 행만), soft delete - study_sessions.study_topic_id: 1:N nullable FK (ON DELETE SET NULL) - study_topic_documents: 자료 N:M 매핑 (user_id 반정규화로 권한 격리) 설계 원칙: - documents.category(자료실 UI 축)와 직교 → 자료실 facet/카테고리 미터치 - StudySession.certification/subject/topic 보존 (세부 메타로 계속 사용) - study_type은 느슨한 분류 (강한 enum 미사용, jlpt_n3 등 확장 여지) - polymorphic study_topic_items 영구 금지 → 자산 타입별 조인 테이블 추가 방식 API: /api/study-topics CRUD + /by-document/{id} + 자료/세션 매핑 엔드포인트. 프론트: /study/topics 목록 + /study/topics/[id] 통합 뷰(필기·자료 두 트랙) + write 폼에 워크스페이스 드롭다운 + study hub 진입 카드. 후속 PR-2 어학 UX, PR-3 오디오 자산, PR-4 AI retrieval scope. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 07:06:37 +09:00
Hyungi Ahn	6e3ce91de6	fix(library): library-neighbors JSONB cast 오류 — EXISTS 서브쿼리로 교체	2026-04-27 12:43:26 +09:00
Hyungi Ahn	e92bf3c06b	feat(library): 모바일 학습 detail 최적화 + 다음 자료 네비 (PR-E) [Backend] - /api/documents/{id}/library-neighbors — 같은 library_path 내 prev/next 자료 (title_asc 정렬). user_tags 의 첫 @library/* 태그를 path 로 사용. category='library' 만 응답. [Frontend] - routes/documents/[id]/+page.svelte: · 마크다운 본문: 모바일 prose-base (가독성), lg+ prose-sm 유지 + leading-relaxed · onMount 시 자료실 자료면 loadNeighbors 자동 호출 · 모바일 sticky 하단 바 (lg:hidden): [< 이전] [✓ 1회독 완료 + 다음 (primary)] [다음 →] - 가운데 버튼: POST /read 후 next 자료로 goto. 마지막 자료면 "1회독 완료 (마지막 자료)" 텍스트 + next 버튼 disabled. - 좌/우 버튼: 회독 카운트 안 함, 단순 이동 (이전 자료 / 회독 안 한 다음) · 본문 하단 패딩 (lg:hidden h-20) — sticky 바에 가리지 않음	2026-04-27 12:41:43 +09:00
Hyungi Ahn	24bd363beb	feat(library): 자료별 손글씨 노트 (PR-D) — iPad 학습 시 옆에 필기 자료실 자료 detail 에 "필기" 버튼 → 본문 아래에 HandwriteCanvas 띄움. 자료당 사용자별 1개 캔버스 (UNIQUE user×document). upsert 방식. Backend: - migrations 177~178: document_notes (user_id, document_id, strokes_json, canvas 크기) + UNIQUE(user_id, document_id) + 인덱스 - app/models/document_note.py: DocumentNote ORM - app/api/document_notes.py: · GET /api/documents/{id}/note — 단건 조회 (없으면 strokes_json=null) · PUT /api/documents/{id}/note — upsert (PostgreSQL ON CONFLICT) · DELETE /api/documents/{id}/note · ownership: WHERE user_id=current_user.id (single-user 가정) - app/main.py: document_notes_router 등록 (/api/documents prefix) Frontend: - routes/documents/[id]/+page.svelte: · 자료실 자료 (category='library') 의 affordance row 에 "필기" 토글 추가 · 클릭 시 GET /note 로 strokes 로드 → HandwriteCanvas 본문 카드 아래 마운트 · 캔버스 onChange → PUT /note 자동 저장 (HandwriteCanvas 내부 3초 idle 디바운스 활용) · 60vh / min-h-[400px] 분할. 모바일에선 본문 아래 스크롤로 자연스럽게. - HandwriteCanvas 재사용 — sessionId prop 에 documentId 전달. localStorage 키도 그대로 사용 (자료별로 namespacing).	2026-04-27 12:38:03 +09:00
Hyungi Ahn	fb4897e256	feat(library): 자료실 회독 추적 frontend (PR-B) PR-A backend 위에 사용자 UI: [ReadCounter] - frontend/src/lib/components/ReadCounter.svelte 신규 - "1회독 완료" 명시 클릭 → POST /read → 토스트 - 현재 N회독 / 마지막 읽음 (방금/N분 전/날짜) 표시 - ↩ 버튼 → DELETE /read/last → 마지막 1건 취소 (confirm) - 자동 +1 ❌ [자료 detail] - routes/documents/[id]/+page.svelte 우측 editor stack 상단에 ReadCounter 마운트 — category='library' 일 때만 - doc 응답의 read_count / last_read_at 으로 초기값 (추가 fetch 불필요) [자료실 카드 회독 배지] - DocumentCard.svelte 우측 메타에 텍스트 배지 안 봄 / 1회독 / 2회독 / N회독 — 색은 매우 약하게 (오해 방지) - doc.category === 'library' 만 [안 본 자료만 필터] - backend: /api/documents/library 에 unread bool 파라미터 Document.id NOT IN (현재 사용자 회독 doc_id) — scalar_subquery - frontend: /library 페이지에 토글 버튼 (정렬 옆) URL ?unread=true 동기화, activeUnread reactive	2026-04-27 12:19:11 +09:00
Hyungi Ahn	49d8f68986	feat(library): 자료실 회독 카운트 추적 (PR-A backend) 자료실 자료를 사용자가 명시적으로 "1회독 완료" 클릭 시 +1 누적. detail 진입 자동 카운트 ❌. append-only 로그. 데이터: - migrations 174~176: document_reads 테이블 + 인덱스 2개 (단일 statement 분할) ORM: - app/models/document_read.py: DocumentRead (user_id, document_id, read_at) API (app/api/document_reads.py, /api/documents prefix): - POST /api/documents/{id}/read — 회독 +1 - GET /api/documents/{id}/read-stats — {read_count, last_read_at} - DELETE /api/documents/{id}/read/last — 현재 사용자의 그 문서 마지막 1건만 · ownership: WHERE user_id=current_user.id AND document_id=:doc_id · documents 에 user_id 부재 (single-user). multi-user 전환 시 ownership check 추가 필요 — 코드 주석 명시. 응답 확장: - DocumentResponse: read_count(default 0), last_read_at(default None) - /api/documents/library: 페이지 N건 한정 LEFT JOIN 으로 read 통계 매핑 (N+1 회피) - /api/library/tree CategoryTreeNode: unread_count 추가 · 기존 path_docs 가 ancestor 누적 구조라 그대로 활용 — 하위 경로 합산 자동 규칙 (사용자 명시 — 변경 금지): · 같은 날 여러 번 클릭 → 각각 별개 회독 · 실수 클릭 취소 = DELETE /read/last · documents 에 read_count 컬럼 추가 ❌, 로그 기반 COUNT(*) 만 plan: ~/.claude/plans/scalable-chasing-stonebraker.md 브랜치: feature/library-reads (손글씨 트랙과 분리)	2026-04-27 12:08:36 +09:00
Hyungi Ahn	e8c348ab21	feat(dashboard): Day 4 튜닝 — 임계치 재조정 + deep_summary 안정성 카드 3일 telemetry (599 triage / 555 deep) 기반 임계치 재평가: 1. 에스컬레이션 비율 — 임계치 의미 reframe - 기존: >20% 적색 (튜닝 필요) → 항상 적색 (운영 패턴 97%) - 신규: <80% 적색 (정책 매칭 실패 증가) - 메시지: "safety 정책상 95~100% 가 정상" 보조 표시 - safety_reference 99.7%, generic 100% (fallback risk_flag), msds 46.2% → 운영 정상 패턴 확인 2. Deep summary 안정성 — 신규 카드 추가 - mode='summary_deep' 의 error_code IS NOT NULL 비율 - 현재 5.2% (call_failed 21 + parse:ValidationError 8) - >5% 적색 임계 - MLX 호출 timeout / JSON 파싱 실패 모니터 3. triage JSON 건강도, Backlog Suppression — 임계치 유지 - 현재 0%, 1% — 매우 안정. 보수적 임계 유효. Backend: TierHealthStack 에 deep_total / deep_err_total 추가 Frontend: 카드 그리드 3열 → 4열 (lg), Day 4 신규 카드. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-27 08:29:53 +09:00
Hyungi Ahn	95bcdb851b	fix(ops): backfill 쿼리에 빈 extracted_text 제외 — 무한 retry 방지 3일 운영 결과 doc 4811, 5181 가 extracted_text='' (빈 문자열) 인데 IS NOT NULL 만 걸려 enqueue → classify_worker 의 not doc.extracted_text truthy 체크에서 ValueError → max_attempts(3) 도달 → status=failed. 다음 backfill 사이클에서 다시 enqueue 되어 12회 반복, failed 24건 누적. 수정: tier_backfill.py + backfill_tier.py 양쪽 SQL 에 LENGTH(extracted_text) > 0 추가. 빈 문자열 문서는 enqueue 자체에서 제외. 기존 failed 24건 정리 SQL (사용자가 수동 실행): DELETE FROM processing_queue WHERE stage='classify' AND status='failed' AND error_message LIKE '%extracted_text%'; Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-27 08:25:12 +09:00
Hyungi Ahn	10364fbe1b	fix(study): refresh assets attr on create to avoid async lazy load	2026-04-27 08:20:29 +09:00
Hyungi Ahn	7804f22dce	feat(study): study_sessions backend (Phase 1) — 자격증/어학 일반 학습 세션 + assets 연결 iPad 손글씨 필사 / 모바일 암기노트 / 모바일 퀴즈가 같은 데이터를 공유하는 일반 학습 세션 backend. study_type 으로 certification/language 분기. - migrations/164: study_sessions + study_session_assets DDL + 5 partial indexes - app/models/study_session.py: StudySession + StudySessionAsset ORM (cascade) - app/api/study_sessions.py: CRUD + snapshot(PNG) + assets + filter + groups - ownership: 모든 endpoint user_id 검증, mismatch 도 404 (정보 누설 방지) - 409 중복: UNIQUE(session, document, asset_type, role) 사전 SELECT + IntegrityError 폴백 - enum 422: study_type / mode / asset_type / role / review_state / order - filter: 11개 (study_type, certification, language_code, learning_level, subject, topic, review_state, document_id, asset_type, mode, due_before) - groups: certification 트리 + language 트리 + has_audio/has_video - snapshot: documents.py atomic rename + error_code 패턴 차용 - app/main.py: /api/study-sessions router 등록 plan: ~/.claude/plans/scalable-chasing-stonebraker.md Phase 1 미사용 필드 (review_state/quiz/ocr/ai_summary/prompt) 는 NULL 허용, 자동 로직은 Phase 2~4 별도 PR 에서 활성.	2026-04-27 08:15:28 +09:00
Hyungi Ahn	c6335c9a1e	fix(classify): law_monitor skip 분기 복원 + tier_backfill law 제외 PR-B refactor 과정에서 `e88640d` 의 process() 진입부 source_channel='law_monitor' skip 분기가 사라져 매일 07:00 신규 법령 분할마다 26B legacy classify(8s) + 26B legacy summarize(10s) + 4B triage(1.5s) 전부 호출되고 있었다. 법령 분리 PR (stateless-churning-raccoon) 의 명제: "법령은 외부 source-of-truth + immutable + 자동 재수집 → 다른 수명주기" 와 일치하도록 process() 진입부에 skip 분기 복원. 최소 필드 (ai_domain='법령', ai_tags=['법령'], importance='medium') 만 세팅 후 return. queue_consumer 의 NEXT_STAGES['classify']=['embed','chunk'] 가 자동 chain 하므로 검색 영향 0. 법령 도메인 AI 산출물 가치 분석: - ai_summary: 법령 해석 환각 위험 (ASME/안전 엔지니어 사고 책임 소지) - ai_tldr/bullets: 이미 title 이 같은 정보 노출 — redundant - ai_inconsistencies: 공식 정합 문서라 100% false positive → 비용 (월 ~14분 26B 점유) 대비 가치 음수, skip 합당. tier_backfill.py 도 함께 수정: - DOMAIN_PRIORITY 에서 ('law', source_channel='law_monitor') 항목 제거 - safety 필터에 source_channel != 'law_monitor' 추가 (기존 ai_domain LIKE 'Industrial_Safety%' 매칭 안에 backfill 기 처리한 법령 doc 들이 잡혀 들어가는 case 차단) - 사유: skip 처리될 doc 을 enqueue 하면 야간마다 enqueue→skip→NULL→ enqueue 무한 루프 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-27 07:35:27 +09:00
Hyungi Ahn	8427ac886c	feat(memo): sync content ↔ memo_task_state on create/update + backfill script 본문에 `- [x]` 로 직접 입력된 체크 항목도 checked_at 가 기록되어 10초 후 자동 숨김 대상이 되도록 create_memo / update_memo 에 sync 로직 추가. - _sync_task_state_with_content: - [x] 에 checked_at 없으면 현재 시각으로 기록, - [ ] 또는 사라진 index 는 state 에서 정리 - scripts/backfill_memo_task_state.py: 배포 이전 기존 노트에 현재 시각 backfill (docker compose exec fastapi python /app/scripts/backfill_memo_task_state.py --apply)	2026-04-24 15:40:18 +09:00
Hyungi Ahn	a95294ff42	feat(ops): 야간 auto tier 백필 스케줄러 (PR-B 레거시 해소) 6720건 레거시 문서를 야간에 자동으로 tier triage + deep_summary 처리. app/workers/tier_backfill.py (신규): - APScheduler 30분 주기 트리거. KST 00:00~06:00 시간대만 실제 enqueue. - safety > law > manual 우선순위 25건씩 classify 큐 재투입. - classify 큐 40건 이상 쌓여있으면 MLX 부하 보호로 skip. - drive_sync / memo / news 는 제외 (plan 스코프 밖 또는 가치 낮음). - off-switch: settings.ai.tier_backfill.enabled = false 로 전면 중단 가능. app/main.py lifespan: - scheduler.add_job(tier_backfill_run, interval=30min, id='tier_backfill'). - AsyncIOScheduler 이미 timezone='Asia/Seoul' 로 설정돼 tier_backfill 내부의 zoneinfo('Asia/Seoul') 와 일치. 수치 예상: 야간 6시간 × 2회/시간 × 25건 = 150건/야간. 6720 / 150 = 약 45일이면 전체 레거시 소화. MLX 부하 제어가 가장 강한 관심 — R2 backlog guard 와 중복 안전장치. 운영 중 과부하 감지 시: config.yaml 에 `ai.tier_backfill.enabled: false` 만 넣으면 즉시 정지 (재시작 없이 스케줄러가 매번 체크). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 15:28:28 +09:00
Hyungi Ahn	9d344c87ea	feat(memo): auto-hide completed tasks after 10s with toggle 체크박스 체크 후 10초 경과 항목을 대시보드 핀 메모 / /memos 에서 자동 숨김, 메모 푸터 "완료 N개 보기" 버튼으로 토글. - migration 161: documents.memo_task_state JSONB — {"<idx>":{"checked_at":"ISO"}} - PATCH /memos/{id}/tasks/{task_index} 전용 엔드포인트: · SELECT FOR UPDATE 로 동시 토글 race 차단 · task_index drift 시 stale state 자동 정리 (400 대신 200) · AI 재처리/큐 enqueue 의도적 스킵 + memo_task_toggle_skip_ai 로그 - renderMemoHtml(taskStates, now) → 경과 항목에 memo-task-hidden 클래스 - Svelte 5 $effect cleanup 으로 setInterval 누수 방지	2026-04-24 12:56:55 +09:00
Hyungi Ahn	ebc37961e0	fix(memo): prevent title overwrite on checkbox patch 체크박스 토글 같은 {content}-only PATCH 에서 body.title==None 을 무조건 _auto_title(content)로 재생성해 제목이 체크박스 라인으로 덮어씌워지는 버그. Pydantic model_fields_set 으로 title 전송 여부를 구분해 PATCH semantics 정상화.	2026-04-24 12:56:51 +09:00
Hyungi Ahn	e2b32fe9b7	fix(ai): B-1 R2 risk_flag_requires_26b 를 hard escalate 로 승격 실측 발견 (safety 8건 재분류): - 10574 KRAS (safety_operational) → escalate=true (guard 전 pass) - 10568 JSA (safety_operational) → escalate=false suppressed=True - 10570 PPE (safety_operational) → escalate=false suppressed=True - 동일 도메인인데 4건 중 1건만 26B 처리. 같은 질의 종류 문서가 누구는 깊이 있고 누구는 짧음 → 사용자 관점 일관성 붕괴. 원인: risk_flag_requires_26b 가 soft escalate 분류 → R2 backlog guard 의 ratio 임계치(0.3) 에 걸림. 방금 classify 8건 enqueue 중 앞선 건들이 deep_summary 큐 채우자 뒤 건들이 전부 suppress. 수정: HARD_ESCALATE_REASONS 에 risk_flag_requires_26b 추가. safety/ health/chemical 등 도메인 정책 기반 escalate 는 절대 억제하지 않음. soft 영역은 여전히 남아있음: self_declare (4B 자가선언), deep_requested (recommend_deep_summary). 이 둘만 backlog guard 가 억제 대상. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 12:33:12 +09:00
Hyungi Ahn	93a687a51d	fix(ai): B-1 deep_summary 잘린 응답 field-level regex fallback _parse_outermost_json 도 열린 문자열 중간에 응답 끊기면 실패. 실전 MLX 응답이 entities_confirmed 내부 문자열에서 종료되는 패턴이라 detail/tldr/bullets/inconsistencies 전부 손실되던 이슈. _regex_extract_fields helper 추가: "key":"value" 쌍 개별 매칭으로 앞쪽 완결된 필드만이라도 건진다. detail 이 응답 앞부분에 있어 잘림 지점보다 앞이면 성공. 순서: 1. _parse_outermost_json (brace balance) 2. parse_json_response (기존 regex) 3. _regex_extract_fields (field-level fallback) entities_confirmed 제거 같은 프롬프트 수정은 PR-A 영역이라 건드리지 않고, PR-B 워커에서 방어. 근본 해결은 p3c_deep_summary 에서 불필요 필드 제거 또는 max_tokens 튜닝을 policy 소유자가 결정. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 11:27:04 +09:00
Hyungi Ahn	154cb1c8bd	fix(ai): B-1 deep_summary JSON parser 강건화 (최외곽 JSON 추출) 실측 버그 (doc 10573 산업안전보건법 deep 처리): - 26B MLX 응답 길이 1131자 (8192 token 한도 미도달) 에서 응답이 \`entities_confirmed\` 섹션 중간에 잘림. - parse_json_response 의 regex \`{[^{}](?:{[^{}]}[^{}])}\` 가 1단계 중첩까지만 매칭 + reversed 순회로 "가장 마지막 valid JSON" 우선 반환. - 결과적으로 entities_confirmed 내부 객체 (\`{"people":[],"orgs":[],...}\`) 가 파싱돼 detail/tldr/bullets 전부 손실 → ai_detail_summary 빈값. 수정: deep_summary_worker 에 \`_parse_outermost_json\` helper 추가. brace balance + 문자열 리터럴 인식으로 첫 '{' 부터 최외곽 '}' 까지 추출. 응답이 잘려 closure 없으면 남은 depth 만큼 '}' 보강 후 재시도 (partial 응답도 최대한 복구). parse_json_response 는 fallback. 이 수정 후 doc 10573 재처리 smoke 필요. entities_confirmed 필드는 정보창 UI 에 안 쓰므로 응답에서 제거하는 프롬프트 조정은 다음 라운드. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 11:25:01 +09:00
Hyungi Ahn	165b00f917	fix(ai): B-1 subject_domain 매칭 + RoutingDecision.escalate_to_26b 존중 실측 발견 (safety md 8건 tier triage 결과): 1. 분류 오분류: 본문에 "MSDS" 한 번 스쳐도 msds 도메인 매칭됨. 개인보호구/중대재해/밀폐공간/산업안전보건법 전부 msds 로 잘못 판정. 2. RoutingDecision 무시: PR-A domain_policy 의 high_impact=true 와 risk_flag_requires_26b 때문에 RoutingDecision.escalate_to_26b=True 이지만 내 _classify_escalation_reason 이 이걸 안 봐서 escalate=False 로 마감. safety/msds/hazard_specific 전부 4B 만 돌고 26B 정책 우회. 수정: - _match_subject_domain: (a) title 기반 매칭 우선 추가 — 파일명이 의도의 1차 시그널. (b) 본문 키워드는 2회 이상 등장해야 match (single-mention 오분류 방지). 우선순위도 재배열 (msds 맨 앞 → hazard/safety 뒤로). - _classify_escalation_reason: routing_decision 파라미터 추가. 4B 자체 판정 (long_context / low_confidence / self_declare / deep_requested) 이후 PR-A routing_decision.escalate_to_26b 가 True 이면 그 escalation_reasons 중 "high_impact" 외의 구체 사유(risk_flag_requires_26b 등) 를 채택. - _run_tier_triage: routing_decision 을 먼저 계산하여 _classify_escalation_reason 에 전달. _apply_triage_result 는 routing_decision 을 param 으로 받음 (중복 계산 제거). 이 변경 후 safety/msds/hazard_specific/incident_report 도메인 문서는 항상 26B escalate → deep_summary 큐. MLX 부하 증가하지만 plan 의도대로 정책 준수. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 11:18:59 +09:00
Hyungi Ahn	f872e4666f	fix(ai): B-1 envelope.from_stage PR-A enum 값으로 정정 doc 5260 (confidence 0.3 low_confidence 에스컬레이션) 실측에서 발견: EscalationEnvelope(from_stage='summary_triage') 가 PR-A ValidFromStage ({triage, summarize_short, advice_trigger, classify, night_sweep, ask_pre, unknown}) 에 없어 ValueError 발생 → 모든 deep_summary enqueue 가 envelope 생성 단계에서 터짐. tldr/bullets 기록은 envelope 실패 전에 완료되어 영향 없음 (try/except 가 classify 전체는 보호). P3a short summary 에서의 에스컬레이션 의미에 맞춰 'summarize_short' 로 변경. 내부 task 이름 (SUMMARY_TRIAGE_TASK = 'p3a_short_summary') 는 analyze_events. prompt_version 기록 전용이라 그대로 유지. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 11:04:47 +09:00
Hyungi Ahn	04f9eb6582	feat(ui): B-3 정보창 tier 자동 표시 + 대시보드 3종 카드 정보창 (AnalysisPanel): - doc prop 추가. doc.ai_tldr / ai_bullets / ai_detail_summary / ai_inconsistencies 있으면 버튼 없이 자동 렌더 (Section A). - tier 배지 (triage=흰 / deep=파랑) + tldr + bullets + detail 계층 카드. - inconsistencies kind 별 아이콘: version_drift=Calendar / procedure_conflict= GitBranch / source_conflict=Quote / missing_basis=HelpCircle. warning 톤. - 기존 "고급 분석" 버튼 (/documents/{id}/analyze 4층 응답) 은 Section B 로 유지. AIClassificationEditor: - 제목 옆 tier 배지 ("깊이" accent / "짧음" neutral) — ai_analysis_tier 값 기준. 대시보드 (B-3 3종 카드): - "에스컬레이션 비율 (24h)": escalated_to_26b / triage_total. 20% 초과 적색, 1% 미만 회색 (false negative 신호). reason 상위 4개 뱃지. - "triage JSON 건강도 (24h)": error_code='triage_json_invalid' / triage_total. 5% 초과 적색 (프롬프트/모델 이슈). - "Backlog Suppression (24h)": suppressed_reason IS NOT NULL / triage_total. 10% 초과 주황 (임계치 재조정 신호). Backend: - dashboard.py 에 TierHealthStack 모델 + analyze_events 24h 집계 쿼리. - escalation_by_reason (unnest(escalation_reasons)) + escalation_by_domain (subject_domain) 서브 집계. Frontend types: - stores/system.ts DashboardSummary 에 tier_health 옵셔널 필드 추가. UI 는 PR-A shadow 기간에도 tier_health.triage_total > 0 조건으로 조건부 표시 — 데이터가 없으면 카드 자체가 숨겨져 첫 삽입 시 UX 충격 0. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 10:38:53 +09:00
Hyungi Ahn	34f79f84f2	feat(search): B-2 evidence LLM → 4B triage 전환 + answerability 컬럼 Plan 본래 의도: 근거 선별은 4B, 합성은 26B. - evidence_service: LLM 호출을 primary(26B MLX) → triage(4B Ollama) 로 전환. Ollama concurrent 가능하므로 get_mlx_gate() 제거. synthesis 는 여전히 llm_gate Semaphore(1) 경유로 MLX 보호. - prompt_version v3-evidence-triage bump (synthesis 프롬프트 자체는 v2-600char 그대로, evidence LLM 경로 변경을 분리 추적). - migrations 161/162: analyze_events 에 answerability / partial_basis / suggested_query_count 컬럼 + partial index. /ask 는 이미 ask_events 에 completeness (full/partial/insufficient) 기록 운영 중이므로, analyze_events 쪽은 향후 문서 분석에서 answerability 개념 도입 시 활용 예비. - telemetry record_analyze_event 에 answerability / partial_basis / suggested_query_count 파라미터 확장. 기존 /ask 3-state completeness 로직 (classifier_service + 7-tier gate) 은 그대로 유지 — 이미 Phase 3.5a 에서 완성된 상태. B-2 는 LLM 부하 재분배와 관측성 확장에 집중. MLX 부하 감소 효과: 이전엔 쿼리 1건당 evidence(26B) + synthesis(26B) 2번 MLX 호출. 이제는 evidence(4B Ollama) + synthesis(26B MLX) 로 MLX 호출 절반. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 10:33:32 +09:00
Hyungi Ahn	6fdc48e5b6	feat(ai): B-1 summary tier 분할 — triage(4B) + deep_summary(26B) PR-A policy 레이어를 재사용하여 classify_worker 에 tier triage 경로를 추가. Legacy ai_summary / ai_domain / ai_suggestion 은 유지 (회귀 0), tldr/bullets/ detail/inconsistencies 는 별도 필드로 분리. Migrations (156~160): - 156 documents: ai_tldr, ai_bullets, ai_detail_summary, ai_inconsistencies, ai_analysis_tier 5컬럼 - 157 process_stage 에 'deep_summary' ADD VALUE 단독 (Postgres 동일 트랜잭션 제약 회피) - 158 processing_queue.payload JSONB (envelope 전달) - 159 analyze_events 에 tier + suppressed_reason - 160 suppressed_reason partial index Models/ORM: - Document: 5컬럼 Mapped 추가 - ProcessingQueue: deep_summary enum 확장 + payload 필드, enqueue_stage 에 payload 옵션 - AnalyzeEvent: PR-A shadow 6컬럼 + PR-B tier/suppressed_reason Workers: - classify_worker: 기존 legacy 경로 뒤에 _run_tier_triage 추가. - _match_subject_domain(doc, text): source_channel + 본문 keywords + ai_domain prefix 로 PR-A policy 의 subject_domain 이름 결정 (category 매칭 금지). - R1 TriageOutput pydantic + JSON 깨짐 fallback (triage_json_invalid). - R2 _check_backlog_guard(): 30분 window ratio > threshold OR pending 초과면 soft escalate suppress. hard escalate 는 통과. - R3 _slice_text_ranges(): 260k 초과 시 head 120k + mid 20k + tail 120k 3조각. - escalate 시 EscalationEnvelope 구성 + {envelope, subject_domain} payload 로 deep_summary enqueue. - deep_summary_worker (신규): queue payload 에서 envelope + subject_domain 읽기 → render_26b("p3c_deep_summary", subject_domain) + MLX 호출 (llm_gate Semaphore(1) 경유) → ai_detail_summary + ai_inconsistencies 저장 + ai_analysis_tier='deep'. _filter_inconsistencies 로 허용 kind (version_drift / procedure_conflict / source_conflict / missing_basis) 만 통과 — 구매/계약 kind drop. - queue_consumer: workers dict 에 deep_summary 추가 + BATCH_SIZE=1. next_stages 는 건드리지 않음 — classify → embed/chunk 는 그대로, deep_summary 는 독립 체인. Telemetry: - record_analyze_event: subject_domain / risk_flags / escalation_reasons / confidence / policy_version / shadow_would_route_to / tier / escalated_to_26b / suppressed_reason 파라미터 확장. classify/deep worker 가 mode="summary_triage" 또는 "summary_deep" 로 기록. API: - DocumentResponse 에 ai_tldr / ai_bullets / ai_detail_summary / ai_inconsistencies / ai_analysis_tier 5필드 노출. Prompts: - classify.txt 에 DEPRECATED 주석만 추가 (파일 유지 — rollback 경로 보존). - PR-A 의 app/prompts/policy/p3a_short_summary.txt (4B) 와 p3c_deep_summary.txt (26B) 를 그대로 사용. 내 소유의 summary_triage.txt / summary_deep.txt 는 중복 이라 별도 커밋에서 제거하지 않고 바로 생성 전 삭제. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 10:22:40 +09:00
Hyungi Ahn	490bef1136	feat(ai): B-0 3-tier routing — triage/primary/fallback 슬롯 + AIClient - config.yaml: ai.models 에 triage (gemma4:e4b-it-q8_0, GPU Ollama, context_char_limit=120k, timeout 30s) 신규. primary (MLX gemma-4-26b) 는 에스컬레이션 전용 역할 명시. fallback 을 gemma4:e4b 로 통일 (exaone 제거 이미 반영). classifier/verifier 는 optional 유지, vision 은 optional 로 완화 (미사용 정리 준비). - core/config.py: AIConfig 에 triage 필드 추가, vision 은 Optional 로 전환. AIModelConfig.context_char_limit + DeepSummaryBacklogConfig (R2 backlog guard 임계치 ratio 0.3 / pending 5 / window 30min) 스키마 신설. load_settings 가 models.get("vision") graceful. - ai/client.py: call_triage / call_primary / call_fallback 3-tier 진입점 신규. primary 는 caller 가 get_mlx_gate() 블록 안에서 호출 해야 한다는 계약 docstring. classify/summarize 는 DEPRECATED 주석 만 추가, 기존 호출부 (eval runner 등) 를 위해 유지. PR-B B-0 Day 1. 기존 primary 경로 변경 없음 — 회귀 0 기대. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 10:05:24 +09:00
Hyungi Ahn	628d886cba	fix(policy): mount domain_policy.yaml into fastapi + multi-path loader 배포 검증 중 발견: domain_policy.yaml 이 repo root 에 있지만 fastapi 컨테이너의 build context 는 ./app 이라 COPY 가 포함하지 못함. 결과 load_policy() 가 FileNotFoundError. 1. docker-compose.yml: config.yaml 과 동일 패턴으로 읽기전용 bind mount - ./domain_policy.yaml:/app/domain_policy.yaml:ro 2. app/policy/loader.py: _resolve_path 에 4 개 후보 검색 추가 — cwd / /app / /app/.. / <this>.parent.parent.parent 순으로 파일 존재 확인. 첫 매칭 반환. 로컬/컨테이너/다른 배포 환경 모두 호환. CI: pytest tests/policy/ -q → 98 passed. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 09:45:10 +09:00

1 2 3 4 5

203 Commits