hyungi/hyungi_document_server

Fix/md render katex tldr #40

Merged

hyungi merged 6 commits from fix/md-render-katex-tldr into main

2026-06-15 14:17:44 +09:00

Author	SHA1	Message	Date
hyungi	b0a73f8506	feat(nav): 상단 nav 질문·이드 제거 + 메모 추가 데스크탑 상단 nav 와 모바일 하단 탭바 모두에서 질문(/ask)·이드(/chat) 링크 제거, 메모(/memos) 추가(모바일은 기존 존재). 라우트 코드는 보존(nav 노출만 제거). 미사용 아이콘 import(HelpCircle·MessageCircle) 정리. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 14:16:23 +09:00
hyungi	2d6d1b8e8a	fix(markdown): 수식 pre-render(katex 직접) + TL;DR 마크다운 렌더 본문 $$수식$$가 raw로 노출되던 문제: marked-katex 토크나이저가 개요 anchor splice/런타임 환경 영향으로 미발화 → marked 이전에 katex.renderToString 으로 직접 렌더 후 placeholder 복원(위치·인접 무관). TL;DR(ai_tldr)도 plain-text 보간이라 마크다운 미렌더 → renderDocMarkdown 경유로 교체(+summary-md 스타일). Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 14:05:35 +09:00
hyungi	4c111ca7f2	fix(observability): BackgroundJobItem 응답 모델에 machine 필드 추가 (직렬화 누락 수정) `f325bd0` 이 서비스 payload·frontend 타입엔 machine 을 넣었으나 API Pydantic response_model(BackgroundJobItem)에 누락 → FastAPI 가 직렬화 시 탈락. 한 줄 추가. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 03:43:55 +00:00
hyungi	f325bd0509	feat(observability): digest/briefing 을 처리 보드에 맥미니 작업으로 노출 (background_jobs) 큐 밖 cron 생성 작업(global_digest/morning_briefing)이 processing_queue stage 가 아니라 보드에 안 잡혀, 맥미니가 11분짜리 digest 를 돌려도 idle 처럼 보였다. `ebbcaf8` 의 background_jobs 메커니즘 재사용: - digest_worker/briefing_worker = start_job→finish_job (best-effort, 본작업 무해) - pipeline = cluster 완료마다 heartbeat(processed/total) → 진행바 - queue_overview = kind→machine 맵으로 payload 에 machine 필드 (맥미니 귀속) - 보드 = 머신 레인에 dot 점등 + "생성 중: <label> N/T" 표시 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 03:36:57 +00:00
hyungi	d4e1f76e81	fix(news)!: mlx_gate_concurrency 4→2 롤백 — gate=4 가 대형 프롬프트(digest/briefing+deep 6764tok) 동시성으로 맥미니 mlx_vlm OOM/연결드롭 유발(08:45 서버 크래시·재시작 실측). digest cap 3000→5400(gate=2 보정). timeout/deep-split 유지 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-14 23:55:44 +00:00
hyungi	a82b0724df	fix(news): digest/briefing 생성 LLM 타임아웃 게이트 단일소스화 + deep_summary 컨슈머 분리 2026-06-11 맥미니 모델 교체(Gemma4 26B→Qwen3.6-27B-6bit, 콜당 ~90~300s)의 타임아웃 상향 sweep 이 config.yaml/synthesis 만 갱신하고 digest/briefing 코드의 하드코딩 LLM_CALL_TIMEOUT=25(빠른 Gemma 기준)를 누락 → digest 600s 하드캡 초과로 06-10 이후 미생성, briefing 4/4 LLM 폴백(status=failed). (적대 리뷰로 블로커 정정: concurrency=1 사설 세마포로는 digest 44~68 클러스터가 하드캡에 여전히 걸림 + llm_gate 영구 룰 위반.) - 타임아웃·재시도·하드캡을 config.pipeline 단일소스로 이관(digest_llm_timeout_s=300, attempts=2, pipeline_hard_cap_s=3000). 다음 모델 교체 때 재발 차단. - digest/briefing LLM 호출을 사설 Semaphore 제거하고 전역 MLX gate(BACKGROUND) 경유로 변경 — llm_gate 영구 룰(같은 endpoint 단일 게이트, 새 Semaphore 금지) 준수 + ask/eid(FOREGROUND)와 조율. 동시성 lever = 기존 mlx_gate_concurrency 2→4 (continuous batching 실측 — 3동시콜 wall 121s ≈ 단일콜, 직렬 대비 ~3배). - digest/briefing pipeline cluster 루프를 asyncio.gather 동시 실행으로 전환 (실동시성은 게이트가 제한, rank/순서 보존). - deep_summary(70~300s)를 메인 consume_queue 에서 분리해 consume_deep_queue 신설 (markdown/fast split 선례) — 단일 deep 호출이 1분 틱 초과로 메인 큐를 영구 coalesce 시키던 문제 제거. - 죽은 PIPELINE_HARD_CAP=600(briefing/pipeline.py) 제거, summarizer docstring 갱신, deep 컨슈머 disjoint/hold 테스트 추가. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-14 23:29:56 +00:00