Go to file

Hyungi Ahn c81b728ddf refactor(search): Phase 2.1 QueryAnalyzer를 async-only 구조로 전환

## 철학 수정 (실측 기반)

gemma-4-26b-a4b-it-8bit MLX 실측:
  - full query_analyze.txt (prompt_tok=2406) → 10.5초
  - max_tokens 축소 무효 (모델 자연 EOS 조기 종료)
  - 쿼리 길이 영향 거의 없음 (프롬프트 자체가 지배)
  → 800ms timeout 가정은 13배 초과. 동기 호출 완전히 불가능.

따라서 QueryAnalyzer는 "즉시 실행하는 기능" → "미리 준비해두는 기능"으로
포지셔닝 변경. retrieval 경로에서 analyzer 동기 호출 **금지**.

## 구조

```
query → retrieval (항상 즉시)
         ↘ trigger_background_analysis (fire-and-forget)
            → analyze() [5초+] → cache 저장

다음 호출 (동일 쿼리) → get_cached() 히트 → Phase 2 파이프라인 활성화
```

## 변경 사항

### app/prompts/query_analyze.txt
 - 5971 chars → 2403 chars (40%)
 - 예시 4개 → 1개, 규칙 설명 축약
 - 목표 prompt_tok 2406 → ~600 (1/4)

### app/services/search/query_analyzer.py
 - LLM_TIMEOUT_MS 800 → 5000 (background이므로 여유 OK)
 - PROMPT_VERSION v1 → v2 (cache auto-invalidate)
 - get_cached / set_cached 유지 — retrieval 경로 O(1) 조회
 - trigger_background_analysis(query) 신규 — 동기 함수, 즉시 반환, task 생성
 - _PENDING set으로 task 참조 유지 (premature GC 방지)
 - _INFLIGHT set으로 동일 쿼리 중복 실행 방지
 - prewarm_analyzer() 신규 — startup에서 15~20 쿼리 미리 분석
 - DEFAULT_PREWARM_QUERIES: 평가셋 fixed 7 + 법령 3 + 뉴스 2 + 실무 3

### app/api/search.py
 - 기존 sync analyzer 호출 완전 제거
 - analyze=True → get_cached(q) 조회만 O(1)
   - hit: query_analysis 활용 (Phase 2.2/2.3 파이프라인 조건부 활성화)
   - miss: trigger_background_analysis(q) + 기존 경로 그대로
 - timing["analyze_ms"] 제거 (경로에 LLM 호출 없음)
 - notes에 analyzer cache_hit/cache_miss 상태 기록
 - debug.query_analysis는 cache hit 시에만 채워짐

### app/main.py
 - lifespan startup에 prewarm_analyzer() background task 추가
 - 논블로킹 — 앱 시작 막지 않음
 - delay_between=0.5로 MLX 부하 완화

## 기대 효과

 - cold 요청 latency: 기존 Phase 1.3 그대로 (회귀 0)
 - warm 요청 + prewarmed: cache hit → query_analysis 활용
 - 예상 cache hit rate: 초기 70~80% (prewarm) + 사용 누적
 - Phase 2.2/2.3 multilingual/filter 기능은 cache hit 시에만 동작

## 참조

 - memory: feedback_analyzer_async_only.md (영구 룰 저장)
 - plan: ~/.claude/plans/zesty-painting-kahan.md ("철학 수정" 섹션)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

2026-04-08 14:47:09 +09:00

app

refactor(search): Phase 2.1 QueryAnalyzer를 async-only 구조로 전환

2026-04-08 14:47:09 +09:00

docs

security: NAS 마운트 검증 + AI 서비스 포트 제한 + deploy 문서 갱신

2026-04-03 08:25:07 +09:00

frontend

fix(ui): Tailwind v4 z-index 유틸리티 누락 — @utility 로 등록

2026-04-08 13:28:54 +09:00

gpu-server

infra: migrate application from Mac mini to GPU server

2026-04-03 07:47:09 +09:00

migrations

feat(search): Phase 1.2-AB — migration 016 + trigram retrieval

2026-04-07 14:36:22 +09:00

reports

test(search): Phase 0.5 fusion 전략 A/B 비교 결과

2026-04-07 09:25:49 +09:00

scripts

fix: update migration script to read .dtBase2/Files.noindex directly

2026-04-03 08:17:44 +09:00

services/kordoc

fix: convert kordoc service to ESM (kordoc requires ESM import)

2026-04-02 14:38:34 +09:00

tests

feat(search): Phase 1.3 TEI reranker 통합 (코드 골격)

2026-04-08 12:41:47 +09:00

.gitignore

chore: add .env to gitignore (docker-compose variable substitution)

2026-04-02 13:53:23 +09:00

Caddyfile

infra: migrate application from Mac mini to GPU server

2026-04-03 07:47:09 +09:00

CLAUDE.md

fix: preview enum 누락 + AI summary thinking 제거 + CLAUDE.md 전면 갱신

2026-04-03 12:38:59 +09:00

config.yaml

fix(ai): primary -> mlx-proxy 8801 + align model to gemma

2026-04-08 04:40:06 +00:00

credentials.env.example

infra: migrate application from Mac mini to GPU server

2026-04-03 07:47:09 +09:00

docker-compose.yml

fix(deploy): TEI 1.5 → 1.7 (1.5는 reranker 모델 다운로드 버그)

2026-04-08 13:18:37 +09:00

README.md

infra: migrate application from Mac mini to GPU server

2026-04-03 07:47:09 +09:00

README.md

hyungi_Document_Server

Self-hosted 개인 지식관리(PKM) 웹 애플리케이션

기술 스택

백엔드: FastAPI + SQLAlchemy (async)
데이터베이스: PostgreSQL 16 + pgvector + pg_trgm
프론트엔드: SvelteKit
문서 파싱: kordoc (HWP/HWPX/PDF → Markdown)
AI: Qwen3.5-35B-A3B (MLX), nomic-embed-text, Claude API (폴백)
인프라: Docker Compose, Caddy, Synology NAS

주요 기능

문서 자동 분류/태그/요약 (AI 기반)
전문검색 + 벡터 유사도 검색
HWP/PDF/Markdown 문서 뷰어
법령 변경 모니터링 (산업안전보건법 등)
이메일 자동 수집 (MailPlus IMAP)
일일 다이제스트
CalDAV 태스크 연동 (Synology Calendar)

Quick Start

git clone https://git.hyungi.net/hyungi/hyungi_document_server.git hyungi_Document_Server
cd hyungi_Document_Server

# 인증 정보 설정
cp credentials.env.example credentials.env
nano credentials.env  # 실제 값 입력

# 실행
docker compose up -d

http://localhost:8000/docs 에서 API 문서 확인

디렉토리 구조

├── app/              FastAPI 백엔드 (API, 워커, AI 클라이언트)
├── frontend/         SvelteKit 프론트엔드
├── services/kordoc/  문서 파싱 마이크로서비스 (Node.js)
├── gpu-server/       GPU 서버 배포 (AI Gateway)
├── migrations/       PostgreSQL 스키마
├── docs/             설계 문서, 배포 가이드
└── tests/            테스트 코드

인프라 구성

서버	역할
Mac mini M4 Pro	Docker Compose (FastAPI, PostgreSQL, kordoc, Caddy) + MLX AI
Synology NAS	파일 원본 저장, Synology Office/Drive/Calendar/MailPlus
GPU 서버	AI Gateway, 벡터 임베딩, OCR, 리랭킹

문서

아키텍처 — 전체 시스템 설계
배포 가이드 — Docker Compose 배포 방법
개발 단계 — Phase 0~5 개발 계획

Languages

Python 51.7%

Svelte 40.1%

TypeScript 3.4%

HTML 2.4%

CSS 1%

Other 1.4%