Files

hyungi 45cabc9aea refactor: GPU 서버 재구성 + ChromaDB→Qdrant 마이그레이션

- embed_to_chroma.py → embed_to_qdrant.py 리라이트 (bge-m3 + Qdrant REST API)
- auto_classify.scpt: embed_to_qdrant.py 경로 변경 + sourceChannel 덮어쓰기 버그 수정
- requirements.txt: chromadb/schedule 제거, qdrant-client/flask/gunicorn 추가
- credentials.env.example: GPU_SERVER_IP 항목 추가
- GPU 서버 재구성 계획서 (docs/gpu-restructure.md) + dev-roadmap/commands 통합
- CLAUDE.md, README.md, deploy.md 현행화

GPU 서버 변경사항 (이미 적용됨):
  - Ollama: qwen3.5:9b, id-9b 제거 → bge-m3 + bge-reranker-v2-m3
  - Surya OCR 서비스 (:8400, systemd)
  - Docker + NFS + Komga 이전 (:25600)
  - tk-ai-service: Ollama API → OpenAI API 전환 (MLX 35B)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

2026-03-30 13:19:31 +09:00

11 KiB

Raw Blame History

DEVONThink PKM 시스템 — Claude Code 작업 가이드

마지막 업데이트: 2026-03-29 개발 현황: Phase 1 초기 구축 완료 → Phase 1.5 GPU 서버 재구성 + Phase 2 인프라 수정 병행 중

프로젝트 개요

Mac mini M4 Pro(64GB, 4TB) 기반 개인 지식관리(PKM) 시스템. DEVONthink 4를 중앙 허브로, MLX AI 자동 분류 + 법령 모니터링 + 일일 다이제스트를 자동화한다.

핵심 문서 (반드시 먼저 읽을 것)

docs/architecture.md — 전체 시스템 아키텍처 (DB 구조, 태그, AI, 자동화 전체)
docs/industrial-safety-blueprint.md — 04_Industrial Safety DB 상세 설계
docs/claude-code-commands.md — 단계별 작업 지시서 (현재 진행 상황 포함)
docs/dev-roadmap.md — 개발 로드맵 (Phase 1.5~6)
docs/deploy.md — Mac mini 배포 가이드 + 트러블슈팅
docs/gpu-restructure.md — GPU 서버 재구성 상세 계획 (Phase 1.5)

개발 현황 요약

[Phase 1: 초기 구축] ██████████████████░░ 90% — 코드 작성 완료, 인프라 일부 미해결

  ✅ 1단계: 프로젝트 구조          — 완료
  ✅ 2단계: AI 분류 프롬프트        — MLX Qwen3.5 OpenAI 호환 전환 완료
  ✅ 3단계: AppleScript            — auto_classify + omnifocus_sync 완료
  ⚠️ 4단계: 법령 모니터링          — 외국(US/JP/EU) OK, 한국 API IP 미등록
  ❌ 5단계: MailPlus 수집          — IMAP Connection refused
  ⚠️ 6단계: Daily Digest          — 코드 완성, 실행 테스트 미진행
  ✅ 7단계: DEVONagent 가이드       — 완료
  ❌ 8단계: 전체 테스트            — 미진행
  ✅ 추가:  PKM API 서버           — 기본 동작, 개선 필요

[Phase 1.5: GPU 서버 재구성] ░░░░░░░░░░░░░░░░░░░░ 0% — 계획 완료, 실행 대기
  → docs/gpu-restructure.md 참조
  → GPU 모델 교체, Surya OCR, Komga 이전, Qdrant 통합, RAG 파이프라인

[Phase 2: 인프라 + 버그 픽스] ░░░░░░░░░░░░░░░░░░░░ 0% — Phase 1.5와 병행 착수 대기
  → docs/dev-roadmap.md 참조

알려진 이슈 (현재)

[P1 — 인프라]
- 한국 법령 API: open.law.go.kr에 Mac mini 공인IP 등록 필요
- MailPlus IMAP: 993 포트 Connection refused — Synology DSM에서 IMAP 활성화 확인
- requirements.txt: flask 누락, chromadb→qdrant-client 교체, schedule 미사용
- launchd: plist 파일은 있으나 실제 등록 여부 미확인
- GPU 서버: 중복 LLM 모델 제거 + Surya OCR/Komga 이전 필요 → gpu-restructure.md

[P2 — 코드 버그]
- JP 번역: MLX thinking 출력이 번역 결과에 오염 ("Wait, I'll check...")
- API 서버: /devonthink/stats → 500 에러, 한글 쿼리 인코딩 400 에러
- AppleScript: 경로 하드코딩 + sourceChannel 이중 설정 버그 (73행)
- embed_to_chroma.py: GPU_SERVER_IP 미설정으로 미작동 → Qdrant 리라이트 예정

네트워크 환경

Mac mini (운영 서버):
  - MLX 서버: http://localhost:8800/v1/chat/completions (Qwen3.5-35B-A3B)
  - PKM API: http://127.0.0.1:9900 (Flask, GUI 세션 필수)
  - DEVONthink: 로컬 실행 중
  - OmniFocus: 로컬 실행 중

Synology NAS (DS1525+):
  - 도메인: ds1525.hyungi.net
  - Tailscale IP: 100.101.79.37
  - 포트: 15001
  - WebDAV: webdav.hyungi.net/Document_Server/DEVONThink/
  - MailPlus IMAP: mailplus.hyungi.net:993 (SSL) ← 현재 연결 불가

GPU 서버 (RTX 4070 Ti Super, 192.168.1.186):
  - 현재: Ollama(11434) + qwen3.5:9b + id-9b, Plex(32400)
  - 계획: bge-m3(임베딩) + bge-reranker(리랭킹) + Surya OCR(:8400) + Komga(:25600)
  - → docs/gpu-restructure.md 참조

TKSafety: tksafety.technicalkorea.net (설정만, 나중에 활성화)

인증 정보

위치: ~/.config/pkm/credentials.env
템플릿: ./credentials.env.example
스크립트에서 python-dotenv로 로딩
필수 키: LAW_OC, MAILPLUS_HOST/PORT/USER/PASS, NAS_DOMAIN, GPU_SERVER_IP

DEVONthink DB 구조 (13개)

운영 DB (신규 생성 완료):
  Inbox     — 모든 자료 최초 진입점
  Archive   — 이메일, 채팅 로그
  Projects  — 진행 중 프로젝트

도메인 DB (기존, 유지):
  00_Note_BOX, 01_Philosophie, 02_Language, 03_Engineering,
  04_Industrial safety, 05_Programming, 07_General Book,
  97_Production drawing, 99_Reference Data, 99_Technicalkorea

커스텀 메타데이터 필드 (DEVONthink에 등록 완료)

omnifocusTaskID  — Single-Line Text — OmniFocus 역링크
sourceURL        — URL             — 원본 출처
synologyPath     — Single-Line Text — NAS 원본 경로
lastAIProcess    — Date            — 마지막 AI 처리 일시
sourceChannel    — Single-Line Text — 유입 경로 (아래 값 중 하나)
dataOrigin       — Single-Line Text — work 또는 external

sourceChannel 값 (유입 경로 추적)

tksafety     — TKSafety API (업무 실적)      → dataOrigin = work
devonagent   — DEVONagent 자동 수집 (뉴스)    → dataOrigin = external
law_monitor  — 법령 API (법령 변경)           → dataOrigin = external
inbox_route  — Inbox → AI 분류               → AI 판별
email        — MailPlus 이메일               → AI 판별
web_clip     — Web Clipper 스크랩             → dataOrigin = external
manual       — 직접 추가                     → dataOrigin = work (기본)

AI 모델 구성

Tier 1 (Mac mini, 상시):
  mlx-community/Qwen3.5-35B-A3B-4bit — 태그 생성, 문서 분류, 요약, JP 번역
  → http://localhost:8800/v1/chat/completions (OpenAI 호환 API)
  → MLX 서버로 실행 중 (Ollama 아님)
  ※ thinking 모드 주의: /nothink 명시 또는 JSON 추출 후처리 필요

Tier 2 (Claude API, 필요시):
  claude-sonnet — 복잡한 분석, 장문 처리
  → CLAUDE_API_KEY 사용 (아직 미연동)

Tier 3 (GPU 서버, 특수) — ※ 재구성 예정 (gpu-restructure.md 참조):
  현재: qwen3.5:9b-q8_0, id-9b (제거 예정)
  변경 후:
    bge-m3           — 벡터 임베딩 (1024차원, Ollama)
    bge-reranker-v2-m3 — RAG 리랭킹 (Ollama)
    Surya OCR        — 이미지/스캔 문서 OCR (FastAPI, 포트 8400)

파일 구조 (현재)

./
├── CLAUDE.md                       ← 이 파일 (Claude Code 작업 가이드)
├── README.md                       ← 프로젝트 설명
├── requirements.txt                ← Python 패키지 (flask 추가 필요!)
├── .gitignore
├── credentials.env.example         ← 인증 정보 템플릿
├── scripts/
│   ├── pkm_utils.py                ← 공통 유틸 (로깅, 인증, LLM, AppleScript)
│   ├── law_monitor.py              ← 법령 모니터링 (한국+US/JP/EU)
│   ├── mailplus_archive.py         ← MailPlus 이메일 수집
│   ├── pkm_daily_digest.py         ← 일일 다이제스트 생성
│   ├── pkm_api_server.py           ← REST API 서버 (Flask, 포트 9900)
│   ├── embed_to_chroma.py          ← ChromaDB 벡터 임베딩 (→ embed_to_qdrant.py로 교체 예정)
│   └── prompts/
│       └── classify_document.txt   ← AI 분류 프롬프트 템플릿
├── applescript/
│   ├── auto_classify.scpt          ← Inbox 자동 분류 Smart Rule
│   └── omnifocus_sync.scpt         ← OmniFocus 연동 Smart Rule
├── launchd/
│   ├── net.hyungi.pkm.law-monitor.plist
│   ├── net.hyungi.pkm.mailplus.plist
│   └── net.hyungi.pkm.daily-digest.plist
├── data/
│   ├── law_last_check.json         ← 법령 마지막 확인 시점
│   └── laws/                       ← 수집된 법령 문서 (16건 수집 완료)
├── logs/                           ← 실행 로그
├── docs/
│   ├── architecture.md             ← 시스템 아키텍처
│   ├── industrial-safety-blueprint.md
│   ├── claude-code-commands.md     ← 단계별 작업 지시서
│   ├── deploy.md                   ← Mac mini 배포 가이드
│   ├── devonagent-setup.md         ← DEVONagent 검색 세트 가이드
│   ├── dev-roadmap.md              ← 개발 로드맵 (Phase 1.5~6)
│   └── gpu-restructure.md          ← GPU 서버 재구성 상세 계획
├── tests/
│   └── test_classify.py            ← AI 분류 테스트 (5종 문서)
└── venv/                           ← Python 가상환경

작업 순서

Phase 1 (완료): 초기 구축

docs/claude-code-commands.md의 1~7단계 → 코드 작성 완료

Phase 1.5 (계획 완료): GPU 서버 재구성

docs/gpu-restructure.md 참조:

GPU 모델 교체 (LLM 제거, bge-m3/reranker 설치)
Docker + NFS + Komga 이전
Surya OCR 설치
PKM 코드 갱신 (Qdrant 통합, embed 스크립트, AppleScript)
RAG 파이프라인 구축 (후순위)

Phase 2 (진행 중): 인프라 수정 + 버그 픽스

docs/dev-roadmap.md 참조 (Phase 1.5와 병행):

requirements.txt 수정 ← Phase 1.5와 합산 (qdrant-client, flask)
한국 법령 API IP 등록
MailPlus IMAP 연결 수정
JP 번역 thinking 오염 필터링
API 서버 한글 인코딩 + stats 500 에러 수정
AppleScript 하드코딩 경로 변수화 ← Phase 1.5와 합산
launchd 등록 및 확인

Phase 3~4: API 서버 개선 + 테스트

gunicorn 전환 + launchd plist 추가
엔드포인트 추가 (/law-monitor/status, /digest/latest)
모듈별 + E2E 통합 테스트 → docs/test-report.md

Phase 5~6: 운영 안정화

로그 로테이션, Synology Chat 알림, 문서 보완

코딩 규칙

Python 3.11+ (Mac mini 기본, 현재 3.14 확인됨)
인증 정보는 반드시 credentials.env에서 로딩 (하드코딩 금지)
AppleScript는 DEVONthink/OmniFocus와 연동 (osascript로 호출)
로그는 ~/Documents/code/DEVONThink_my\ server/logs/에 저장
launchd plist는 launchd/ 디렉토리에 생성, Mac mini에서 심볼릭 링크로 등록
LLM 호출 시 pkm_utils.llm_generate() 사용 (thinking 후처리 포함)
한글 주석 사용

배포 방법

MacBook Pro (개발) → Gitea push → Mac mini에서 git pull
또는 Cowork 모드에서 직접 파일 수정 → git push

Mac mini에서:
  cd ~/Documents/code/DEVONThink_my\ server/
  git pull
  source venv/bin/activate
  pip install -r requirements.txt
  # launchd 등록은 deploy.md 참조

주의사항

credentials.env는 git에 올리지 않음 (.gitignore에 포함)
DEVONthink, OmniFocus는 Mac mini에서 GUI로 실행 중이어야 AppleScript 작동
PKM API 서버도 GUI 세션에서 실행 필수 (AppleScript 중계)
법령 API (LAW_OC): 키 발급 완료, Mac mini 공인IP 등록 필요
TKSafety 연동은 설계만 완료, 구현은 나중에
GPU 서버 Tailscale IP는 별도 확인 후 credentials.env에 추가
MLX 서버 thinking 모드: 번역/분류 시 /nothink 프리픽스 또는 후처리 필수

11 KiB Raw Blame History