• feat: DEVONthink 전체 문서 배치 임베딩 스크립트

    hyungi released this 2026-03-30 16:41:19 +09:00

    • batch_embed.py: 9,000+ 문서 배치 임베딩
      • DB별 순차 처리, 500건씩 AppleScript 배치 텍스트 추출
      • GPU bge-m3 배치 임베딩 (32건/호출)
      • Qdrant 배치 upsert (100건/호출)
      • --sync: 삭제된 문서 Qdrant 정리 (고아 포인트 제거)
      • --force: 전체 재임베딩
      • --db: 특정 DB만 처리
      • GPU 헬스체크 + Qdrant UUID 중복 스킵
      • 페이로드: uuid, title, db_name, text_preview, embedded_at

    Co-Authored-By: Claude Opus 4.6 (1M context) noreply@anthropic.com

    Downloads