-
feat: DEVONthink 전체 문서 배치 임베딩 스크립트
released this
2026-03-30 16:41:19 +09:00 - batch_embed.py: 9,000+ 문서 배치 임베딩
- DB별 순차 처리, 500건씩 AppleScript 배치 텍스트 추출
- GPU bge-m3 배치 임베딩 (32건/호출)
- Qdrant 배치 upsert (100건/호출)
- --sync: 삭제된 문서 Qdrant 정리 (고아 포인트 제거)
- --force: 전체 재임베딩
- --db: 특정 DB만 처리
- GPU 헬스체크 + Qdrant UUID 중복 스킵
- 페이로드: uuid, title, db_name, text_preview, embedded_at
Co-Authored-By: Claude Opus 4.6 (1M context) noreply@anthropic.com
Downloads
- batch_embed.py: 9,000+ 문서 배치 임베딩