Files
syn-chat-bot/QUICK_REFERENCE.md
hyungi 6e6ffaa04b RAG 아키텍처 v2: 3단계 라우팅, 멀티-컬렉션 RAG, 선택적 메모리
Phase 1-3 구현:
- init.sql v2: 12테이블 (기존 5 + 신규 7) + 분류기 v2 프롬프트
- migrate-v2.sql: 기존 DB 마이그레이션 스크립트
- setup-qdrant.sh: tk_company 컬렉션 + payload 인덱스 설정
- 워크플로우 v2 (37노드): 토큰검증, Rate Limit, 프리필터,
  분류기v2(response_tier), 3-tier 라우팅(local/Haiku/Opus),
  멀티-컬렉션 RAG, 예산 체크, 선택적 메모리
- .env.example + docker-compose.yml: 새 환경변수 추가
- CLAUDE.md, QUICK_REFERENCE.md, docs/architecture.md 전면 갱신

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-11 12:51:30 +09:00

7.9 KiB

Quick Reference

작업 시작 전 체크리스트.

현재 상태 확인

# 챗봇 컨테이너 상태
docker ps -a --filter "name=bot-" --format "table {{.Names}}\t{{.Status}}\t{{.Ports}}"

# Qdrant 상태 + 3컬렉션 확인
docker ps --filter "name=qdrant" --format "table {{.Names}}\t{{.Status}}"
curl -s http://localhost:6333/collections | python3 -c "import sys,json; [print(f'  {c[\"name\"]}') for c in json.loads(sys.stdin.read())['result']['collections']]"

# 맥미니 Ollama 모델 확인
ollama list

# GPU 서버 Ollama 상태
curl -s http://192.168.1.186:11434/api/tags | python3 -m json.tool

# GPU 서버 Qwen 9B 헬스체크
curl -s http://192.168.1.186:11434/api/generate -d '{"model":"qwen3.5:9b-q8_0","prompt":"hi","stream":false}' | python3 -m json.tool

접속 정보

서비스 URL
n8n 편집기 http://localhost:5678
Qdrant 대시보드 http://localhost:6333/dashboard
bot-postgres localhost:15478
Ollama API (맥미니) http://localhost:11434
Ollama API (GPU) http://192.168.1.186:11434
Synology Chat NAS (192.168.1.227)

Docker 명령어

# 프로젝트 경로
cd ~/Documents/code/syn-chat-bot

# 시작/종료
docker compose up -d
docker compose down

# 로그 확인
docker compose logs -f bot-n8n
docker compose logs -f bot-postgres

# n8n만 재시작
docker compose restart bot-n8n

# DB 접속
docker exec -it bot-postgres psql -U bot -d chatbot

# DB 테이블 확인
docker exec bot-postgres psql -U bot -d chatbot -c '\dt'

# v2 마이그레이션 실행 (기존 DB가 있을 때)
docker exec -i bot-postgres psql -U bot -d chatbot < init/migrate-v2.sql

# Qdrant tk_company 컬렉션 + 인덱스 설정
bash init/setup-qdrant.sh

헬스체크 (전체)

# 한 번에 전체 확인
echo "=== Docker ===" && \
docker ps -a --filter "name=bot-" --filter "name=qdrant" --format "table {{.Names}}\t{{.Status}}" && \
echo "=== 맥미니 Ollama ===" && \
curl -s http://localhost:11434/api/tags | python3 -c "import sys,json; [print(f'  {m[\"name\"]}') for m in json.loads(sys.stdin.read())['models']]" && \
echo "=== GPU 서버 Ollama ===" && \
curl -s http://192.168.1.186:11434/api/tags | python3 -c "import sys,json; [print(f'  {m[\"name\"]}') for m in json.loads(sys.stdin.read())['models']]" && \
echo "=== Qdrant 컬렉션 ===" && \
curl -s http://localhost:6333/collections | python3 -c "import sys,json; [print(f'  {c[\"name\"]}') for c in json.loads(sys.stdin.read())['result']['collections']]" && \
echo "=== tk_company ===" && \
curl -s http://localhost:6333/collections/tk_company | python3 -c "import sys,json; r=json.loads(sys.stdin.read())['result']; print(f'  벡터수: {r[\"points_count\"]}, 상태: {r[\"status\"]}')" 2>/dev/null || echo "  (미생성)" && \
echo "=== n8n ===" && \
curl -s -o /dev/null -w '  HTTP %{http_code}' http://localhost:5678 && echo && \
echo "=== API 사용량 ===" && \
docker exec bot-postgres psql -U bot -d chatbot -t -c "SELECT tier, call_count, estimated_cost FROM api_usage_monthly WHERE year=EXTRACT(YEAR FROM NOW()) AND month=EXTRACT(MONTH FROM NOW())" 2>/dev/null || echo "  (테이블 없음)"

디렉토리 구조

syn-chat-bot/
├── docker-compose.yml    ← 컨테이너 정의
├── .env                  ← API 키, DB 비밀번호, 토큰, 예산 (git 제외)
├── .env.example          ← 환경변수 템플릿
├── CLAUDE.md             ← 프로젝트 문서
├── QUICK_REFERENCE.md    ← 이 파일
├── docs/
│   ├── architecture.md   ← 아키텍처, DB 스키마, 파이프라인 상세
│   └── claude-code-playbook.md
├── n8n/
│   ├── data/             ← n8n 런타임 데이터
│   └── workflows/
│       └── main-chat-pipeline.json  ← 메인 워크플로우 (37노드)
├── init/
│   ├── init.sql          ← DB 초기 스키마 v2 (12테이블)
│   ├── migrate-v2.sql    ← 기존 DB 마이그레이션
│   └── setup-qdrant.sh   ← Qdrant 컬렉션/인덱스 설정
└── postgres/data/        ← DB 데이터

트러블슈팅

# n8n 웹훅 안 올 때 — NAS에서 맥미니 접근 가능한지 확인
curl http://<맥미니IP>:5678/webhook-test/chat

# Ollama 임베딩 테스트 (맥미니)
curl http://localhost:11434/api/embeddings -d '{"model":"bge-m3","prompt":"test"}'

# GPU 서버 분류 테스트
curl http://192.168.1.186:11434/api/generate -d '{"model":"qwen3.5:9b-q8_0","prompt":"안녕하세요","stream":false}'

# Qdrant 컬렉션 확인
curl http://localhost:6333/collections

# tk_company 검색 테스트
curl -X POST http://localhost:6333/collections/tk_company/points/search \
  -H 'Content-Type: application/json' \
  -d '{"vector": [0.1, ...], "limit": 3, "with_payload": true}'

# bot-postgres 접속
docker exec -it bot-postgres psql -U bot -d chatbot

# 분류기 로그 확인
docker exec bot-postgres psql -U bot -d chatbot -c "SELECT created_at, output_json->>'intent', output_json->>'response_tier', fallback_used FROM classification_logs ORDER BY created_at DESC LIMIT 10"

# API 사용량 확인
docker exec bot-postgres psql -U bot -d chatbot -c "SELECT * FROM api_usage_monthly ORDER BY year DESC, month DESC"

# GPU 서버 연결 안 될 때
ping 192.168.1.186
curl -s http://192.168.1.186:11434/api/tags

n8n 접속 정보

Synology Chat 연동

NAS에서 Outgoing Webhook 설정 필요:

  1. Synology Chat > 통합 > 봇 > 만들기
  2. 발신 웹훅(Outgoing Webhook) URL: http://<맥미니IP>:5678/webhook/chat
  3. 토큰은 자동 생성됨 → .env의 SYNOLOGY_CHAT_TOKEN에 설정

수신 웹훅(Incoming Webhook)은 .env의 SYNOLOGY_CHAT_WEBHOOK_URL에 이미 설정됨.

진행 상황

Phase 0: 맥미니 정리

  • ollama rm qwen3.5:35b-a3b (삭제)
  • ollama pull minicpm-v:8b (비전 모델 설치)

Phase 1: 기반 (Qdrant + DB)

  • init.sql v2 (12테이블 + 분류기 v2 프롬프트 + 메모리 판단 프롬프트)
  • migrate-v2.sql (기존 DB 마이그레이션)
  • setup-qdrant.sh (tk_company 컬렉션 + 인덱스)
  • DB 마이그레이션 실행
  • Qdrant 설정 실행

Phase 2: 3단계 라우팅 + 검색 라우팅

  • 워크플로우 v2 (37노드): 토큰검증, Rate Limit, 프리필터, 분류기v2, 3-tier, 멀티-컬렉션 RAG
  • .env + docker-compose.yml 환경변수 추가
  • n8n에 워크플로우 임포트 + 활성화
  • 테스트: "안녕" → local, "요약해줘" → Haiku, "법률 해석" → Opus

Phase 3: 선택적 메모리

  • Memorization Check 노드 (비동기, 응답 후)
  • Should Memorize? + Embed & Save Memory
  • 테스트: 인사 → 미저장, 기술질문 → 저장

Phase 4: 회사 문서 등록

  • /문서등록 명령어 파서 (placeholder)
  • 텍스트 청킹 + 임베딩 + tk_company 저장 구현
  • 문서 버전 관리 (deprecated + version++)

Phase 5: 현장 리포팅

  • field_reports 테이블 + SLA 인덱스
  • 비전 모델 설치 + 사진 분석 노드
  • /보고서 월간 보고서 생성 구현
  • SLA 트래킹 스케줄 워크플로우

Phase 6: 메일 + 캘린더

  • mail_logs, calendar_events 테이블
  • IMAP 폴링 워크플로우
  • CalDAV 연동

검증 체크리스트

  1. curl localhost:6333/collections → documents, tk_company, chat_memory 존재
  2. "안녕" → 프리필터 → local 응답 (GPU 미호출)
  3. "이거 요약해줘" → Haiku 답변
  4. "이 법률 해석해줘" → Opus 답변
  5. 인사 → chat_memory 미저장 (chat_logs에는 기록)
  6. 기술 질문 → chat_memory 저장
  7. "아까 물어본 거" → chat_memory 검색 성공
  8. GPU 서버 다운 → fallback Haiku 답변
  9. 잘못된 토큰 → reject
  10. 10초 내 6건 → rate limit