Files

hyungi 6e6ffaa04b RAG 아키텍처 v2: 3단계 라우팅, 멀티-컬렉션 RAG, 선택적 메모리

Phase 1-3 구현:
- init.sql v2: 12테이블 (기존 5 + 신규 7) + 분류기 v2 프롬프트
- migrate-v2.sql: 기존 DB 마이그레이션 스크립트
- setup-qdrant.sh: tk_company 컬렉션 + payload 인덱스 설정
- 워크플로우 v2 (37노드): 토큰검증, Rate Limit, 프리필터,
  분류기v2(response_tier), 3-tier 라우팅(local/Haiku/Opus),
  멀티-컬렉션 RAG, 예산 체크, 선택적 메모리
- .env.example + docker-compose.yml: 새 환경변수 추가
- CLAUDE.md, QUICK_REFERENCE.md, docs/architecture.md 전면 갱신

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

2026-03-11 12:51:30 +09:00

7.9 KiB

Raw Blame History

Quick Reference

작업 시작 전 체크리스트.

현재 상태 확인

# 챗봇 컨테이너 상태
docker ps -a --filter "name=bot-" --format "table {{.Names}}\t{{.Status}}\t{{.Ports}}"

# Qdrant 상태 + 3컬렉션 확인
docker ps --filter "name=qdrant" --format "table {{.Names}}\t{{.Status}}"
curl -s http://localhost:6333/collections | python3 -c "import sys,json; [print(f'  {c[\"name\"]}') for c in json.loads(sys.stdin.read())['result']['collections']]"

# 맥미니 Ollama 모델 확인
ollama list

# GPU 서버 Ollama 상태
curl -s http://192.168.1.186:11434/api/tags | python3 -m json.tool

# GPU 서버 Qwen 9B 헬스체크
curl -s http://192.168.1.186:11434/api/generate -d '{"model":"qwen3.5:9b-q8_0","prompt":"hi","stream":false}' | python3 -m json.tool

접속 정보

서비스	URL
n8n 편집기	http://localhost:5678
Qdrant 대시보드	http://localhost:6333/dashboard
bot-postgres	localhost:15478
Ollama API (맥미니)	http://localhost:11434
Ollama API (GPU)	http://192.168.1.186:11434
Synology Chat	NAS (192.168.1.227)

Docker 명령어

# 프로젝트 경로
cd ~/Documents/code/syn-chat-bot

# 시작/종료
docker compose up -d
docker compose down

# 로그 확인
docker compose logs -f bot-n8n
docker compose logs -f bot-postgres

# n8n만 재시작
docker compose restart bot-n8n

# DB 접속
docker exec -it bot-postgres psql -U bot -d chatbot

# DB 테이블 확인
docker exec bot-postgres psql -U bot -d chatbot -c '\dt'

# v2 마이그레이션 실행 (기존 DB가 있을 때)
docker exec -i bot-postgres psql -U bot -d chatbot < init/migrate-v2.sql

# Qdrant tk_company 컬렉션 + 인덱스 설정
bash init/setup-qdrant.sh

헬스체크 (전체)

# 한 번에 전체 확인
echo "=== Docker ===" && \
docker ps -a --filter "name=bot-" --filter "name=qdrant" --format "table {{.Names}}\t{{.Status}}" && \
echo "=== 맥미니 Ollama ===" && \
curl -s http://localhost:11434/api/tags | python3 -c "import sys,json; [print(f'  {m[\"name\"]}') for m in json.loads(sys.stdin.read())['models']]" && \
echo "=== GPU 서버 Ollama ===" && \
curl -s http://192.168.1.186:11434/api/tags | python3 -c "import sys,json; [print(f'  {m[\"name\"]}') for m in json.loads(sys.stdin.read())['models']]" && \
echo "=== Qdrant 컬렉션 ===" && \
curl -s http://localhost:6333/collections | python3 -c "import sys,json; [print(f'  {c[\"name\"]}') for c in json.loads(sys.stdin.read())['result']['collections']]" && \
echo "=== tk_company ===" && \
curl -s http://localhost:6333/collections/tk_company | python3 -c "import sys,json; r=json.loads(sys.stdin.read())['result']; print(f'  벡터수: {r[\"points_count\"]}, 상태: {r[\"status\"]}')" 2>/dev/null || echo "  (미생성)" && \
echo "=== n8n ===" && \
curl -s -o /dev/null -w '  HTTP %{http_code}' http://localhost:5678 && echo && \
echo "=== API 사용량 ===" && \
docker exec bot-postgres psql -U bot -d chatbot -t -c "SELECT tier, call_count, estimated_cost FROM api_usage_monthly WHERE year=EXTRACT(YEAR FROM NOW()) AND month=EXTRACT(MONTH FROM NOW())" 2>/dev/null || echo "  (테이블 없음)"

디렉토리 구조

syn-chat-bot/
├── docker-compose.yml    ← 컨테이너 정의
├── .env                  ← API 키, DB 비밀번호, 토큰, 예산 (git 제외)
├── .env.example          ← 환경변수 템플릿
├── CLAUDE.md             ← 프로젝트 문서
├── QUICK_REFERENCE.md    ← 이 파일
├── docs/
│   ├── architecture.md   ← 아키텍처, DB 스키마, 파이프라인 상세
│   └── claude-code-playbook.md
├── n8n/
│   ├── data/             ← n8n 런타임 데이터
│   └── workflows/
│       └── main-chat-pipeline.json  ← 메인 워크플로우 (37노드)
├── init/
│   ├── init.sql          ← DB 초기 스키마 v2 (12테이블)
│   ├── migrate-v2.sql    ← 기존 DB 마이그레이션
│   └── setup-qdrant.sh   ← Qdrant 컬렉션/인덱스 설정
└── postgres/data/        ← DB 데이터

트러블슈팅

# n8n 웹훅 안 올 때 — NAS에서 맥미니 접근 가능한지 확인
curl http://<맥미니IP>:5678/webhook-test/chat

# Ollama 임베딩 테스트 (맥미니)
curl http://localhost:11434/api/embeddings -d '{"model":"bge-m3","prompt":"test"}'

# GPU 서버 분류 테스트
curl http://192.168.1.186:11434/api/generate -d '{"model":"qwen3.5:9b-q8_0","prompt":"안녕하세요","stream":false}'

# Qdrant 컬렉션 확인
curl http://localhost:6333/collections

# tk_company 검색 테스트
curl -X POST http://localhost:6333/collections/tk_company/points/search \
  -H 'Content-Type: application/json' \
  -d '{"vector": [0.1, ...], "limit": 3, "with_payload": true}'

# bot-postgres 접속
docker exec -it bot-postgres psql -U bot -d chatbot

# 분류기 로그 확인
docker exec bot-postgres psql -U bot -d chatbot -c "SELECT created_at, output_json->>'intent', output_json->>'response_tier', fallback_used FROM classification_logs ORDER BY created_at DESC LIMIT 10"

# API 사용량 확인
docker exec bot-postgres psql -U bot -d chatbot -c "SELECT * FROM api_usage_monthly ORDER BY year DESC, month DESC"

# GPU 서버 연결 안 될 때
ping 192.168.1.186
curl -s http://192.168.1.186:11434/api/tags

n8n 접속 정보

URL: http://localhost:5678
이메일: ahn@hyungi.net
비밀번호: .env의 N8N_BASIC_AUTH_PASSWORD와 동일
워크플로우: "메인 채팅 파이프라인 v2" (37 노드, 활성 상태)
웹훅 엔드포인트: POST http://localhost:5678/webhook/chat

Synology Chat 연동

NAS에서 Outgoing Webhook 설정 필요:

Synology Chat > 통합 > 봇 > 만들기
발신 웹훅(Outgoing Webhook) URL: http://<맥미니IP>:5678/webhook/chat
토큰은 자동 생성됨 → .env의 SYNOLOGY_CHAT_TOKEN에 설정

수신 웹훅(Incoming Webhook)은 .env의 SYNOLOGY_CHAT_WEBHOOK_URL에 이미 설정됨.

진행 상황

Phase 0: 맥미니 정리

ollama rm qwen3.5:35b-a3b (삭제)
ollama pull minicpm-v:8b (비전 모델 설치)

Phase 1: 기반 (Qdrant + DB)

init.sql v2 (12테이블 + 분류기 v2 프롬프트 + 메모리 판단 프롬프트)
migrate-v2.sql (기존 DB 마이그레이션)
setup-qdrant.sh (tk_company 컬렉션 + 인덱스)
DB 마이그레이션 실행
Qdrant 설정 실행

Phase 2: 3단계 라우팅 + 검색 라우팅

워크플로우 v2 (37노드): 토큰검증, Rate Limit, 프리필터, 분류기v2, 3-tier, 멀티-컬렉션 RAG
.env + docker-compose.yml 환경변수 추가
n8n에 워크플로우 임포트 + 활성화
테스트: "안녕" → local, "요약해줘" → Haiku, "법률 해석" → Opus

Phase 3: 선택적 메모리

Memorization Check 노드 (비동기, 응답 후)
Should Memorize? + Embed & Save Memory
테스트: 인사 → 미저장, 기술질문 → 저장

Phase 4: 회사 문서 등록

/문서등록 명령어 파서 (placeholder)
텍스트 청킹 + 임베딩 + tk_company 저장 구현
문서 버전 관리 (deprecated + version++)

Phase 5: 현장 리포팅

field_reports 테이블 + SLA 인덱스
비전 모델 설치 + 사진 분석 노드
/보고서 월간 보고서 생성 구현
SLA 트래킹 스케줄 워크플로우

Phase 6: 메일 + 캘린더

mail_logs, calendar_events 테이블
IMAP 폴링 워크플로우
CalDAV 연동

검증 체크리스트

curl localhost:6333/collections → documents, tk_company, chat_memory 존재
"안녕" → 프리필터 → local 응답 (GPU 미호출)
"이거 요약해줘" → Haiku 답변
"이 법률 해석해줘" → Opus 답변
인사 → chat_memory 미저장 (chat_logs에는 기록)
기술 질문 → chat_memory 저장
"아까 물어본 거" → chat_memory 검색 성공
GPU 서버 다운 → fallback Haiku 답변
잘못된 토큰 → reject
10초 내 6건 → rate limit

7.9 KiB Raw Blame History

Quick Reference

현재 상태 확인

접속 정보

Docker 명령어

헬스체크 (전체)

디렉토리 구조

트러블슈팅

n8n 접속 정보

Synology Chat 연동

진행 상황

Phase 0: 맥미니 정리

Phase 1: 기반 (Qdrant + DB)

Phase 2: 3단계 라우팅 + 검색 라우팅

Phase 3: 선택적 메모리

Phase 4: 회사 문서 등록

Phase 5: 현장 리포팅

Phase 6: 메일 + 캘린더

검증 체크리스트

7.9 KiB

Raw Blame History