- Qwen Classify v2 catch: GPU 실패 시 키워드 정규식으로 intent 추정 (calendar/note/mail/log_event 도구 호출 경로 보존) - Call Haiku: [기능 범위] 섹션 항상 추가 — 거짓 응답 방지 - 분류기 프롬프트: response_tier local 범위 확대 (단순 질문, mail 간단조회) - No RAG Context / Build RAG Context: api_light→local 전환기 오버라이드 - Log Classification: fallback_method 필드 추가 - GPU 헬스체크 스크립트 + LaunchAgent 추가 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
14 lines
474 B
Bash
Executable File
14 lines
474 B
Bash
Executable File
#!/bin/bash
|
|
# GPU Ollama 헬스체크 — 1분마다 LaunchAgent에서 호출
|
|
# 목적: 분류기 fallback 0.19ms 근본 원인 추적 (GPU 연결 자체 실패 여부)
|
|
mkdir -p ~/logs
|
|
TS=$(date '+%Y-%m-%d %H:%M:%S')
|
|
LOG=~/logs/gpu_health.log
|
|
if curl -sf --connect-timeout 5 http://192.168.1.186:11434/api/tags >/dev/null 2>&1; then
|
|
echo "$TS OK" >> "$LOG"
|
|
else
|
|
echo "$TS FAIL" >> "$LOG"
|
|
fi
|
|
# 로그 1000줄 유지
|
|
tail -1000 "$LOG" > "$LOG.tmp" && mv "$LOG.tmp" "$LOG"
|