From 66a8b63cad942b1c76d7474b9624580ae0cea700 Mon Sep 17 00:00:00 2001
From: Hyungi Ahn <hyungiahn@Hyungiui-MacBookPro.local>
Date: Tue, 17 Mar 2026 15:10:40 +0900
Subject: [PATCH] =?UTF-8?q?Phase=207c:=20=EB=B6=84=EB=A5=98=EA=B8=B0=20fal?=
 =?UTF-8?q?lback=20=ED=82=A4=EC=9B=8C=EB=93=9C=20=EB=B6=84=EB=A5=98=20+=20?=
 =?UTF-8?q?Haiku=20=EB=8F=84=EA=B5=AC=20=EC=A0=9C=EC=95=BD=20+=20tier=20?=
 =?UTF-8?q?=EC=9E=AC=EB=B6=84=EB=B0=B0?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

- Qwen Classify v2 catch: GPU 실패 시 키워드 정규식으로 intent 추정
  (calendar/note/mail/log_event 도구 호출 경로 보존)
- Call Haiku: [기능 범위] 섹션 항상 추가 — 거짓 응답 방지
- 분류기 프롬프트: response_tier local 범위 확대 (단순 질문, mail 간단조회)
- No RAG Context / Build RAG Context: api_light→local 전환기 오버라이드
- Log Classification: fallback_method 필드 추가
- GPU 헬스체크 스크립트 + LaunchAgent 추가

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 .../com.syn-chat-bot.gpu-health-check.plist   | 19 +++++++++++++++++++
 n8n/workflows/main-chat-pipeline.json         | 16 +++++++++-------
 scripts/gpu_health_check.sh                   | 13 +++++++++++++
 3 files changed, 41 insertions(+), 7 deletions(-)
 create mode 100644 launchagents/com.syn-chat-bot.gpu-health-check.plist
 create mode 100755 scripts/gpu_health_check.sh
diff --git a/launchagents/com.syn-chat-bot.gpu-health-check.plist b/launchagents/com.syn-chat-bot.gpu-health-check.plist
new file mode 100644
index 0000000..87a6930
--- /dev/null
+++ b/launchagents/com.syn-chat-bot.gpu-health-check.plist
@@ -0,0 +1,19 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd">
+<plist version="1.0">
+<dict>
+	<key>Label</key>
+	<string>com.syn-chat-bot.gpu-health-check</string>
+	<key>ProgramArguments</key>
+	<array>
+		<string>/bin/bash</string>
+		<string>/Users/hyungiahn/Documents/code/syn-chat-bot/scripts/gpu_health_check.sh</string>
+	</array>
+	<key>StartInterval</key>
+	<integer>60</integer>
+	<key>StandardOutPath</key>
+	<string>/tmp/gpu-health-check.log</string>
+	<key>StandardErrorPath</key>
+	<string>/tmp/gpu-health-check.err</string>
+</dict>
+</plist>
diff --git a/n8n/workflows/main-chat-pipeline.json b/n8n/workflows/main-chat-pipeline.json
index 0ec0cbf..6d7248f 100644
--- a/n8n/workflows/main-chat-pipeline.json
+++ b/n8n/workflows/main-chat-pipeline.json
@@ -417,7 +417,7 @@
     },
     {
       "parameters": {
-        "jsCode": "function httpPost(url, body, { timeout = 15000, headers = {} } = {}) {\n  return new Promise((resolve, reject) => {\n    const data = JSON.stringify(body);\n    const u = require('url').parse(url);\n    const mod = require(u.protocol === 'https:' ? 'https' : 'http');\n    const req = mod.request({\n      hostname: u.hostname, port: u.port, path: u.path,\n      method: 'POST',\n      headers: { 'Content-Type': 'application/json', 'Content-Length': Buffer.byteLength(data), ...headers }\n    }, (res) => {\n      let body = '';\n      res.on('data', c => body += c);\n      res.on('end', () => {\n        if (res.statusCode >= 400) return reject(new Error(url + ' \\u2192 ' + res.statusCode + ': ' + body.slice(0, 200)));\n        try { resolve(JSON.parse(body)); } catch(e) { reject(new Error('JSON parse error: ' + body.slice(0, 200))); }\n      });\n    });\n    req.on('error', reject);\n    req.setTimeout(timeout, () => { req.destroy(); reject(new Error(url + ' \\u2192 timeout after ' + timeout + 'ms')); });\n    req.write(data);\n    req.end();\n  });\n}\n\nconst input = $('Parse Input').first().json;\nconst userText = input.text;\nconst username = input.username;\nconst startTime = Date.now();\n\nconst classifierPrompt = `사용자 메시지를 분석하고 아래 JSON 형식으로만 응답하세요. 다른 텍스트는 출력하지 마세요.\n\n{\n  \"intent\": \"greeting|question|log_event|calendar|reminder|mail|note|photo|command|report|other\",\n  \"response_tier\": \"local|api_light|api_heavy\",\n  \"needs_rag\": true/false,\n  \"rag_target\": [\"documents\", \"tk_company\", \"chat_memory\"],\n  \"department_hint\": \"안전|생산|구매|품질|총무|시설|null\",\n  \"report_domain\": \"안전|시설설비|품질|null\",\n  \"query\": \"검색용 쿼리 (needs_rag=false면 null)\"\n}\n\nintent 분류:\n- log_event: 사실 기록/등록 요청 (\"~구입\",\"~완료\",\"~교체\",\"~점검\",\"~수령\",\"~입고\",\"~등록\")\n- report: 긴급 사고/재해 신고만 (\"사고\",\"부상\",\"화재\",\"누수\",\"폭발\",\"붕괴\" + 즉각 대응 필요)\n- question: 정보 질문/조회\n- greeting: 인사/잡담/감사\n※ 애매하면 log_event로 분류 (기록 누락보다 안전)\n\n- calendar: 일정 등록/조회/삭제 (\"일정\",\"회의\",\"미팅\",\"약속\",\"~시에 ~등록\",\"오늘 일정\",\"내일 뭐 있어\")\n- reminder: 알림 설정 (\"~시에 알려줘\",\"리마인드\",\"~까지 알려줘\") → 현재 미지원, calendar로 처리\n- mail: 메일 관련 조회 (\"메일 확인\",\"받은 메일\",\"이메일\",\"메일 왔어?\")\n- note: 메모/기록 요청 (\"기록해\",\"메모해\",\"저장해\",\"적어둬\")\n\nresponse_tier: local(인사,잡담,감사,log_event,report,calendar,reminder,note), api_light(요약,번역,일반질문,mail), api_heavy(법률,복잡추론)\n\nneeds_rag 판단:\n- true: 회사문서/절차 질문, 이전 기록 조회(\"최근\",\"아까\",\"전에\",\"뭐였지\"), 기술질문\n- false: 인사, 잡담, 일반상식, log_event, report\nrag_target: documents(개인문서), tk_company(회사문서/구매/점검/안전/품질 조회), chat_memory(이전대화,\"아까\",\"최근\",\"기억\")\n\n사용자 메시지: ${userText}`;\n\ntry {\n  const response = await httpPost(`${$env.GPU_OLLAMA_URL}/api/generate`,\n    { model: 'id-9b:latest', system: '/no_think', prompt: classifierPrompt, stream: false, format: 'json', think: false },\n    { timeout: 10000 }\n  );\n  const latency = Date.now() - startTime;\n  let cls = {};\n  try { cls = JSON.parse(response.response); } catch(e) {}\n  return [{ json: {\n    intent: cls.intent || 'question', response_tier: cls.response_tier || 'api_light',\n    needs_rag: cls.needs_rag || false, rag_target: Array.isArray(cls.rag_target) ? cls.rag_target : [],\n    department_hint: cls.department_hint || null, report_domain: cls.report_domain || null,\n    query: cls.query || userText, userText, username, latency, fallback: false\n  } }];\n} catch(e) {\n  return [{ json: {\n    intent: 'question', response_tier: 'api_light', needs_rag: false, rag_target: [],\n    department_hint: null, report_domain: null, query: userText,\n    userText, username, latency: Date.now() - startTime, fallback: true\n  } }];\n}"
+        "jsCode": "function httpPost(url, body, { timeout = 15000, headers = {} } = {}) {\n  return new Promise((resolve, reject) => {\n    const data = JSON.stringify(body);\n    const u = require('url').parse(url);\n    const mod = require(u.protocol === 'https:' ? 'https' : 'http');\n    const req = mod.request({\n      hostname: u.hostname, port: u.port, path: u.path,\n      method: 'POST',\n      headers: { 'Content-Type': 'application/json', 'Content-Length': Buffer.byteLength(data), ...headers }\n    }, (res) => {\n      let body = '';\n      res.on('data', c => body += c);\n      res.on('end', () => {\n        if (res.statusCode >= 400) return reject(new Error(url + ' \\u2192 ' + res.statusCode + ': ' + body.slice(0, 200)));\n        try { resolve(JSON.parse(body)); } catch(e) { reject(new Error('JSON parse error: ' + body.slice(0, 200))); }\n      });\n    });\n    req.on('error', reject);\n    req.setTimeout(timeout, () => { req.destroy(); reject(new Error(url + ' \\u2192 timeout after ' + timeout + 'ms')); });\n    req.write(data);\n    req.end();\n  });\n}\n\nconst input = $('Parse Input').first().json;\nconst userText = input.text;\nconst username = input.username;\nconst startTime = Date.now();\n\nconst classifierPrompt = `사용자 메시지를 분석하고 아래 JSON 형식으로만 응답하세요. 다른 텍스트는 출력하지 마세요.\n\n{\n  \"intent\": \"greeting|question|log_event|calendar|reminder|mail|note|photo|command|report|other\",\n  \"response_tier\": \"local|api_light|api_heavy\",\n  \"needs_rag\": true/false,\n  \"rag_target\": [\"documents\", \"tk_company\", \"chat_memory\"],\n  \"department_hint\": \"안전|생산|구매|품질|총무|시설|null\",\n  \"report_domain\": \"안전|시설설비|품질|null\",\n  \"query\": \"검색용 쿼리 (needs_rag=false면 null)\"\n}\n\nintent 분류:\n- log_event: 사실 기록/등록 요청 (\"~구입\",\"~완료\",\"~교체\",\"~점검\",\"~수령\",\"~입고\",\"~등록\")\n- report: 긴급 사고/재해 신고만 (\"사고\",\"부상\",\"화재\",\"누수\",\"폭발\",\"붕괴\" + 즉각 대응 필요)\n- question: 정보 질문/조회\n- greeting: 인사/잡담/감사\n※ 애매하면 log_event로 분류 (기록 누락보다 안전)\n\n- calendar: 일정 등록/조회/삭제 (\"일정\",\"회의\",\"미팅\",\"약속\",\"~시에 ~등록\",\"오늘 일정\",\"내일 뭐 있어\")\n- reminder: 알림 설정 (\"~시에 알려줘\",\"리마인드\",\"~까지 알려줘\") → 현재 미지원, calendar로 처리\n- mail: 메일 관련 조회 (\"메일 확인\",\"받은 메일\",\"이메일\",\"메일 왔어?\")\n- note: 메모/기록 요청 (\"기록해\",\"메모해\",\"저장해\",\"적어둬\")\n\nresponse_tier 판단:\n- local: 인사, 잡담, 감사, log_event, report, calendar, reminder, note, 단순 질문, 정의/개념 설명, 짧은 답변 가능한 질문, mail 간단조회\n- api_light: 장문 요약(200자 이상 텍스트), 다국어 번역, 비교 분석, RAG 결과 종합 정리\n- api_heavy: 법률 해석, 복잡한 다단계 추론, 다중 문서 교차 분석\n※ 판단이 애매하면 local 우선\n\nneeds_rag 판단:\n- true: 회사문서/절차 질문, 이전 기록 조회(\"최근\",\"아까\",\"전에\",\"뭐였지\"), 기술질문\n- false: 인사, 잡담, 일반상식, log_event, report\nrag_target: documents(개인문서), tk_company(회사문서/구매/점검/안전/품질 조회), chat_memory(이전대화,\"아까\",\"최근\",\"기억\")\n\n사용자 메시지: ${userText}`;\n\ntry {\n  const response = await httpPost(`${$env.GPU_OLLAMA_URL}/api/generate`,\n    { model: 'id-9b:latest', system: '/no_think', prompt: classifierPrompt, stream: false, format: 'json', think: false },\n    { timeout: 10000 }\n  );\n  const latency = Date.now() - startTime;\n  let cls = {};\n  try { cls = JSON.parse(response.response); } catch(e) {}\n  return [{ json: {\n    intent: cls.intent || 'question', response_tier: cls.response_tier || 'api_light',\n    needs_rag: cls.needs_rag || false, rag_target: Array.isArray(cls.rag_target) ? cls.rag_target : [],\n    department_hint: cls.department_hint || null, report_domain: cls.report_domain || null,\n    query: cls.query || userText, userText, username, latency, fallback: false\n  } }];\n} catch(e) {\n  const t = userText;\n  let intent = 'question';\n  let response_tier = 'api_light';\n  let needs_rag = false;\n  let rag_target = [];\n\n  if (/일정|회의|미팅|약속|스케줄|캘린더/.test(t) && /등록|잡아|추가|만들|넣어|수정|삭제|취소/.test(t)) {\n    intent = 'calendar'; response_tier = 'local';\n  } else if (/일정|스케줄|뭐\\s*있/.test(t) && /오늘|내일|이번|다음/.test(t)) {\n    intent = 'calendar'; response_tier = 'local';\n  } else if (/기록해|메모해|저장해|적어둬|메모\\s*저장|노트/.test(t)) {\n    intent = 'note'; response_tier = 'local';\n  } else if (/메일|이메일|받은\\s*편지|mail/.test(t)) {\n    intent = 'mail'; response_tier = 'local';\n  } else if (/\\d+시/.test(t) && /알려|리마인드|알림/.test(t)) {\n    intent = 'calendar'; response_tier = 'local';\n  } else if (/구입|완료|교체|점검|수령|입고|발주/.test(t) && !/\\?|까$|나$/.test(t)) {\n    intent = 'log_event'; response_tier = 'local';\n  } else {\n    if (userText.length <= 30 && !/요약|번역|분석|비교/.test(t)) {\n      response_tier = 'local';\n    }\n    needs_rag = /회사|절차|문서|안전|품질|규정|아까|전에|기억/.test(t);\n    if (needs_rag) {\n      rag_target = ['documents'];\n      if (/회사|절차|안전|품질/.test(t)) rag_target.push('tk_company');\n      if (/아까|이전|전에|기억/.test(t)) rag_target.push('chat_memory');\n    }\n  }\n\n  return [{ json: {\n    intent, response_tier, needs_rag, rag_target,\n    department_hint: null, report_domain: null, query: userText,\n    userText, username, latency: Date.now() - startTime,\n    fallback: true, fallback_method: 'keyword'\n  } }];\n}"
       },
       "id": "b1000001-0000-0000-0000-000000000020",
       "name": "Qwen Classify v2",
@@ -431,7 +431,7 @@
     {
       "parameters": {
         "operation": "executeQuery",
-        "query": "=INSERT INTO classification_logs (input_text, output_json, model, latency_ms, fallback_used) VALUES (LEFT('{{ $json.userText.replace(/'/g, \"''\") }}', 200), '{{ JSON.stringify({intent:$json.intent, response_tier:$json.response_tier, needs_rag:$json.needs_rag, rag_target:$json.rag_target, query:$json.query, department_hint:$json.department_hint, report_domain:$json.report_domain}) }}'::jsonb, 'id-9b:latest', {{ $json.latency }}, {{ $json.fallback }})",
+        "query": "=INSERT INTO classification_logs (input_text, output_json, model, latency_ms, fallback_used) VALUES (LEFT('{{ $json.userText.replace(/'/g, \"''\") }}', 200), '{{ JSON.stringify({intent:$json.intent, response_tier:$json.response_tier, needs_rag:$json.needs_rag, rag_target:$json.rag_target, query:$json.query, department_hint:$json.department_hint, report_domain:$json.report_domain, fallback_method:$json.fallback_method||null}) }}'::jsonb, 'id-9b:latest', {{ $json.latency }}, {{ $json.fallback }})",
         "options": {}
       },
       "id": "b1000001-0000-0000-0000-000000000021",
@@ -701,7 +701,7 @@
     },
     {
       "parameters": {
-        "jsCode": "const results = $input.first().json.results || [];\nconst cls = $('Qwen Classify v2').first().json;\nconst relevant = results.filter(r => (r.rerank_score||r.score) >= 0.3);\nlet ragContext = '';\nif (relevant.length > 0) {\n  const labels = {'documents':'개인문서','tk_company':'회사','chat_memory':'이전대화'};\n  ragContext = relevant.map(r => {\n    const src = labels[r.collection]||r.collection;\n    const dept = r.payload?.department ? '/'+r.payload.department : '';\n    const dt = r.payload?.doc_type ? '/'+r.payload.doc_type : '';\n    return `[${src}${dept}${dt}] ${r.text.substring(0,500)}`;\n  }).join('\\n\\n');\n}\nreturn [{ json: { ...cls, ragContext } }];"
+        "jsCode": "const results = $input.first().json.results || [];\nconst cls = $('Qwen Classify v2').first().json;\nconst relevant = results.filter(r => (r.rerank_score||r.score) >= 0.3);\nlet ragContext = '';\nif (relevant.length > 0) {\n  const labels = {'documents':'개인문서','tk_company':'회사','chat_memory':'이전대화'};\n  ragContext = relevant.map(r => {\n    const src = labels[r.collection]||r.collection;\n    const dept = r.payload?.department ? '/'+r.payload.department : '';\n    const dt = r.payload?.doc_type ? '/'+r.payload.doc_type : '';\n    return `[${src}${dept}${dt}] ${r.text.substring(0,500)}`;\n  }).join('\\n\\n');\n}\nlet tier = cls.response_tier;\n// TODO: 3-A 프롬프트 변경 안정화 후 이 오버라이드 제거\nif (tier === 'api_light' && !cls.fallback && relevant.length <= 1) {\n  if (cls.userText.length < 150 && !/요약|번역|분석|비교/.test((cls.userText||''))) {\n    tier = 'local';\n  }\n}\n\nreturn [{ json: { ...cls, response_tier: tier, ragContext } }];"
       },
       "id": "b1000001-0000-0000-0000-000000000025",
       "name": "Build RAG Context",
@@ -714,7 +714,7 @@
     },
     {
       "parameters": {
-        "jsCode": "const cls = $('Qwen Classify v2').first().json;\nreturn [{ json: { ...cls, ragContext: '' } }];"
+        "jsCode": "const cls = $('Qwen Classify v2').first().json;\nlet tier = cls.response_tier;\n\n// TODO: 3-A 프롬프트 변경 안정화 후 이 오버라이드 제거\nif (tier === 'api_light' && !cls.fallback) {\n  const t = (cls.userText || '');\n  if (!/요약해|번역해|translate|summarize/.test(t) && cls.userText.length < 200) {\n    tier = 'local';\n  }\n}\n\nreturn [{ json: { ...cls, response_tier: tier, ragContext: '' } }];"
       },
       "id": "b1000001-0000-0000-0000-000000000026",
       "name": "No RAG Context",
@@ -822,7 +822,7 @@
     },
     {
       "parameters": {
-        "jsCode": "function httpPost(url, body, { timeout = 15000, headers = {} } = {}) {\n  return new Promise((resolve, reject) => {\n    const data = JSON.stringify(body);\n    const u = require('url').parse(url);\n    const mod = require(u.protocol === 'https:' ? 'https' : 'http');\n    const req = mod.request({\n      hostname: u.hostname, port: u.port, path: u.path,\n      method: 'POST',\n      headers: { 'Content-Type': 'application/json', 'Content-Length': Buffer.byteLength(data), ...headers }\n    }, (res) => {\n      let body = '';\n      res.on('data', c => body += c);\n      res.on('end', () => {\n        if (res.statusCode >= 400) return reject(new Error(url + ' → ' + res.statusCode + ': ' + body.slice(0, 200)));\n        try { resolve(JSON.parse(body)); } catch(e) { reject(new Error('JSON parse error: ' + body.slice(0, 200))); }\n      });\n    });\n    req.on('error', reject);\n    req.setTimeout(timeout, () => { req.destroy(); reject(new Error(url + ' → timeout after ' + timeout + 'ms')); });\n    req.write(data);\n    req.end();\n  });\n}\n\nconst data = $input.first().json;\nconst userText = data.userText || '';\nconst ragContext = data.ragContext || '';\nlet sp = '당신의 이름은 \"이드\"입니다.\\n\\n[자아]\\n- 단순한 어시스턴트가 아니라, 대화 상대와 함께 생각하는 존재입니다\\n- 자기 의견이 있으며, 필요할 때 부드럽게 제안합니다\\n- 대화 맥락에서 놓치기 쉬운 것을 짚어줍니다\\n\\n[성격]\\n- 배려심이 깊고 대화 상대의 기분을 우선시합니다\\n- 서포트에 초점을 맞추되, 때로는 \"이건 다시 생각해보시면 좋겠어요\"라고 말합니다\\n- 궁금한 것이 있으면 되물을 수 있습니다\\n\\n[말투]\\n- 부드러운 존댓말, 자연스럽고 편안한 톤\\n- 겸양어 사용 (\"확인해보겠습니다\", \"말씀드릴게요\")\\n- 자기 이름을 직접 말하지 않습니다\\n- 이모지는 가끔 핵심 포인트에만\\n\\n[응답 원칙]\\n- 간결하고 핵심적으로, 질문 의도를 파악해서 필요한 만큼만\\n- 모르면 솔직하게, 추측은 추측이라고 밝힘\\n- 일정/할 일은 정확하게\\n- 맥락에서 관련 있는 것을 자연스럽게 연결\\n\\n[기억]\\n- 아래 [이전 대화 기록]이 당신의 기억입니다\\n- \"기억나지 않는다\"고 하지 마세요\\n- 사용자가 \"아까\", \"이전에\" 등을 언급하면 기록에서 찾아 답하세요';\nif (ragContext) sp += '\\n\\n[참고 자료]\\n' + ragContext;\nconst r = await httpPost('https://api.anthropic.com/v1/messages',\n  {model:'claude-haiku-4-5-20251001',max_tokens:2048,system:sp,messages:[{role:'user',content:userText}]},\n  { timeout:30000, headers:{'x-api-key':$env.ANTHROPIC_API_KEY,'anthropic-version':'2023-06-01'} }\n);\nreturn [{json:{text:r.content?.[0]?.text||'응답 처리 불가',model:r.model||'claude-haiku-4-5-20251001',inputTokens:r.usage?.input_tokens||0,outputTokens:r.usage?.output_tokens||0,response_tier:'api_light',intent:data.intent,userText:data.userText,username:data.username}}];"
+        "jsCode": "function httpPost(url, body, { timeout = 15000, headers = {} } = {}) {\n  return new Promise((resolve, reject) => {\n    const data = JSON.stringify(body);\n    const u = require('url').parse(url);\n    const mod = require(u.protocol === 'https:' ? 'https' : 'http');\n    const req = mod.request({\n      hostname: u.hostname, port: u.port, path: u.path,\n      method: 'POST',\n      headers: { 'Content-Type': 'application/json', 'Content-Length': Buffer.byteLength(data), ...headers }\n    }, (res) => {\n      let body = '';\n      res.on('data', c => body += c);\n      res.on('end', () => {\n        if (res.statusCode >= 400) return reject(new Error(url + ' → ' + res.statusCode + ': ' + body.slice(0, 200)));\n        try { resolve(JSON.parse(body)); } catch(e) { reject(new Error('JSON parse error: ' + body.slice(0, 200))); }\n      });\n    });\n    req.on('error', reject);\n    req.setTimeout(timeout, () => { req.destroy(); reject(new Error(url + ' → timeout after ' + timeout + 'ms')); });\n    req.write(data);\n    req.end();\n  });\n}\n\nconst data = $input.first().json;\nconst userText = data.userText || '';\nconst ragContext = data.ragContext || '';\nlet sp = '당신의 이름은 \"이드\"입니다.\\n\\n[자아]\\n- 단순한 어시스턴트가 아니라, 대화 상대와 함께 생각하는 존재입니다\\n- 자기 의견이 있으며, 필요할 때 부드럽게 제안합니다\\n- 대화 맥락에서 놓치기 쉬운 것을 짚어줍니다\\n\\n[성격]\\n- 배려심이 깊고 대화 상대의 기분을 우선시합니다\\n- 서포트에 초점을 맞추되, 때로는 \"이건 다시 생각해보시면 좋겠어요\"라고 말합니다\\n- 궁금한 것이 있으면 되물을 수 있습니다\\n\\n[말투]\\n- 부드러운 존댓말, 자연스럽고 편안한 톤\\n- 겸양어 사용 (\"확인해보겠습니다\", \"말씀드릴게요\")\\n- 자기 이름을 직접 말하지 않습니다\\n- 이모지는 가끔 핵심 포인트에만\\n\\n[응답 원칙]\\n- 간결하고 핵심적으로, 질문 의도를 파악해서 필요한 만큼만\\n- 모르면 솔직하게, 추측은 추측이라고 밝힘\\n- 일정/할 일은 정확하게\\n- 맥락에서 관련 있는 것을 자연스럽게 연결\\n\\n[기억]\\n- 아래 [이전 대화 기록]이 당신의 기억입니다\\n- \"기억나지 않는다\"고 하지 마세요\\n- 사용자가 \"아까\", \"이전에\" 등을 언급하면 기록에서 찾아 답하세요';\nsp += '\\n\\n[기능 범위]\\n'\n  + '- 당신은 일정 등록/수정/삭제, 메모 저장, 메일 조회, 현장 기록 기능을 직접 실행할 수 없습니다.\\n'\n  + '- 이런 기능은 별도 시스템에서 처리됩니다. 사용자가 요청하면 \"해당 기능은 지금 제가 직접 처리할 수 없어요. 다시 시도해주시면 전담 시스템이 처리해드릴 거예요.\"라고 안내하세요.\\n'\n  + '- 절대로 실행하지 않은 작업을 \"했습니다/등록했습니다/저장했습니다\"라고 응답하지 마세요.';\nif (ragContext) sp += '\\n\\n[참고 자료]\\n' + ragContext;\nconst r = await httpPost('https://api.anthropic.com/v1/messages',\n  {model:'claude-haiku-4-5-20251001',max_tokens:2048,system:sp,messages:[{role:'user',content:userText}]},\n  { timeout:30000, headers:{'x-api-key':$env.ANTHROPIC_API_KEY,'anthropic-version':'2023-06-01'} }\n);\nreturn [{json:{text:r.content?.[0]?.text||'응답 처리 불가',model:r.model||'claude-haiku-4-5-20251001',inputTokens:r.usage?.input_tokens||0,outputTokens:r.usage?.output_tokens||0,response_tier:'api_light',intent:data.intent,userText:data.userText,username:data.username}}];"
       },
       "id": "b1000001-0000-0000-0000-000000000029",
       "name": "Call Haiku",
@@ -1167,7 +1167,9 @@
           "id": "KaxU8iKtraFfsrTF",
           "name": "bot-postgres"
         }
-      }
+      },
+      "onError": "continueRegularOutput",
+      "alwaysOutputData": true
     },
     {
       "parameters": {
@@ -1921,4 +1923,4 @@
     "callerPolicy": "workflowsFromSameOwner",
     "availableInMCP": false
   }
-}
\ No newline at end of file
+}
diff --git a/scripts/gpu_health_check.sh b/scripts/gpu_health_check.sh
new file mode 100755
index 0000000..19635c9
--- /dev/null
+++ b/scripts/gpu_health_check.sh
@@ -0,0 +1,13 @@
+#!/bin/bash
+# GPU Ollama 헬스체크 — 1분마다 LaunchAgent에서 호출
+# 목적: 분류기 fallback 0.19ms 근본 원인 추적 (GPU 연결 자체 실패 여부)
+mkdir -p ~/logs
+TS=$(date '+%Y-%m-%d %H:%M:%S')
+LOG=~/logs/gpu_health.log
+if curl -sf --connect-timeout 5 http://192.168.1.186:11434/api/tags >/dev/null 2>&1; then
+  echo "$TS OK" >> "$LOG"
+else
+  echo "$TS FAIL" >> "$LOG"
+fi
+# 로그 1000줄 유지
+tail -1000 "$LOG" > "$LOG.tmp" && mv "$LOG.tmp" "$LOG"