hyungi_document_server

Author	SHA1	Message	Date
Hyungi Ahn	117597c8aa	docs(hermes): PR-Hermes-Skill-Curl-Refine-2 (SHIPPED) + MaxTokens-Followup (PARTIAL+REVERTED) Curl-Refine-2 (SHIPPED): 3 SKILL.md 본문 "Tool 선택 (필독)" 단락 추가 — terminal direct curl 강조 + execute_code Python wrap 금지. E2E: Gemma 1st turn execute_code → terminal 전환 + DS API 도달 0→1 + real corpus citations ("test-voice-memo", "The Good List") 첫 성공. Hard-Enforcement-1 의 hook 와 시너지 (1 call cap + 1st 정상 path). MaxTokens-Followup 1차 (PARTIAL+REVERTED): agent.disabled_toolsets 15 toolsets 비활성 → stream 102KB→80KB 22% 감소. BUT Gemma terminal tool_call 시 "invalid tool call" 회귀 발생 → revert. toolset dependency graph 조사 후 minimal safe disabled list 결정 = 별 트랙 PR-Hermes-MaxTokens-Investigation-1. A 카테고리 6 PR + 부산 Curl-Refine-2 모두 SHIPPED. PR-1/2 user-facing E2E 완성.	2026-05-17 07:51:02 +09:00
Hyungi Ahn	9458bea595	docs(hermes): PR-Hermes-MultiTurn-Hard-Enforcement-1 closure 보고서 Polish-1 의 prompt-only enforcement (PARTIAL) escalate. Shell hook (~/.hermes/agent-hooks/docsrv_repeat_block.py) + config.yaml hooks.pre_tool_call. execute_code/terminal tool_input 의 DS endpoint URL regex 검출 후 session-별 카운트 ≥ 1 면 silent block. 검증: - Unit smoke 4/4 PASS - E2E hook 매칭 2건 정확: 1st execute_code (Python wrap) allow → 2nd terminal (direct curl) block. state={"docsrv_ask": 1}. 부산 발견: Gemma 의 1st turn code generation quality (Python f-string + curl wrap → SyntaxError) 으로 DS API 실 호출 0 — Hermes/Adapter A 무관, 별 트랙 PR-Hermes-Skill-Curl-Refine-2 (P3).	2026-05-17 07:35:07 +09:00
Hyungi Ahn	dffc8b24dd	docs(hermes): PR-Hermes-Skill-Polish-1 closure 보고서 3 SKILL.md (docsrv_memo/search/ask) frontmatter 표준화 — prerequisites.env → required_environment_variables (agentskills.io 표준). skill_view 시 자동 register_env_passthrough 발화 + config-level terminal.env_passthrough 와 이중 안전망. docsrv_ask 본문: Multi-Turn 차단 정책 + Response Format verbatim 강화. 검증: - Layer 1 fixture 회귀 0 (5/5 raw_leak, 3/3 finish_reason 동일) - E2E: pre-polish 4 turn → post-polish 3 turn (25% 감소, but 목표 1 turn 도달 X) — prompt-only enforcement 한계 명확화 결정: - Skill-Curl-Refine-1 (frontmatter) = SHIPPED - Multi-Turn-Refinement-1 (prompt) = PARTIAL — plugin-level escalate - 신규 트랙 PR-Hermes-MultiTurn-Hard-Enforcement-1 (P2) 박힘 (Answer-Policy-1 과 통합 검토)	2026-05-17 07:13:53 +09:00
Hyungi Ahn	bd89d07b70	docs(hermes): PR-Hermes-Sandbox-Env-Propagation-1 closure 보고서 PR-Hermes-Docsrv-Search-1 / PR-Hermes-WebSearch-1 의 user-facing E2E 마지막 조각. Adapter A 후 잔존한 401: execute_code/terminal 샌드박스가 HERMES_DOCSRV_TOKEN strip. 해결 = ~/.hermes/config.yaml terminal.env_passthrough 1줄 추가. 검증: - Direct: is_env_passthrough("HERMES_DOCSRV_TOKEN")=True, CLAUDE_API_KEY=False (GHSA-rhgp-j443-p4rf provider blocklist 유지) - E2E: Hermes chat → DS API 200 → conf=medium completeness=full + real corpus citations ("test-voice-memo", "The Good List: 6 Things to Add Joy to Your Day") PR-1/2 user-facing E2E unlock 완료 — Discord smoke 검증 진입 가능 (가족 onboarding 전 hyungi 채널 한정).	2026-05-17 06:37:35 +09:00
Hyungi Ahn	d3bc378c21	docs(hermes): PR-Hermes-ToolCall-Adapter-1 closure 보고서 mlx-proxy _stream_mlx 에 SSE filter 추가 — Gemma 4 raw <\|tool_call> 토큰 leak suppression + 구조화 tool_calls 시 finish_reason 'stop'→'tool_calls' override. Layer 1 fixture (5 case): 5/5 raw_leak suppressed + 3/3 finish_reason override. Hermes chat multi-turn agent loop unlocked (이전 hallucinated 종결 → tool 실행). 후속 = PR-Hermes-Sandbox-Env-Propagation-1 (execute_code 가 HERMES_DOCSRV_TOKEN inherit 못 함 — PR-1/2 user-facing E2E 마지막 조각).	2026-05-16 20:42:34 +09:00
Hyungi Ahn	e5345d7832	docs(hermes): PR-Hermes-WebSearch-1 closure 보고서 ddgs (DuckDuckGo) provider 활성. Layer 1 fixture 4/4 results (p95 12.3s, ddgs raw latency 한계). SearXNG (LocalScout PR-A 잔존) 활성화는 PR-2B 로 분리 — LAN-only bind 로 Mac mini Tailscale 접근 불가. ddgs 1주 사용 후 SearXNG swap ROI 판정 예정. channel_prompts 9줄 통합 (PR-1 4줄 + PR-2 web 분기 5줄). LLM tool-call 실제 실행은 Adapter A blocker — Layer 2/3 user-facing E2E 는 Adapter A closure 후.	2026-05-16 20:22:43 +09:00
Hyungi Ahn	d14064b225	docs(hermes): PR-Hermes-Docsrv-Search-1 closure 보고서 Hermes 의 첫 read-only orchestrator (docsrv_search + docsrv_ask skill) 구현 + DS-side Mac mini 26B concurrent load 5건 fix closure. 핵심: - Layer 1 curl-direct fixture 10/10 HTTP 200 + failure 3/3 PASS - DS-side 5 commit 으로 race condition 해소 (LLM_TIMEOUT, gate, wait_for, config) - Layer 2 Hermes CLI invoke 는 Gemma 4 tool-call leak 으로 hallucinated — Adapter A blocker - Layer 3 Discord smoke 도 동일 — 사용자 검증은 Adapter A closure 후 이월 후속 5 별 트랙 명시.	2026-05-16 20:07:18 +09:00
Hyungi Ahn	ad3d51e3e0	fix(search): classifier + evidence gate 안으로 이동 (Mac mini 26B race 종결) llm_gate.py docstring 영구 룰: "MLX primary 호출 경로는 예외 없이 gate 획득 필수". PR #20 이후 classifier (Mac mini 26B 신규) + evidence (triage→Mac mini 26B 통합) 모두 gate 외부 실행 — concurrent 안전성 별 검토 명시. 1주 관찰 결과: race 빈번. 본 PR-Hermes-Docsrv-Search-1 Layer 1 fixture 측정: - 8/10 query "conservative_refuse(no_classifier)" — classifier 가 동시 부하 시 거의 모두 ReadTimeout 또는 wait_for(6s) timeout - evidence ev_ms=15005 — synthesis 와 race 로 15s 누적 영향: - ask total 시간 증가 (parallel race → serialized): query_analyzer 5s + classifier 3-5s + evidence 5s + synthesis 30s ≈ 40-45s 상한 (현실 평균) - 응답률 ↑: race timeout 으로 인한 conservative_refuse 해소 - 사용자 체감: 빠른 거절 → 의미있는 답변. 단 대기 시간 ↑ 후속: - skill `docsrv_ask` curl `--max-time 20` → 60s 상향 필요 (별 PR 또는 본 PR 안의 follow-up) - 본 메모리 `2026-05-21 Mac mini 26B 1주 부하 측정` observation 의 결정 outcome: gate 복귀 (triage 별 작은 모델 재도입 옵션은 보류)	2026-05-16 19:54:55 +09:00
Hyungi Ahn	5846baedc7	fix(search): ask classifier wait_for 6s → 15s (outer wrapper override 해소) A1 (LLM_TIMEOUT_MS 5→15→30) + config(10→15→30) 후속 진단: 8/10 fixture query 가 "classifier ok" 또는 "classifier error" 로그 없이 conservative_refuse(no_classifier) 경로. search.py:518 의 outer wrapper `asyncio.wait_for(classifier_task, timeout=6.0)` 가 classifier_service.LLM_TIMEOUT_MS 와 httpx timeout 모두 override. 6s 한계 → 동시 부하 시 거의 모든 classifier 호출 6s 안에 못 끝남 → AsyncIO TimeoutError → ClassifierResult("timeout") → refusal_gate 가 verdict=None 받아 conservative_refuse. 15s 로 상향 — classifier_service 내부 30s 와 align 하지 않은 이유 = ask 응답 시간 상한 유지 (evidence parallel 종료 후 추가 9s 대기 cap). Mac mini 26B 동시 부하 시 실측 elapsed 11-14s 까지 자주 발생 → 15s 가 합리 균형. 본 fix 가 진짜 closure 효과. PR-Hermes-Docsrv-Search-1 Layer 1 fixture 의 8/10 no_classifier 경로 해소 예상.	2026-05-16 19:46:49 +09:00
Hyungi Ahn	a332a8aabe	fix(search): classifier timeout 15s → 30s (concurrent load 2x margin) A1+config(15s) 후속 진단: voice memo PoC plan 호출 elapsed_ms=14432 — 15s 한계 거의 밀착. Mac mini 26B 동시 부하 (classifier + evidence + synthesis 3-way) 시 빈번 ReadTimeout 잔존. 30s 로 2x 마진 확보 — config.yaml + classifier_service.py 양쪽 align. Phase 3.5 guardrail 동작 자체에는 영향 없음 (timeout 시 fallback 경로 동일). 향후 별 트랙 (DS-Mac-mini-26B-Concurrent-Load-1): asyncio.Semaphore 도입으로 Mac mini 26B 동시 호출 제한 vs triage 만 작은 모델 재도입. 본 PR 은 timeout 완화만.	2026-05-16 19:42:49 +09:00
Hyungi Ahn	a8b84e641a	fix(search): classifier.timeout config 10s → 15s (httpx inner timeout align) A1 timeout 5s → 15s 후 진단 로그가 httpx.ReadTimeout('') 확정. classifier_service 의 asyncio.timeout 외부 wrap (15s) 보다 AIClient._request 내부 httpx timeout (10s, config.yaml classifier.timeout) 가 먼저 fire → ReadTimeout 빈 메시지 raise. 두 timeout 을 15s 로 align — Mac mini 26B 동시 부하 (PR #20 후속) 시 classifier 지연 ≤15s 까지 허용. 후속: evidence_service.py / synthesis_service.py 의 timeout 도 동일 패턴 검토 필요 (별 PR, DS-Mac-mini-26B-Concurrent-Load-1 트랙).	2026-05-16 19:12:51 +09:00
Hyungi Ahn	542b6a0084	fix(search): classifier error log type+repr (empty-msg exception 진단) PR-Hermes-Docsrv-Search-1 Layer 1 fixture 가 classifier error: <빈 메시지> 빈번 발생 보고. isolation 직접 호출은 3/3 성공, 동시 부하 (ask endpoint 의 classifier + evidence parallel) 시에만 발생. Exception type + repr 캡처해서 root cause 식별 (httpx.ReadTimeout / TimeoutError / ConnectionError / 기타 무엇인지). 식별 후 후속 PR (DS-Classifier-Concurrent-Load-1) 에서 본격 mitigation.	2026-05-16 19:08:23 +09:00
Hyungi Ahn	c769ad14ad	fix(search): classifier LLM_TIMEOUT_MS 5s → 15s (Mac mini 26B concurrent load) PR #20 (`f139945`) GPU LLM 제거 후 Mac mini 26B 가 triage + classifier + chat + STT 동시 흡수. classifier_service hardcoded 5s timeout (config.yaml `timeout: 10` 무시) 이 동시 부하 시 빈번 초과 → CIRCUIT_THRESHOLD(5) 누적 → circuit 60s open → verdict=None → refusal_gate conservative_refuse(no_classifier) 경로. 실측: 정상 부하 단독 호출 = 2.3s (500 prompt + 49 completion tokens), 동시 호출 시 ev_ms/synth_ms 가 15s 까지 누적 — 5s 한계가 architectural mismatch. 15s 로 상향 → classifier 정상 verdict 반환 → refusal_gate 가 classifier 의 sufficient/insufficient 사용 (conservative fallback 회피). 본 fix 는 [[2026-05-21 Mac mini 26B 1주 부하 측정]] observation 의 회귀 결과로 자연 정리. config.yaml `classifier.timeout: 10` 와는 별 변수 — 본 1줄은 코드 내 한계, config 항목은 별 PR (Config-Driven-Timeout-1) 에서 통합 검토. 발견 경로: PR-Hermes-Docsrv-Search-1 Layer 1 fixture (curl direct, 10/10 ask) 가 conservative_refuse(no_classifier) 8건 + timeout 2건 보고. fastapi log "classifier circuit OPEN for 60s" + "classifier timeout" 페어 발견.	2026-05-16 19:02:55 +09:00
Hyungi Ahn	19bf5b1e38	feat(memo): Hermes input gateway — source_channel='hermes' + source_metadata jsonb PR-Hermes-Docsrv-Bridge-1 v1. Hermes Agent (Mac mini Discord) 를 Document Server 입력 게이트웨이로 reframe — 코딩 executor X, Claude Code 변동 0. 변경: - migration 267: source_channel enum 에 'hermes' 추가 - migration 268: documents.source_metadata jsonb NOT NULL DEFAULT '{}' 추가 - Document model: source_metadata 컬럼 ORM 매핑 + enum 'hermes' 노출 - MemoCreate: source_channel + source_metadata 필드 수용 (default='memo' 호환) - create_memo: channel allowlist (memo/voice/hermes) + metadata jsonb 저장 - list_memos: IN tuple 에 'hermes' 추가 (inbox 노출) - MemoResponse + _to_memo_response: source_metadata 노출 (UI 배지 준비) LLM 호출 0 — Hermes 의 HTTP POST 만. 분류/요약은 classify_worker 비동기 처리. promote-to-event guard (562/664) 변경 0 — v1 = hermes 메모 promote 차단 유지. plan: ~/.claude/plans/idempotent-seeking-hollerith.md Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-16 13:44:15 +09:00
Hyungi Ahn	3627060d2a	fix(ingest): devonagent extract md_status 'ready' → 'success' documents_md_status_check 제약은 {pending/processing/success/partial/failed/skipped} 만 허용. extract_worker 의 web HTML 분기가 'ready' 박아서 CheckViolationError 로 3회 실패. plan/docs/메모리에 'ready' 로 잘못 표기됐던 것 수정. 19668 (첫 sample doc) 검증 중 발견. fix 후 queue 'failed' 행 reset 으로 재실행. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-16 08:42:15 +09:00
Hyungi Ahn	0cbba0ceeb	feat(ingest): devonagent 트랙 Phase 1 ingest 활성화 DEVONagent/DEVONthink 가 발견한 웹페이지를 NAS Web/ drop → file_watcher ingest → extract 4-tier fallback (trafilatura/sibling-md/readability/bs4) → embed + chunk 까지. classify/preview/markdown SKIP. - source_channel='devonagent' (migration 001 dormant 활성화) - file_watcher: SCAN_TARGETS 통합 + Web/ rglob + canonical_url dedup + sidecar 누락 정책 (skip 안 함, web_meta.sidecar_missing=true flag) - extract_worker: HTML+devonagent 분기 + md_extraction_engine 4-tier 구분 (trafilatura → sibling .md ≥200char → readability+markdownify → bs4_text) - queue_consumer: enqueue_next_stage 의 extract stage 만 source_channel- aware override (devonagent → [embed, chunk]) - classify_worker: devonagent safety skip (law_monitor 패턴 mirror, ai_domain='Web', ai_tags=['Web/{host}']) - requirements: trafilatura/readability-lxml/markdownify 추가 - docs: devonthink-web-bridge.md 설치 가이드 + first-wins 정책 명시 Phase 1 closure 기준 = 재료 품질 (검색 가능 + 노이즈율 + dedup + 엔진 분포). 활용처(ai_tldr/digest/PKM 회고)는 1-2주 OR 30-50건 관찰 후 별 PR 에서 결정. Plan: ~/.claude/plans/db-snuggly-petal.md Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 21:23:16 +09:00
hyungi	118f32f9b1	refactor(ai): PR #20 reframe cleanup — Ollama LLM 잔재 주석 정정 PR #20 (2026-05-14, GPU LLM 제거 + Mac mini 26B MLX 흡수) 의 swap 이 backends.json + 코드 주석/docstring 까지 따라가지 못한 표현 잔재 정리. - app/ai/client.py: AIClient docstring 및 call_triage / call_fallback docstring 의 "4B Ollama" → "Mac mini 26B MLX" / "현재는 triage 와 동일 엔드포인트" → "Claude Sonnet 4 API (PR #20 swap 완료)" - app/core/config.py: triage/primary/fallback 주석 통합 + Phase 3.5 classifier/verifier 주석에 PR #20 endpoint 명시 (history 보존) - app/services/search/{llm_gate,classifier_service,verifier_service, evidence_service}.py: "fallback(Ollama)" / "Ollama concurrent OK" / "triage(4B Ollama)" 표현을 Mac mini 26B MLX endpoint 기준으로 정정 + concurrent 안전성 별 검토 마커 추가 - app/services/digest/summarizer.py: "MLX hang/Ollama stall 방어" → "MLX hang / fallback Claude API stall 방어" - app/services/prompt_versions.py: SUMMARY_TRIAGE_TASK + ASK_PROMPT_VERSION 주석의 "4B Ollama" / "4B gemma Ollama" → Mac mini 26B MLX - app/workers/classify_worker.py: B-1 tier triage docstring 정정 코드 동작 변경 0 (주석/docstring 만). embed_worker / study_question_embed_worker 의 "Ollama bge-m3" 표현은 사실 정확이라 유지. 검증: - ollama list → bge-m3:latest 잔존 (embedding owner) - /api/embeddings probe → 1024-dim 200 OK - fastapi embed/ollama error 0 (last 10min) - document.hyungi.net 200 plan: ~/.claude/plans/4-stateless-dongarra.md Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 12:09:15 +00:00
Hyungi Ahn	e74d5e29a0	docs(news): RSS 후보 명단 (PR-News-Prep-Layer-1) 약한 국가 (TW/HK/IN/CN 활성 2) 보강 후보 8건. 자동 HEAD 검증 4/8 ✅: - HKFP / The Hindu / TOI World / Caixin English URL 갱신 필요 4건 — Focus Taiwan / 自由時報 / Scroll.in / RTHK 사용자가 직접 RSS index 확인 후 갱신 + enable 결정. 본 PR INSERT 안 함. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 16:43:06 +09:00
Hyungi Ahn	73734d5585	fix(news): backfill INTERVAL bind 을 make_interval(days=>:days) 로 교체 asyncpg 가 :days \|\| ' days' 의 int → text 암묵 변환을 거부함. make_interval 사용으로 int 그대로 바인딩 가능. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 16:40:11 +09:00
Hyungi Ahn	78b8b52a86	fix(news): backfill script sys.path 컨테이너 호환 (parent.parent / 'app' 또는 parent.parent) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 16:39:47 +09:00
Hyungi Ahn	08cf676c26	fix(news): news 문서 chunk stage enqueue 추가 + 7일 백필 스크립트 document_chunks.country 가 7일 분포 기준 99.9% NULL 이었던 root cause = news_collector 가 summarize + embed 만 enqueue 하고 chunk 를 enqueue 하지 않아 chunk_worker 가 news 문서에 한 번도 안 돌고 있었음. queue_consumer.next_stages 의 summarize 키 부재가 follow-up 미연결 원인. news 외 summarize 흐름 부수영향 회피를 위해 next_stages 가 아니라 news_collector RSS/API 양쪽에 chunk enqueue 1줄씩 명시 추가. days_old <= 30 가드 안에서 embed 와 동일 정책. scripts/news_chunk_country_backfill.py — doc 단위 small batch, 실패 doc skip, 50건마다 progress. queue 우회 직접 chunk_worker.process 호출로 timing 통제. Gate (PR closure): A) chunked_doc_pct > 95% 최근 7일 news doc 중 chunk 보유 비율 B) country null_pct < 5% 최근 7일 news chunk country NULL 비율 plan: ~/.claude/plans/7-whimsical-crab.md (PR-News-Prep-Layer-1) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 16:35:53 +09:00
hyungi	e78a10b805	Merge pull request 'feat(digest): Phase 4.5 SvelteKit UI' (#22 ) from feat/digest-ui-phase45 into main Reviewed-on: #22	2026-05-15 14:05:12 +09:00
hyungi	2893029d8d	feat(digest): Phase 4.5 SvelteKit UI /digest 라우트 신규 — Phase 4 (7일 rolling country×topic batch digest) backend 운영 데이터 사용자 진입점. 최신 1건 (GET /api/digest/latest) 표시 + country pill 탭 + topic 카드 (rank/label/summary/article_count/importance, fallback Badge 조건부). - frontend/src/routes/digest/+page.svelte 신규 (123 LOC) — Svelte 5 runes, Tabs snippet 패턴, 404 EmptyState 흡수, country reload 보호. - frontend/src/routes/+layout.svelte nav 1줄 추가 (아침 브리핑 뒤). 후속 별 PR: date picker, article click 라우팅, 국기+한국어 dictionary, Phase 4.6 feedback loop. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 05:04:22 +00:00
hyungi	f17d58f992	chore(gitignore): host venv + 백업/롤백 스냅샷 패턴 추가 .venv/ (host venv, 76M), .bak / .pre-* / .pre-*/ (작업 전 백업). git history가 source of truth이므로 working tree 백업은 ignore.	2026-05-15 04:46:26 +00:00
hyungi	03a37c4b01	chore(reports): Phase 1/2 baseline + 2026-04~05 평가·관측 자료 보존 Phase 1.1a~1.3 / Phase 2.1~2.3 평가셋 측정 결과 + regression baseline + D9 STT 후속 VRAM 피크 관측 데이터. project_search_v2 메모리에 Phase 2 평가셋 v0.2 baseline용 보존 명시.	2026-05-15 04:45:56 +00:00
hyungi	10244a726f	Merge pull request 'feat(study): Mac mini derived-worker (PR-MacMini-Derived-Worker-1)' (#21 ) from feat/macmini-derived-explanation into main Reviewed-on: #21	2026-05-15 13:36:26 +09:00
hyungi	5125f82d4a	feat(study): Mac mini derived-worker (PR-MacMini-Derived-Worker-1) GPU = RAG context provider, Mac mini = LLM 가공 공장. GPU 측 변경: - app/api/internal_study.py: GET /internal/study/explanation-context/{qid} Bearer auth, gather_explanation_context + _render_envelope_prompt 재호출. 204=evidence missing, 410=deleted/ready. - app/workers/study_queue_consumer.py: settings.study_explanation_enabled false 시 explanation 분기 skip (status/attempts 미변경, pending 유지 → Mac mini 흡수). - app/core/config.py: study_explanation_enabled + internal_worker_token 2 setting. - app/main.py: internal_study_router include (prefix /internal/study). - docker-compose.yml: fastapi ports → 100.110.63.63:8000 Tailscale bind, STUDY_EXPLANATION_ENABLED + INTERNAL_WORKER_TOKEN env 추가. Mac mini 측: ~/derived-worker/ (별도 push 0, 어제 작성). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 03:13:43 +00:00
Hyungi Ahn	261036c7b2	ops(file-watcher): idle fire 로그 가시화 watch_inbox() 가 new_count/changed_count 둘 다 0 일 때 silent — PR-NAS-Watch-Folder 검증 시 fire 추적 부재 확인 후 보완. else 분기 추가해 매 5min fire 마다 "변경 없음 (idle)" info 로그 한 줄. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 13:32:38 +09:00
Hyungi Ahn	a6b8dae18e	fix(gpu-health): container_ip() 가 document_server network IP 만 추출 ollama 는 home-gateway-network / document_server / ollama_default 3개 network 에 속해 range loop 가 모든 IP concat. (index .NetworkSettings.Networks "hyungi_document_server_default").IPAddress 로 명시. 다른 GPU 서비스 4개도 동일 single-network 이라 호환. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 10:02:54 +09:00
Hyungi Ahn	8f4413a38c	fix(gpu-health): scripts 호출 도구를 host curl + container IP 로 통일 OCR/STT 컨테이너 안에 curl 미설치 (slim python image). docker exec curl 표준은 실측 OCI exec 실패. host curl + docker bridge IP (172.20.0.x) 로 변경 — host publish 추가 아니라 docker network 내부 검증이라 보안 표면 동일. reranker 만 curl 있고 OCR/marker/STT 는 python 만 있어 분기 발생을 회피. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 09:51:59 +09:00
Hyungi Ahn	98ee7dffe2	ops(gpu-health): GPU 서비스 health/smoke 표준화 + synthetic VRAM 피크 가드 PR-GPU-Health-1. 운영 준비성 표준화 PR (모델 성능 개선 아님). - OCR /smoke endpoint 추가 (160x60 OK PNG in-memory, 200/503 분기, Docker healthcheck 미사용) - marker /health endpoint 추가 (stt/ocr 동일 시그니처) - reranker docker-compose healthcheck 추가 (TEI :80/health) - scripts/gpu_service_smoke.sh: docker exec 표준 점검 (OCR/STT expose-only) - scripts/gpu_vram_fixture.sh: Mode A sequential + Mode B light overlap + --stress 옵션 - tests/load/fixtures/: synthetic ocr_ok.png / sine_30s.wav / lorem_1p.pdf OCR 빈 응답 false negative — root cause: ports 미매핑. 결정: ocr-service / stt-service 는 expose-only 유지, 운영 점검은 docker exec 내부 curl 표준. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 09:42:07 +09:00
hyungi	f1399459c5	Merge pull request 'refactor(ai): GPU Ollama LLM 제거 — Mac mini 26B 단일 generation 호스트로 통일' (#20 ) from feat/gpu-llm-remove into main Reviewed-on: #20	2026-05-14 08:34:00 +09:00
Hyungi Ahn	4eed0bc4f8	refactor(ai): GPU Ollama LLM 제거 — Mac mini 26B 단일 generation 호스트로 통일 GPU 서버 정체성 = embedding/rerank/STT/OCR/marker 특화 백엔드. Generative LLM 0. Mac mini gemma-4-26B-A4B 가 triage + primary + classifier 모두 흡수. fallback 은 Claude Sonnet 4 API (자동 trigger, premium 과 budget 공유). - triage: GPU Ollama gemma4:e4b → Mac mini :8801 26B (primary 동일 endpoint) - fallback: GPU Ollama gemma4:e4b → Claude Sonnet 4 API (require_explicit_trigger=false) - classifier: GPU Ollama gemma4:e4b → Mac mini :8801 26B (max_tokens 512) - primary / premium / embedding / rerank: 변경 0 후속 (별 커밋): `ssh gpu "ollama rm gemma4:e4b-it-q8_0"` — VRAM ~11GB 회수. Mac mini 단일화 위험 mitigation = (1) Mac mini uptime 31d 무중단 검증, (2) Claude Sonnet 4 API daily_budget $5 안 (Mac mini up 가정 호출 빈도 낮음), (3) Beszel siteMonitor :8801 health check + Synology Chat alert. plan: ~/.claude/plans/rosy-launching-otter.md §C/§D/§E (7-device LLM 배치 + 운영 전략) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 08:16:40 +09:00
hyungi	92aa2aaf53	Merge pull request 'feat(auth): voice-memo bot 365d access token (PoC v1)' (#19 ) from feat/voice-memo-bot-token into main Reviewed-on: #19	2026-05-13 14:19:41 +09:00
Hyungi Ahn	52f86acda7	feat(auth): voice-memo bot 365d access token (PoC v1) bot 계정(`voice-memo-bot`) 한정 long-expiry access token 발급 경로 추가. 일반 사용자 흐름 영향 0 (env gate default false). - core/auth.py: create_voice_memo_bot_token() 신규 (env gate + username hard-match) - api/auth.py: login route 에 bot 분기 (bot 이면 long token 반환, 일반은 기존 흐름) - docker-compose.yml: 3 env (VOICE_MEMO_BOT_TOKEN_ENABLED/_USERNAME/_EXPIRE_DAYS) default false OpenClaw `/voice-memo` plugin → DS `/memos/` Bearer proxy 의 auth 기반. 정식 service-account/api_keys 테이블은 Phase 2 (multi-service 인입 추가 시점). plan: ~/.claude/plans/rosy-launching-otter.md project: ~/.claude/projects/-Users-hyungiahn/memory/project_voice_memo_pipeline.md Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 12:24:18 +09:00
Hyungi Ahn	08e7fed984	ops(search): reranker drift fix 사후 재측정 (postfix observation)	2026-05-13 12:06:20 +09:00
Hyungi Ahn	d3303cec1c	fix(search): point reranker endpoint to TEI service	2026-05-13 12:02:26 +09:00
hyungi	1293c7094a	Merge pull request 'feat/news-tech-ai-sources' (#17 ) from feat/news-tech-ai-sources into main Reviewed-on: #17	2026-05-13 07:54:59 +09:00
hyungi	38b3630492	Merge pull request 'feat(briefing): date picker + 카드별 읽음/하이라이트 액션' (#16 ) from feat/briefing-date-picker-and-actions into main Reviewed-on: #16	2026-05-13 07:54:51 +09:00
hyungi	4b8120d83f	feat(briefing): date picker + 카드별 읽음/하이라이트 액션 사용자 요청 (2026-05-13): - 오늘 briefing 만 보여주고 과거 못 보는 게 아쉬움 → 날짜 선택 UI - 시간대 별 나열은 오히려 불편 → date dropdown 1단계 선택 - 각 카드에 읽음/하이라이트 토글 Schema (migrations 263~266, 단일 statement): - briefing_topics.is_read BOOL NOT NULL DEFAULT false - briefing_topics.read_at TIMESTAMPTZ - briefing_topics.highlighted BOOL NOT NULL DEFAULT false - briefing_topics.highlighted_at TIMESTAMPTZ API (app/api/briefing.py): - TopicResponse 에 id / is_read / read_at / highlighted / highlighted_at 추가 - GET /api/briefing/dates → 사용 가능 날짜 목록 (60일 cap) · briefing_date / total_topics / total_articles / status / read_count / highlighted_count - PATCH /api/briefing/topics/{id}/read body {value: bool} → 읽음 토글 - PATCH /api/briefing/topics/{id}/highlight body {value: bool} → 하이라이트 토글 - 토글 시 *_at 컬럼 자동 설정/NULL UI (frontend/src/routes/news/+page.svelte): - 헤더 우측 <select> date dropdown — 최신 + N일치 (highlighted_count 별 표시) - 선택 시 /api/briefing?date=… 로 해당 날짜 briefing 로드 - 카드 우측 상단 ★ (하이라이트) + 읽음 버튼 - 하이라이트 = Card class ring-2 ring-yellow-400 - 읽음 = 외부 div class opacity-60 (시각 차분화, 펴기 가능) - 토글 즉시 PATCH 호출 + 로컬 state 갱신 each key topic.topic_rank → topic.id 변경 (이미 unique).	2026-05-12 22:05:06 +00:00
hyungi	5a86e045f1	feat(news): seed 14 tech/AI news sources (8 countries) briefing/digest 의 cross-country tech 토픽 다양성 확보용 source seed. - KR ×2: GeekNews (Hada), AI Times - US ×4: Hacker News, ArsTechnica AI, The Verge Tech, TechCrunch - GB ×2: The Register, BBC Technology - DE ×1: Heise Online - JP ×2: ITmedia News, Gigazine - CN ×1: 36Kr - FR ×1: ZDNet France - IN ×1: Analytics India Magazine idempotent: WHERE NOT EXISTS (name). 운영 DB 에는 이미 적용됨, 백업 복원/신규 deploy 환경에서 자동 시드. 수집 검증 (2026-05-13 1차 fire, 8 source): - 성공: Hacker News 30 / ArsTechnica AI 20 / Verge 10 / TC 20 / Register 50 / Heise 153 (총 283건 신규) - 후속 fix: GeekNews 의 http redirect → feedburner 직접 URL, AI Times URL 오타 → S1N1.xml. content category 는 news_sources.category (Tech / AI) 로 보존, briefing 의 country 필터 (MIN_COUNTRIES_PER_TOPIC ≥ 2) 와 호환.	2026-05-12 21:47:15 +00:00
hyungi	1d3d61d31e	fix(briefing): lower clustering threshold 0.78 → 0.70 배포 후 관측 결과 (2026-05-13 새벽): - 126 docs / 7 countries 인데 THRESHOLD=0.78 로 raw_clusters=124, dropped_min_articles=122, kept=1. - 거의 매 article 이 별 cluster 로 갈려 토픽 묶음 실패. - 같은 cron 어제 (5/12) 는 101 docs 에서 6 topics 성공 — 그날 뉴스가 우연히 같은 토픽으로 더 모인 case. 수동 측정 (5/13 동일 docs): - 0.78 → kept=1 - 0.70 → kept=5 (allowed) 영구 변경 = THRESHOLD=0.70. cross-country 필터 (MIN_COUNTRIES≥2) + min_articles(≥2) 그대로 유지하므로 noise topic 위험은 제한적. 원본 주석 (0.75~0.80 중간값) 도 갱신.	2026-05-12 21:44:00 +00:00
hyungi	12ebc7c78c	Merge pull request 'fix/scheduler-kst-timezone' (#15 ) from fix/scheduler-kst-timezone into main Reviewed-on: #15	2026-05-13 06:34:12 +09:00
hyungi	2dbbeac1c7	fix(daily_digest): cast today to date object for KST comparison 매일 20:00 KST cron fire 시 fail: UndefinedFunctionError: operator does not exist: date = character varying 원인: today 가 strftime("%Y-%m-%d") 로 string, func.date(created_at) 가 date 타입. PostgreSQL 가 date = string 비교 거부. Fix: today = datetime.now(ZoneInfo("Asia/Seoul")).date() — date 객체로. KST 기준은 scheduler cron 이 KST 20:00 에 fire 되므로 자연 일치. scope: app/workers/daily_digest.py:24	2026-05-12 21:30:41 +00:00
hyungi	138f689c98	fix(scheduler): pass KST timezone to all CronTriggers AsyncIOScheduler(timezone="Asia/Seoul") 의 scheduler-level timezone 이 CronTrigger 에 자동 전파되지 않아 6 cron 모두 UTC 로 fire 되던 버그. 영향 (모두 9h 오차): - morning_briefing 의도 05:10 KST → 실제 14:10 KST - daily_digest 의도 20:00 KST → 실제 05:00 KST (다음날) - global_digest 의도 04:00 KST → 실제 13:00 KST - law_monitor 의도 07:00 KST → 실제 16:00 KST - mailplus_morning 의도 07:00 KST → 실제 16:00 KST - mailplus_evening 의도 18:00 KST → 실제 03:00 KST (다음날) Fix: 모든 CronTrigger 에 timezone=KST (= ZoneInfo("Asia/Seoul")) 명시. 검증 (재시작 후): law_monitor next: 2026-05-13 07:00 KST mailplus_morning next: 2026-05-13 07:00 KST mailplus_evening next: 2026-05-13 18:00 KST daily_digest next: 2026-05-13 20:00 KST global_digest next: 2026-05-14 04:00 KST morning_briefing next: 2026-05-14 05:10 KST	2026-05-12 21:30:34 +00:00
Hyungi Ahn	8f7871b443	ops(search): PR-RAG-Time-1 1주 후 재측정 PASS baseline (2026-05-03) + week1 (2026-05-12) 두 측정 결과 JSON/MD 합본. 회귀 판정 4신호 모두 통과: - top3 doc_id 변동: 0/6 쿼리 - freshness_ms max: 0.54ms (임계 10ms) - total_ms max: 413ms (임계 500ms, warmup 후) - policy 분포: 9/30 동일 별 이슈: reranker 404 drift 발견 (config.yaml endpoint = ollama 호출, 실제는 TEI 컨테이너). PR-RAG-Time-1 본질 회귀와 분리. 별 incident 트랙. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 15:41:40 +09:00
hyungi	626e859a81	Merge pull request 'docs(claude): refresh — drop stale model/IP, inventory authoritative' (#14 ) from docs/claude-md-refresh into main Reviewed-on: #14	2026-05-12 15:07:39 +09:00
Hyungi Ahn	f6f8f3b9d8	docs(claude): refresh — drop stale model/IP, inventory authoritative stale 영역 정리: - Qwen3.5-35B-A3B / nomic-embed-text / Qwen2.5-VL-7B → 역할별 표기 (실제 모델은 inventory) - Mac mini Tailscale 100.76.254.116 / GPU 100.111.160.84 / NAS 100.101.79.37 → 모두 폐기 (D21 closure 2026-05-12), LAN 표기만 유지 - Mac mini nginx 앞단 프록시 → 폐기 (home-caddy 가 직접 ingress) - "Mac mini 메인 docker compose" → GPU 가 메인 정정 추가: - 운영 변경 정책 (inventory → config → deploy → verify) - 머신 역할 표 / AI 파이프라인 역할 표 / 워커 스케줄 표 - 아침 브리핑 / global digest 진입점 + scheduler timezone - asyncpg multi-statement 1 파일 1 statement 규칙 (PR-MorningBriefing-1 fix 교훈) - 디자인 토큰 only 규칙 - 한국어 NFS 경로 NFC/NFD	2026-05-12 15:07:12 +09:00
hyungi	1f4bbb9413	Merge pull request 'docs(readme): refresh stack/features/infra to 2026-05 reality' (#13 ) from docs/readme-refresh into main Reviewed-on: #13	2026-05-12 15:05:20 +09:00
Hyungi Ahn	6d8d207669	docs(readme): refresh stack/features/infra to 2026-05 reality - AI: Qwen3.5-35B → gemma-4 26B MLX / 4B triage / bge-m3 / TEI reranker / Surya OCR / MLX Whisper - infra: Mac mini Docker Compose → GPU 서버 메인 / Mac mini = MLX inference + STT - features: 아침 브리핑, Phase 4 Digest, library, memos, events, study, audio/video, marker - inventory authoritative 안내 (README 가 stale 진실 대신 inventory 우선) - gpu-server/ deprecated 표기	2026-05-12 15:03:52 +09:00

1 2 3 4 5 ...

572 Commits