gpu-services

Files

T

Hyungi Ahn a16ff2ea88 fix: max_tokens 추가 — Gemma 16000, EXAONE 4096

응답이 중간에 끊기는 문제 해결. ModelAdapter에 max_tokens
파라미터 추가, stream/complete 양쪽 payload에 반영.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

2026-04-06 12:52:31 +09:00

feat: NanoClaude Phase 2 — EXAONE→Gemma 파이프라인, 큐, 상태 API

2026-04-06 12:04:15 +09:00

models

feat: NanoClaude Phase 2 — EXAONE→Gemma 파이프라인, 큐, 상태 API

2026-04-06 12:04:15 +09:00

routers

fix: Synology UX — "🤔 생각 중..." + route시 "📝 더 깊이 살펴볼게요..."

2026-04-06 12:47:02 +09:00

services

fix: max_tokens 추가 — Gemma 16000, EXAONE 4096

2026-04-06 12:52:31 +09:00

config.py

feat: NanoClaude Phase 3 — Synology Chat 연동

2026-04-06 12:25:48 +09:00

Dockerfile

feat: NanoClaude Phase 1 — 비동기 job 기반 AI Gateway 코어 구현

2026-04-06 11:12:04 +09:00

main.py

feat: NanoClaude Phase 3 — Synology Chat 연동

2026-04-06 12:25:48 +09:00

requirements.txt

fix: python-multipart 추가 — form parsing 의존성

2026-04-06 12:27:23 +09:00