Files
gpu-services/backends.json
Hyungi Ahn 2dab682e21 fix: backend_model_id 매핑 추가 — MLX 모델 ID 불일치 해결
MLX 서버 모델 ID(mlx-community/Qwen3.5-35B-A3B-4bit)와
사용자 노출 ID(qwen3.5:35b-a3b)가 달라 500 에러 발생.
registry에 backend_model_id 필드 추가하여 프록시 시 변환.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-31 15:14:55 +09:00

23 lines
539 B
JSON

[
{
"id": "ollama-gpu",
"type": "ollama",
"url": "http://host.docker.internal:11434",
"models": [
{ "id": "bge-m3", "capabilities": ["embed"], "priority": 1 }
],
"access": "all",
"rate_limit": null
},
{
"id": "mlx-mac",
"type": "openai-compat",
"url": "http://192.168.1.122:8800",
"models": [
{ "id": "qwen3.5:35b-a3b", "backend_model_id": "mlx-community/Qwen3.5-35B-A3B-4bit", "capabilities": ["chat"], "priority": 1 }
],
"access": "all",
"rate_limit": null
}
]