diff --git a/tests/fixtures/qwen3_embedding_serving_fixture.json b/tests/fixtures/qwen3_embedding_serving_fixture.json new file mode 100644 index 0000000..cd8fd0b --- /dev/null +++ b/tests/fixtures/qwen3_embedding_serving_fixture.json @@ -0,0 +1,26 @@ +{ + "_meta": { + "plan": "embedding-phase2a-1 G-1", + "measured_at": "2026-06-12", + "serving": "Ollama 0.20.0 (GPU container `ollama`), endpoint = POST /api/embed (단일 고정 — legacy /api/embeddings 사용 금지)", + "invariant": "저장=조회 동일 모델+버전, 프롬프트는 역할별 고정 (문서=plain / 쿼리=instruct prefix)" + }, + "instruct_prefix_pinned": "Instruct: Given a web search query, retrieve relevant passages that answer the query\nQuery: ", + "models": { + "qwen3-embedding:0.6b": { + "digest": "ac6da0dfba84", "size": "639MB", "dim": 1024, "l2_normalized": true + }, + "qwen3-embedding:4b": { + "digest": "df5bd2e3c74c", "size": "2.5GB(Q4)", "dim": 2560, "l2_normalized": true, + "mrl_dimensions_option": {"supported": true, "dimensions=1024": {"dim": 1024, "l2_norm": 1.0, "note": "Ollama 가 truncate+재정규화까지 수행 — 쿼리측 MRL 은 dimensions 옵션으로 처리"}} + } + }, + "asymmetric_prefix_effect_0.6b": { + "doc": "압력용기의 수압시험은 설계압력의 1.3배로 실시하며, 시험 중 용접부 누설 여부를 육안으로 확인한다.", + "query": "압력용기 수압시험 기준 압력은?", + "cos_doc_vs_query_plain": 0.7446, + "cos_doc_vs_query_instruct": 0.7606, + "cos_plain_vs_instruct_query": 0.882, + "verdict": "prefix 가 쿼리 임베딩을 실질 변화시키고(0.882) 관련쌍 유사도를 올림(+0.016) — 비대칭 사용 필수" + } +}