8e1645dfc9
news article 은 텍스트 네이티브(본문=extracted_text)라 markdown 단계를 미enqueue 하는데(summarize/embed/chunk 만), md_status 기본값 pending 이 영구 고착돼 30,903 건이 비수렴 → (1) backlog 지표 오염(실 미변환≈0인데 pending 30,930) (2) md_status_pending partial 인덱스 비대. terminal skipped(변환 비대상)로 정합화. - news_collector.py: RSS/API 양쪽 Document 생성 시 md_status=skipped + md_extraction_error 사유 명시(생성 시점부터 정합). - documents/[id]/+page.svelte: article 뷰의 MarkdownDoc 에 mdStatus 미전달(null). badge 는 mdStatus 로만 구동 → skipped 라도 "Markdown 제외" 칩이 3만 기사에 뜨지 않게(article 은 markdown 변환 비대상이라 badge 자체가 무의미). - 기존 30,903 건 backfill UPDATE(별도 실행): pending 30,930→27, partial 인덱스 동일 축소. 검증: pending 잔여 27(eml/doc/xls/이미지/미디어 long-tail) / 검색 무영향(article extracted_text·chunks 그대로) / md_status 만 변경. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>