diff --git a/app/workers/news_collector.py b/app/workers/news_collector.py index 99d515f..dc8ad90 100644 --- a/app/workers/news_collector.py +++ b/app/workers/news_collector.py @@ -206,6 +206,11 @@ async def _fetch_rss(session, source: NewsSource) -> int: extracted_text=f"{title}\n\n{summary}", extracted_at=datetime.now(timezone.utc), extractor_version="rss", + # article = 텍스트 네이티브(본문=extracted_text). markdown 단계 미enqueue 라 + # 기본값 'pending' 이면 영구 비수렴 → backlog 지표 오염 + md_status_pending partial + # 인덱스 비대. 생성 시점에 terminal 'skipped' 로 명시(변환 비대상). + md_status="skipped", + md_extraction_error="news article: 텍스트 네이티브, markdown 변환 비대상", source_channel="news", data_origin="external", edit_url=link, @@ -299,6 +304,11 @@ async def _fetch_api(session, source: NewsSource) -> int: extracted_text=f"{title}\n\n{summary}", extracted_at=datetime.now(timezone.utc), extractor_version="nyt_api", + # article = 텍스트 네이티브(본문=extracted_text). markdown 단계 미enqueue 라 + # 기본값 'pending' 이면 영구 비수렴 → backlog 지표 오염 + md_status_pending partial + # 인덱스 비대. 생성 시점에 terminal 'skipped' 로 명시(변환 비대상). + md_status="skipped", + md_extraction_error="news article: 텍스트 네이티브, markdown 변환 비대상", source_channel="news", data_origin="external", edit_url=link, diff --git a/frontend/src/routes/documents/[id]/+page.svelte b/frontend/src/routes/documents/[id]/+page.svelte index 745f6a9..4301f89 100644 --- a/frontend/src/routes/documents/[id]/+page.svelte +++ b/frontend/src/routes/documents/[id]/+page.svelte @@ -412,11 +412,13 @@ {#if doc.md_content || doc.extracted_text} +