MD 와 벡터 데이터베이스(ex 쿼드런트)를 구축하는 방식(RAG) 기반 AI 학습 전략의 차이

IT&AI

by hoholand 2025. 12. 3. 21:46

사내 문서를 **Markdown(MD)으로 변환하여 LLM에 직접 입력하는 방식(Long Context)**과 **Qdrant와 같은 벡터 데이터베이스(Vector DB)를 구축하는 방식(RAG)**은 근본적인 접근법이 다르며, 활용 목적에 따라 장단점이 명확하게 갈립니다.

이 두 가지 접근 방식의 차이를 **성능(정확도/속도)**과 구축 난이도(엔지니어링/비용) 관점에서 비교해 드리겠습니다.

1. 개념적 차이 요약

MD 변환 후 활용 (Long Context Prompting):
- 문서를 구조화된 텍스트(MD)로 바꿔서 LLM의 프롬프트 창에 통째로 넣고 질문하는 방식입니다. (예: Gemini 1.5 Pro, GPT-4o의 긴 컨텍스트 윈도우 활용)
- 비유: 책 한 권을 펼쳐서 AI에게 보여주고 "여기서 답을 찾아줘"라고 하는 것.
Qdrant 구성 (RAG - Retrieval Augmented Generation):
- 문서를 조각(Chunk)내어 숫자로 변환(Embedding)한 뒤 DB에 저장하고, 질문과 관련된 부분만 검색(Retrieval)해서 LLM에 던져주는 방식입니다.
- 비유: 도서관 사서(Qdrant)에게 키워드를 주면 관련 페이지 3장만 복사해서 AI에게 주는 것.

2. 성능 관점 비교 (Performance)

결론: 문맥 이해와 추론은 MD 방식이 우세하고, 대규모 데이터 검색과 비용 효율은 Qdrant가 우세합니다.

비교 항목 MD 변환 (Long Context) Qdrant 구성 (Vector RAG)

정확도 (맥락 파악)	매우 높음. 문서의 전체 구조(헤더, 리스트 등)를 유지한 채 AI가 전체를 보고 판단하므로, 복합적인 질문("A문서와 B문서의 차이점은?")에 강합니다.	중간~높음. 문서를 잘라내기(Chunking) 때문에 문맥이 끊길 수 있습니다. 검색된 조각(Top-K)에 정답이 없으면 오답을 낼 확률이 높습니다.
검색 성능 (Specific)	특정 사실을 찾는 데는 좋으나, 문서 양이 너무 많으면 성능이 저하될 수 있습니다(Lost in the Middle 현상).	매우 높음. 방대한 데이터(수만 건의 문서) 중에서 특정 사실을 핀포인트로 찾아내는 데 최적화되어 있습니다.
응답 속도 (Latency)	느림. 입력 토큰이 많을수록 AI가 처리하는 시간이 길어집니다(수십 초~분 단위).	빠름. 관련된 소량의 텍스트만 처리하므로 응답 속도가 매우 빠릅니다.
할루시네이션	전체 문서를 보고 답하므로 비교적 적습니다.	검색 단계에서 엉뚱한 문서를 가져오면 할루시네이션이 발생할 수 있습니다.

3. 구축 난이도 관점 비교 (Implementation)

결론: 초기 진입은 MD 변환이 훨씬 쉬우나, 데이터가 쌓일수록 Qdrant가 필수적이게 됩니다.

A. MD 변환 방식 (난이도: 하)

구축 과정: 기존 문서(PDF, Docx, HWP)를 Markdown으로 변환하는 파이프라인만 만들면 됩니다. (LlamaParse, PyMuPDF 등의 툴 사용)
관리: 단순히 텍스트 파일로 관리하면 되므로 별도의 DB 서버 운영이 필요 없습니다.
한계: LLM의 컨텍스트 윈도우(토큰 제한)를 넘어가면 사용할 수 없습니다. (예: 문서가 1000페이지를 넘어가면 불가능하거나 비용 폭증)

B. Qdrant 구성 방식 (난이도: 상)

구축 과정: 복잡합니다.
1. 문서 전처리 (MD 변환 등)
2. 청킹(Chunking): 문서를 의미 단위로 자르는 전략 필요.
3. 임베딩(Embedding): 텍스트를 벡터로 변환할 모델 선정.
4. DB 구축: Qdrant 서버 구축 및 인덱싱.
5. 검색 로직: 하이브리드 검색(키워드+벡터) 및 리랭킹(Reranking) 구현 필요.
유지보수: 문서가 수정되면 해당 부분의 벡터만 지우고 다시 업데이트하는 파이프라인 관리가 필요합니다.

4. 비용 비교 (Cost)

MD 방식: 1회 질문 비용이 비쌉니다. 질문할 때마다 문서 전체 내용을 토큰으로 과금하기 때문입니다. (자주 묻지 않는 심층 분석용에 적합)
Qdrant 방식: 초기 구축 비용은 들지만, 운영 비용은 저렴합니다. 질문에 필요한 텍스트만 LLM에 보내므로 토큰 비용을 획기적으로 절감할 수 있습니다.

5. 전략적 제언: 둘은 경쟁 관계가 아니라 보완 관계입니다.

가장 이상적인 사내 AI 아키텍처는 **"고품질 MD 변환을 선행하고, 이를 Qdrant에 넣는 것"**입니다.

Why MD? PDF나 Word의 원본 텍스트는 표나 레이아웃 정보가 깨져 있습니다. 이를 MD로 변환하면 문서 구조(제목, 본문, 표)가 명확해져 AI가 훨씬 잘 이해합니다.
Hybrid 접근:
- Qdrant에 넣을 때: 원본 텍스트 대신 잘 정리된 MD 형식을 청킹해서 넣으면 검색 정확도가 대폭 상승합니다.
- 검색 후: Qdrant에서 찾아낸 관련 MD 조각들을 LLM에 던져줍니다.

어떤 것을 선택해야 할까요?

Case 1: 문서 양이 적고(책 1~2권 분량), 깊이 있는 추론이 필요하다.
- 👉 MD 변환 + Long Context 활용 (Qdrant 불필요)
- 예: "이번 프로젝트 기획서 전체를 읽고 잠재적 리스크를 분석해줘."
Case 2: 사내 규정집, 기술 매뉴얼 등 수천 페이지 문서를 대상으로 질문해야 한다.
- 👉 MD 변환 + Qdrant 구축 (RAG)
- 예: "사내 경조사비 규정 중 조부모상 휴가가 며칠이지?"

'IT&AI' 카테고리의 다른 글

자동화 솔루션 비교 분석 (0)	2025.12.03

minibus

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

상세 컨텐츠

본문 제목

본문