Dense vs Hybrid Search
Dense Retrieval과 Hybrid Search의 검색 결과를 비교하며 각 방법의 장단점을 이해합니다
advanced25분
Parameters
이 실험의 인터랙티브 파라미터는 콘텐츠 구현 시 추가됩니다
쿼리: "서버 운영 비용을 줄이려면?"
BM25 onlyDense only
BM25 (키워드)
#1 서버 비용 최적화 가이드0.50
서버비용최적화
#2 마이크로서비스 비용 관리0.25
마이크로서비스비용관리
#3 클라우드 요금 절약 팁0.00
클라우드요금절약
Dense (의미)
#1 클라우드 요금 절약 팁1.000
#2 서버 비용 최적화 가이드1.000
#3 마이크로서비스 비용 관리0.990
Hybrid (결합)
#1 서버 비용 최적화 가이드0.750
BM25: 0.50|Dense: 1.00
#2 마이크로서비스 비용 관리0.620
BM25: 0.25|Dense: 0.99
#3 클라우드 요금 절약 팁0.500
BM25: 0.00|Dense: 1.00
관찰 포인트
- α를 0으로 설정하면 BM25 결과만 사용합니다 (키워드 매칭)
- α를 1로 설정하면 Dense 결과만 사용합니다 (의미 검색)
- Hybrid Search는 두 방식의 장점을 결합합니다 — α=0.5~0.7이 일반적
- "비용 절감" 쿼리에서 BM25는 "비용"이 포함된 문서를 잘 찾지만, Dense는 "요금 절약"도 찾아냅니다