Dense vs Hybrid Search

Dense Retrieval과 Hybrid Search의 검색 결과를 비교하며 각 방법의 장단점을 이해합니다

advanced25분

Parameters

이 실험의 인터랙티브 파라미터는 콘텐츠 구현 시 추가됩니다

쿼리: "서버 운영 비용을 줄이려면?"
BM25 onlyDense only

BM25 (키워드)

#1 서버 비용 최적화 가이드0.50
서버비용최적화
#2 마이크로서비스 비용 관리0.25
마이크로서비스비용관리
#3 클라우드 요금 절약 팁0.00
클라우드요금절약

Dense (의미)

#1 클라우드 요금 절약 팁1.000
#2 서버 비용 최적화 가이드1.000
#3 마이크로서비스 비용 관리0.990

Hybrid (결합)

#1 서버 비용 최적화 가이드0.750
BM25: 0.50|Dense: 1.00
#2 마이크로서비스 비용 관리0.620
BM25: 0.25|Dense: 0.99
#3 클라우드 요금 절약 팁0.500
BM25: 0.00|Dense: 1.00

관찰 포인트

  • α를 0으로 설정하면 BM25 결과만 사용합니다 (키워드 매칭)
  • α를 1로 설정하면 Dense 결과만 사용합니다 (의미 검색)
  • Hybrid Search는 두 방식의 장점을 결합합니다 — α=0.5~0.7이 일반적
  • "비용 절감" 쿼리에서 BM25는 "비용"이 포함된 문서를 잘 찾지만, Dense는 "요금 절약"도 찾아냅니다

관련 개념