Chunking Strategy Lab

Chunk 크기와 Overlap 비율을 조절하며 검색 정확도와 비용의 트레이드오프를 실험합니다

intermediate20분

이 실험의 인터랙티브 파라미터는 콘텐츠 구현 시 추가됩니다

Chunk Size: 200 문자

50500

Overlap: 10% (20 문자)

0%50%

총 청크 수

179

평균 길이

겹침 문자

Chunk 10~200 (200자)

Transformer는 2017년 "Attention Is All You Need" 논문에서 제안된 신경망 아키텍처입니다. 기존의 RNN이나 LSTM과 달리 시퀀스를 병렬로 처리할 수 있어 학습 속도가 크게 향상되었...

Chunk 2180~380 (200자)

Transformer의 핵심 구성 요소는 Multi-Head Attention, Feed-Forward Network, Layer Normalization입니다. 각 레이어는 잔차 연결(Residual Connec...

Chunk 3360~560 (200자)

아키텍처를 기반으로 합니다. GPT 시리즈는 Decoder-only 구조를, BERT는 Encoder-only 구조를 사용합니다. 모델의 크기가 커질수록 성능이 향상되는 스케일링 법칙이 관찰되어, 수십억~수조 개의 ...

Chunk 4540~655 (115자)

)에서 Transformer 기반 LLM은 검색된 컨텍스트와 사용자 질문을 함께 처리하여 응답을 생성합니다. 이때 컨텍스트 윈도우 크기가 처리 가능한 토큰 수를 제한하므로, 효율적인 청킹 전략이 중요합니다.