바로 보는 구조
<documents>
<document index="1">
<source>policy.md</source>
<document_content>...</document_content>
</document>
</documents>
<task>
Compare the documents and cite relevant passages first.
</task>긴 입력 배치
긴 자료는 프롬프트 위쪽에 둔다
긴 문서나 데이터가 2만 token 이상으로 커질 때는 자료를 먼저 배치하고, 질문과 지시는 아래쪽에 두는 편이 좋습니다. Claude는 긴 입력 안에서 필요한 정보를 찾을 수 있지만, 자료·질문·예시가 뒤섞이면 어느 부분을 근거로 삼아야 하는지 흐려질 수 있습니다.
1. 긴 문서와 데이터
2. 문서별 metadata
3. 작업 지시
4. 출력 형식질문을 맨 아래에 두면 "위 자료 전체를 읽고 이 작업을 하라"는 구조가 더 선명해집니다.
여러 문서는 source와 content를 분리한다
여러 문서를 한 번에 넣을 때는 각 문서를 tag로 감싸고, 출처와 본문을 분리해야 합니다. 파일명, 날짜, 작성자, 버전 같은 metadata가 문서 본문과 섞이면 Claude가 실제 내용과 관리 정보를 혼동할 수 있습니다.
<document index="2">
<source>pricing-policy-2026.md</source>
<date>2026-05-23</date>
<document_content>
...
</document_content>
</document>이 구조는 나중에 "어느 문서에서 나온 판단인가"를 추적할 때도 유리합니다.
긴 문서 작업은 먼저 근거를 뽑게 한다
요약이나 비교를 바로 요구하면 긴 문서의 일부를 놓칠 수 있습니다. 정책 검토, 계약서 비교, 리서치 요약처럼 근거가 중요한 작업에서는 먼저 관련 구절을 찾고, 그 다음 분석을 하도록 나누는 편이 안전합니다.
Step 1. 관련 구절을 source와 함께 추출
Step 2. 추출한 구절만 근거로 요약
Step 3. 불확실한 항목을 별도로 표시이 흐름은 결과가 틀렸을 때 어느 근거가 빠졌는지 확인하기 쉽습니다.
선택 기준
| 상황 | 처리 방식 |
|---|---|
| 긴 문서 1개 분석 | 문서를 먼저, 질문을 마지막에 배치 |
| 여러 문서 비교 | <document> 단위로 source 분리 |
| 근거가 중요한 요약 | 관련 구절 추출 후 분석 |
| 자료가 너무 많음 | 작업과 관련 없는 문서 제거 |
| 서로 충돌하는 문서 | 버전과 날짜 metadata 명시 |
| 출력이 근거 없이 일반화됨 | citation 또는 quote 기반 단계 추가 |
주의할 점
긴 컨텍스트는 자료를 많이 넣는 기능이 아니라, 필요한 자료를 구조적으로 넣는 방식입니다. 관련 없는 문서가 많으면 핵심 근거가 묻히고, 질문이 위쪽에 흩어져 있으면 최종 작업 기준이 약해집니다.
문서가 길수록 "모두 고려해줘" 같은 요청은 약합니다. 어떤 질문에 답해야 하는지, 어떤 문서를 더 신뢰해야 하는지, 결과에 source를 어떻게 표시할지까지 정해야 긴 컨텍스트의 장점이 살아납니다.
참고 링크
1 sources