Prompt Engineering Guide의 Multimodal CoT Prompting 페이지

열공노년 2025. 4. 18. 23:35

Prompt Engineering Guide의 Multimodal CoT Prompting 페이지입니다. 주요 내용은 멀티모달 체인 오브 사고(Multimodal Chain-of-Thought, Multimodal CoT) 기법에 대한 설명입니다.

개념	설명
CoT (Chain-of-Thought)	복잡한 문제를 해결하기 위해 중간 추론 과정을 생성하는 프롬프트 기법
멀티모달 (Multimodal)	텍스트 외에도 이미지, 오디오 등 다양한 형태의 입력을 사용하는 모델
Rationale	모델이 답을 도출하기 위해 생성한 중간 설명 또는 추론 근거

항목	설명
주제	Multimodal CoT Prompting
목적	언어와 비언어(예: 이미지) 정보를 함께 사용하여 추론 품질 향상
구성 단계	① 근거 생성 → ② 답변 추론
효과	ScienceQA 등에서 기존 언어모델 대비 우수한 성능 발휘