ReAct Prompting
ReAct prompting은 언어 모델에 추론과 행동을 결합하는 기법입니다. ReAct prompting은 인간이 작성한 텍스트 추론 흔적과 행동, 그리고 행동에 대한 환경 관찰로 이루어진 몇 개의 샷으로 된 작업 해결 경로로 구성됩니다ReAct 프롬프트는 직관적이고 유연하게 설계할 수 있으며, 질문 답변부터 온라인 쇼핑에 이르기까지 다양한 작업에서 최첨단 few-shot 성능을 달성합니다.
ReAct Prompting의 구체적인 방법은 다음과 같습니다:
예를 들어, 모델에게 다음과 같은 입력을 줄 수 있습니다. 모델은 이제 자신만의 작업 해결 경로를 생성해야 합니다.
작업: 미국에서 가장 인구가 많은 도시 5개를 찾아라.
환경: 구글 검색 엔진.
작업 해결 경로 예시:
추론: 미국에서 가장 인구가 많은 도시 5개를 찾으려면 미국 인구 순위를 검색해야 한다.
행동: "미국 인구 순위"라고 구글 검색창에 입력한다.
환경 관찰: 구글 검색 결과 페이지가 나타난다. 첫 번째 결과는 위키백과의 "미국의 도시 순위" 문서이다.
추론: 위키백과 문서는 믿을 수 있는 출처이므로 클릭해서 들어가면 된다.
행동: 위키백과 문서 링크를 클릭한다.
환경 관찰: 위키백과 문서 페이지가 나타난다. 문서에는 미국의 도시들이 인구 순으로 나열되어 있다.
추론: 문서에서 상위 5개의 도시 이름을 읽으면 된다.
행동: 문서에서 상위 5개의 도시 이름을 읽는다.
환경 관찰: 상위 5개의 도시 이름은 뉴욕 시, 로스앤젤레스 시, 시카고 시, 휴스턴 시, 필라델피아 시이다.
추론: 작업이 완료되었다. 결과를 출력하면 된다.
행동: "미국에서 가장 인구가 많은 도시 5개는 다음과 같습니다."라고 출력하고 상위 5개의 도시 이름을 출력한다.
환경 관찰: 없음.
새로운 작업:
작업: 한국에서 가장 면적이 넓은 광역자치단체 3개를 찾아라.
환경: 구글 검색 엔진.
작업 해결 경로:
ReAct prompting의 장점은 모델이 다양한 작업에 대해서 유연하게 학습할 수 있고, 인간의 추론 과정을 따라가며 자신의 행동을 설명할 수 있습니다. 모델이 환경과 상호작용하면서 새로운 지식을 습득할 수 있습니다. 반면, 인간의 텍스트 추론 흔적과 행동을 정확하게 이해하고 반영하기 어려울 수 있고, 환경 관찰에 따라 예측의 정확도가 달라질 수 있습니다. 작업 해결 경로를 생성하거나 수정하기도 어렵습니다.
댓글 영역