상세 컨텐츠

본문 제목

제로샷, 원샷, 퓨샷 프롬프트

프롬프트 공학

by 달의 언어 2023. 4. 2. 08:50

본문

Midjourney, prompt: kids reading books

 

Zero-shot prompting

Zero-shot prompting은 추가적인 학습 없이 새로운 데이터에 대한 예측을 할 수 있게 하는 기법입니다. 이는 전통적인 머신러닝 기법과 달리 많은 양의 라벨링된 학습 데이터가 필요하지 않습니다. 구체적인 설계방법은 다음과 같습니다:

  • 목표하는 작업에 대한 자연어 질문을 만듭니다. 예를 들어, "이 문장의 감정은 무엇입니까?"
  • 모델에게 질문과 함께 입력 데이터를 제공합니다. 예를 들어, "이 문장의 감정은 무엇입니까? I’m so happy today."
  • 모델이 질문에 대한 답변을 생성하도록 합니다. 예를 들어, "happy"

Zero-shot prompting은 GPT-3, GPT-4나 ChatGPT와 같은 큰 언어 모델에서 잘 작동합니다. 복잡한 다단계 추론을 요구하는 작업에서는 chain of thought (CoT) prompting이라는 기법을 사용할 수 있습니다. 이 기법은 모델이 중간 단계의 결과물을 생성하고 이를 다음 단계의 입력으로 사용하도록 하는 것입니다.

분야 프롬프트 설계 예
언어 모델링 "다음 문장을 완성하세요: '나는 오늘 ___을 먹었다.'"
이미지 분류 "이미지를 분류하세요: 노란색 바나나"
자연어 처리 "빈칸을 채워주세요: '시작은 ___이지만, 끝은 모르겠어요.'"
대화 시스템 "사용자가 '피자 주문하고 싶어'라고 말하면, 어떤 종류의 피자를 주문하고 싶어하는지 물어보세요."
추천 시스템 "이 사용자는 어떤 종류의 영화를 선호하나요?"
정보 검색 "이 키워드에 대한 정보를 찾아보세요: 'AI 윤리'"
감정 분석 "이 문장은 긍정적인지 부정적인지 판별하세요: '오늘 날씨가 정말 좋다.'"
개체명 인식 "이 문장에서 인물과 장소를 찾아보세요: '제가 지난주에 가봤던 마을은 정말 아름답습니다.'"

Zero-shot prompting은 모델이 추가적인 학습 없이도 이전에 보지 못한 데이터에 대해 예측을 할 수 있게 하는 기법입니다. 이는 전통적인 머신러닝 기법과 대조적으로, 정확한 예측을 하기 위해 많은 양의 라벨링된 학습 데이터를 필요로 하는 것과 다릅니다.

Zero-shot prompting의 장점은 모델이 어떤 새로운 문제나 도메인에도 적응할 수 있고, 예시나 템플릿과 같은 추가적인 정보나 학습을 필요로 하지 않습니다. 또한 복잡한 다단계 추론을 할 수 있습니다. 반면에 모델이 예측의 정확도가 낮거나 불안정할 수 있고, 입력 데이터의 형식이나 구조에 따라 성능이 달라질 수 있습니다. 상식적인 추론을 하지 못할 수 있습니다.

One-shot prompting

One-shot prompting이란 한정된 양의 입력 데이터(예를 들어 하나의 예시나 템플릿)를 사용하여 자연어 텍스트를 생성하는 기법입니다.

 Q: What is a chatbot?
 A: A chatbot is a computer program that can simulate a conversation with a human user.

이 텍스트는 Q와 A의 형식으로 되어 있으므로, 이와 비슷한 형식의 질문과 답변을 생성할 수 있습니다. 예를 들어,

  • Q: What is a neural network?
    A: A neural network is a computational model that can learn from data and perform various tasks.

One-shot prompting은 대화 관리나 문맥 모델링과 같은 다른 자연어 처리 기법과 결합하여 더 복잡하고 효과적인 텍스트 생성 시스템을 만들 수 있습니다

예를 들어,

A list of actors in the movie Star Wars 1.

이 텍스트는 영화의 배우들을 나열하는 방법을 보여줍니다. 이와 비슷한 방법으로 다른 영화의 배우들을 나열할 수 있습니다. 예를 들어,

A list of actors in the movie Titanic.

이렇게 하면 GPT-3와 같은 대형 언어 모델은 다음과 같이 텍스트를 생성할 수 있습니다:

  A list of actors in the movie Titanic.
      Leonardo DiCaprio
      Kate Winslet
      Billy Zane
      Kathy Bates
      Frances Fisher

Few-shot prompting

Few-shot prompting은 모델에 작은 수의 예시를 제공하는 기법입니다. 보통 2개에서 5개 사이의 예시를 사용합니다. Few-shot prompting은 새로운 예시에 빠르게 적응할 수 있도록 합니다. 입력 데이터가 적은 자연어 텍스트 생성 작업에 유용하게 사용할 수 있습니다. Few-shot prompting은 zero-shot과 one-shot prompting을 특별한 경우로 포함합니다. 0-shot prompting은 추가적인 학습 데이터나 예시 없이 텍스트를 생성하도록 하는 것이고, 1-shot prompting은 한 가지 예시나 템플릿을 사용하는 것입니다.

예를 들어, 다음과 같은 텍스트가 있습니다:

Write a summary of a news article in one sentence.
Article: A massive earthquake has struck off the coast of Japan, triggering a tsunami warning for some areas. The quake measured 7.3 on the Richter scale and was felt across much of Honshu island, including Tokyo. There are no reports of major damage or casualties so far.
Summary: Japan hit by powerful earthquake and tsunami alert.

이 텍스트는 뉴스 기사를 한 문장으로 요약하는 방법을 보여줍니다. 이와 비슷한 방법으로 다른 뉴스 기사를 요약할 수 있습니다. 예를 들어,

Write a summary of a news article in one sentence.
Article: The World Health Organization has declared an end to the Ebola outbreak in Guinea, more than five years after it began. The country recorded 16 confirmed cases and seven probable cases during this latest flare-up, which started in February. Eleven people died from Ebola during this period.
Summary: WHO announces end of Ebola outbreak in Guinea.

이렇게 하면 GPT-3와 같은 대형 언어 모델은 다음과 같이 텍스트를 생성할 수 있습니다:

Write a summary of a news article in one sentence.
Article: SpaceX has successfully launched its first all-civilian crew into orbit, marking a new milestone for private spaceflight. The Inspiration4 mission blasted off from Florida on Wednesday night, carrying four people who have no professional astronaut training. They will spend three days circling Earth before splashing down in the Atlantic Ocean.
Summary: SpaceX launches first private crew into orbit.

Few-shot prompting을 사용하면 복잡하고 다양한 작업에 대해 유연하고 정확한 결과를 얻을 수 있습니다

Write a product description for a new coffee maker called ‘SmartBrew’, it has a programmable timer and a built-in grinder.

Product description: SmartBrew is the ultimate coffee maker for busy mornings. It lets you set your brewing time up to 24 hours in advance, so you can wake up to freshly brewed coffee every day. It also has a built-in grinder that grinds your beans just before brewing, ensuring maximum flavor and aroma. SmartBrew is easy to use, easy to clean, and compatible with any type of coffee beans. Whether you prefer strong or mild, black or creamy, SmartBrew will make your coffee exactly how you like it.

Few-shot prompting의 장점은 모델이 추가적인 학습 없이도 새로운 문제나 도메인에 대응할 수 있고, 템플릿이나 라벨 단어와 같은 복잡한 디자인을 필요로 하지 않습니다. 또한 다양한 자연어 표현을 이해하고 생성할 수 있습니다. 하지만, 모델이 일관성 없거나 오류가 있는 텍스트를 생성할 수 있고, 예시와 유사한 텍스트만 생성하고 창의적이지 못할 수 있으며, 예시의 개수나 순서에 따라 성능이 달라질 수 있다는 단점이 있습니다.

관련글 더보기

댓글 영역