CEFR 영단어 추출 프롬프트

by 달의 언어 2023. 5. 25. 00:58



저는 최근에 프롬프트 파인튜닝이라는 작은 소책자를 크몽을 통해서 판매하였습니다. 거의 팔리지는 않았지만 몇몇 분들은 저에게 프롬프트를 만드는 방법에 대해 제대로 알게 되었다고 말씀해 주시는 분도 계셨습니다. 메타프롬프트를 이용해서 프롬프트를 파인튜닝하는 과정을 따라가기 쉽지 않다는 점을 알면서도 굳이 책을 썼던 이유 중에 하나는, 그 과정에서 제 생각이 구체화되고 더 발전할 것이라는 기대 때문이었습니다. 

미드저니로 만든 로고 후보

다른 사업가들이 예상하지 못한 상황에 대처하는 것과 마찬가지로 영어를 지도하는 학원 강사로서 예기치 못한 학생들의 요구를 들어줘야 하거나 제한된 시간에 여러 학교 여러 교과서의 문제를 찾아주거나 만들어줘야 하는 상황을 자주 경험합니다. 이럴 때 발빠르게 대처할 수 있는 도구를 미리 마련해 놓을 수 있다면 위기 상황을 잘 대처할 수 있을 것입니다.

독서하는 아이

잘 만들어진 프롬프트도 그런 역할을 할 수 있다고 생각합니다. 잘 만들어진 프롬프트 세트를 미리 마련해 놓고 시험대비 기간을 맞이할 수 있다면, 시험대비 교재를 몇 권 만들어놓은 것만큼 훌륭하게 사전준비를 한 것일 테니까요.

영어학습에서 빼놓을 수 없는 것 중에 하나가 단어학습일 것입니다. 교과서를 비롯한 영어지문을 담고 있는 책은 영어단어를 소개하는 것으로 시작합니다. 어려운 영어단어를 사전학습으로 익힌 후 지문을 읽으면 그 만큼 어려운 단어를 만났을 때 대처하기 용이하기 때문일 것입니다.

영어선생님으로서 가장 많이 ChatGPT에게 의존하는 부분이 단어를 정리하거나 추출하는 일인 것 같습니다. 그 만큼 가장 시행착오를 많이 하는 부분이기도 합니다. 이는 지문을 넣고 단순하게 단어를 추출하라고 하면, 지문의 수준과는 전혀 맞지 않는 단어를 추천해 주는 경우가 너무 많기 때문일 것입니다. 

성의 내부

오랜 고민 끝에 다다른 결론은 ChatGPT에게 단어 목록을 추출하라고 프롬프트를 넣기 전에 반드시 거쳐야할 과정이 있다는 것이고, 그것은 입력한 텍스트를 ChatGPT가 먼저 분석하고 평가해서 수준을 결정하게 하는 과정을 꼭 넣어야 한다는 점이었습니다.

지문을 평가하고 수준을 결정하는 기준을 마련할 필요가 있었습니다. 여러 평가기준이 있겠지만 영어지문을 평가하는 가장 일반적이고 표준적인 기준으로 제가 찾게 된 것은 CEFR이라는 기준이었습니다. 이는 유럽연합 공통언어 표준등급(Common European Framework of Reference)의 약어입니다. A1 ~C2 까지의 등급체계를 가지고 있는 이 표준화된 기준을 프롬프트에 넣어서 실험해 보았습니다. 

아주 정확하게 평가하기 위해서는 여러 항목의 테스트를 거쳐야 하겠지만 프롬프트의 토큰 수가 제약되어 있다는 사실을 염두에 두면, 너무 복잡하지도 않고 너무 단순하지도 않은 CEFR이 프롬프트에 적합하겠다는 생각을 하였습니다. 

제가 만든 프롬프트를 공개하겠습니다. 이 프롬프트도 완벽하지는 않습니다. 사용하실 때 원하는 부분을 수정해서 사용하시길 권합니다. 다만 이렇게 공개하는 이유는 이 프롬프트의 컨셉이 나름 참조할만한 가치가 있을 거라는 생각을 하기 때문입니다. 



CEFR word Generator by reasonofmoon.txt


위 프롬프트를 프롬프트의 구성요소에 따라 분석하면 다음과 같습니다. ChatGPT에게 프롬프트를 분석해달라고 요청한 결과입니다. 

Prompt Analysis
Instruction(지시): 언어 분석가는 CEFR 기준에 따라 텍스트의 한 단락을 분석하여 사용자의 언어 능력을 평가해야 합니다. 또한 예상 레벨에 해당하는 일반적인 단어를 추출하고 그 정의를 제공해야 합니다. 마지막으로 이 피드백을 영어로 제공해야 합니다.

Context(맥락): 언어 평가는 A1(초급)부터 C2(숙달)까지의 유럽 공통 언어 기준 프레임워크(CEFR)를 기반으로 합니다.

Input Data: 프롬프트에는 두 개의 자리 표시자 '[PROMPT]'와 '[TARGETLANGUAGE'가 언급되며, 각각 평가할 실제 텍스트와 텍스트의 언어로 대체해야 합니다.

Format: 출력에는 다음이 포함되어야 합니다:
- 입력 텍스트의 CEFR 수준 추정치
- 예상 레벨에 대한 20개의 일반적인 단어 목록과 해당 단어의 정의
- 길이: 출력에 대한 구체적인 길이는 언급되어 있지 않지만 간결하고 요점을 파악할 수 있어야 한다는 것을 암시합니다.


기본적인 프롬프트의 형식 이외에도 temperatrue, top p 값 등이 고려될 수 있겠지만, 그것은 외부 설정에서 조정해야 하는 것이므로 제작한 프롬프트에는 적용하지 않았습니다. 

저는 AIPRM for ChatGPT 확장 프로그램을 사용하고 있기 때문에 AIPRM에서 요구하는 프롬프트의 양식에 맞춰서 프롬프트를 제작하였습니다. AIPRM을 쓰지 않는 경우에는 제가 공유한 프롬프트를 먼저 넣고 이어서 텍스트를 넣어서 사용하셔야 합니다. 

이제부터 프롬프트를 사용하는 과정과 결과값을 보여드리도록 하겠습니다. 

직접 제작한 AIPRM OWN prompts

제작한 프롬프트를 템플릿으로 만들어 놓았습니다. 

제목은 CEFR vocab list 라고 간단하게 달았습니다. 


프롬프트를 공개한 상태가 아니므로 나머지 항목들도 필수적인 것만 몇개 적어넣었습니다. 


프롬프트 입력창 상단에 CEFR vocab list 라고 적용되는 것이 보이실 겁니다. 


올해 고3 수능특강 교재에서 무작위로 한 지문을 드레그해서 복사 붙여넣기를 하겠습니다. 


몇몇 단어들이 깨어지거나 이상한 문자가 들어가도 굳이 수정하지 않아도 될 만큼 ChatGPT의 실력은 대단합니다. 

ChatGPT가 제출한 결과입니다. 

Based on the provided text, it seems that the user's proficiency level in English is around C1. This level is characterized by the ability to use a wide range of vocabulary and more complex sentence structures, as well as the ability to understand and use idiomatic expressions and phrases.

In the given text, the user displays an advanced level of English proficiency, using varied and sophisticated sentence structures, a high-level vocabulary, and demonstrating an understanding of complex ideas. The text also reveals an adept use of cohesive devices and logical connectors, and it accurately reflects the kind of abstract, nuanced thinking expected at this level.

Here are 20 typical words and phrases that are representative of this C1 level, along with their definitions:

Unnecessary: Not needed.
Extreme: Reaching a high or the highest degree; very severe.
Irrational: Not logical or reasonable.
Unpleasant: Causing discomfort, unhappiness, or revulsion; disagreeable.
Tragic: Causing or characterized by extreme distress or sorrow.
Distressing: Causing anxiety, sorrow or pain; upsetting.
Accurately: In a way that is correct in all details; exactly.
Function: An activity or purpose natural to or intended for a person or thing.
Incorporate: Take in or contain (something) as part of a whole; include.
Unrealistically: In a way that is not compatible with reality or the facts.
Distorted: Pulled or twisted out of shape; contorted.
Dysfunctional: Not operating normally or properly.
Self-defeating: Preventing rather than achieving one's goals.
Perception: The ability to see, hear, or become aware of something through the senses.
Emotions: A strong feeling deriving from one's circumstances, mood, or relationships with others.
Beliefs: An acceptance that something exists or is true, especially one without proof.
Experience: Practical contact with and observation of facts or events.
Negative: Consisting in or characterized by the absence rather than the presence of distinguishing features.
Quality: The standard of something as measured against other things of a similar kind; the degree of excellence of something.
Situation: A set of circumstances in which one finds oneself; a state of affairs.
The user should continue to focus on using a wide range of vocabulary, complex sentences, and cohesive devices, and continue practicing expressing nuanced and abstract ideas.

몇 줄만 번역을 해 보도록 하겠습니다. (DeepL의 도움을 얻었습니다)

제공된 텍스트에 따르면 사용자의 영어 실력은 C1 정도인 것으로 보입니다. 이 레벨은 다양한 어휘와 복잡한 문장 구조를 사용할 수 있을 뿐만 아니라 관용적 표현과 구문을 이해하고 사용할 수 있는 능력이 특징입니다.

주어진 텍스트에서 사용자는 다양하고 정교한 문장 구조, 높은 수준의 어휘를 사용하고 복잡한 아이디어에 대한 이해를 보여주는 고급 수준의 영어 실력을 보여줍니다. 또한 응집력 있는 장치와 논리적 연결 고리를 능숙하게 사용하며, 이 수준에서 기대되는 추상적이고 미묘한 사고를 정확하게 반영하고 있습니다.

다음은 C1 레벨을 대표하는 20개의 대표적인 단어와 구문, 그리고 그 정의입니다:

Unnecessary: Not needed.
Extreme: Reaching a high or the highest degree; very severe.
Irrational: Not logical or reasonable.
Unpleasant: Causing discomfort, unhappiness, or revulsion; disagreeable.
Tragic: Causing or characterized by extreme distress or sorrow.
Distressing: Causing anxiety, sorrow or pain; upsetting.
Accurately: In a way that is correct in all details; exactly.
Function: An activity or purpose natural to or intended for a person or thing.
Incorporate: Take in or contain (something) as part of a whole; include.
Unrealistically: In a way that is not compatible with reality or the facts.
Distorted: Pulled or twisted out of shape; contorted.
Dysfunctional: Not operating normally or properly.
Self-defeating: Preventing rather than achieving one's goals.
Perception: The ability to see, hear, or become aware of something through the senses.
Emotions: A strong feeling deriving from one's circumstances, mood, or relationships with others.
Beliefs: An acceptance that something exists or is true, especially one without proof.
Experience: Practical contact with and observation of facts or events.
Negative: Consisting in or characterized by the absence rather than the presence of distinguishing features.
Quality: The standard of something as measured against other things of a similar kind; the degree of excellence of something.
Situation: A set of circumstances in which one finds oneself; a state of affairs.

The user should continue to focus on using a wide range of vocabulary, complex sentences, and cohesive devices, and continue practicing expressing nuanced and abstract ideas.

단어를 깔끔하게 표로 얻고 싶으시다면 제가 공유드린 프롬프트 아래 쪽에 다음과 같이 프롬프트를 추가하세요. 

please provide me with 20 words in the table format 

그러면 이렇게 표로 나옵니다. 이 표를 그냥 복붙하시면 표 양식 대로 단어 목록을 얻을수 없습니다. csv 이나 markdown 양식으로 요청하는 방법도 있지만 저는 개인적으로 Excel에 옮겨서 표를 편집하고 MS Word 에 붙여서 사용합니다. 

ChatGPT의 표를 드래그해서 Ctr + C 하신 후에 엑셀을 열어서 셀을 여러개 선택하신 후에 Ctr + V 하면 표 양식을 그대로 사용하실 수 있습니다. 

범위를 어느정도 선택한 후 붙여넣기



엑셀에서 편집한다

#CEFR (Common European Framework of Reference)

