GPT-3: Language Models are Few-Shot Learners

Posted Jan 21, 2026 Updated Jun 18, 2026

By figure.2

1 min read

GPT-3: Language Models are Few-Shot Learners

GPT-3: Language Models are Few-Shot Learners

논문 요약 OpenAI의 GPT-3 논문. 175B 파라미터 모델이 Few-shot 프롬프팅만으로 다양한 NLP 태스크에서 SOTA에 근접하는 성능을 달성.

핵심 아이디어

Few-Shot Learning: 소수의 예시만으로 새로운 태스크 수행
In-Context Learning: 파인튜닝 없이 프롬프트 내 예시로 학습
Scaling: 175B 파라미터로 확장 시 emergent abilities 발현
3가지 모드: Zero-shot, One-shot, Few-shot 비교

프롬프팅 모드 비교

주요 발견

모델 크기에 따른 성능 향상이 Few-shot에서 가장 두드러짐
프롬프트 엔지니어링의 효과 입증
대규모 언어 모델의 범용성 확인

관련 개념

Prompt-Engineering - Few-shot 프롬프팅의 이론적 근거
GPT-2-논문 - GPT-3의 선행 연구
RAG - 외부 지식 통합으로 모델 한계 보완

1.TIL, 1-2.UPSTAGE_AI_AGENT, 1-2-11.RESOURCES, REFERENCE_NOTE

upstage sesac ai-agent prompt-engineering reference-note resources

This post is licensed under CC BY 4.0 by the author.