Post

AI Agent 완벽 가이드 2: Agent 성숙도 7단계

AI Agent 완벽 가이드 2: Agent 성숙도 7단계

AI Agent는 한 번에 복잡해지는 것이 아니다. 단순 LLM 호출에서 시작해 도구 사용, 순차 실행, 분기, 반복, 계획, 멀티 에이전트 구조로 점점 자율성과 운영 난도가 올라간다.

레벨이름핵심 차이
L0Simple LLM Call도구와 기억 없이 한 번 응답
L1Augmented LLM외부 도구를 한 번 호출
L2Chained / Sequential Agent정해진 단계대로 여러 작업 실행
L3Router / Branching Agent입력에 따라 경로 선택
L4ReAct / Loop Agent관찰 결과를 보고 반복 실행
L5Planning Agent장기 목표를 계획하고 재계획
L6Multi-Agent System역할이 나뉜 여러 에이전트가 협업

Simple LLM Call

No Tools

No Memory

Single Turn

자율성

가장 기본적인 형태입니다. 프롬프트를 넣으면 응답이 나오는 단순 호출로, LLM의 학습된 지식만으로 답변합니다. 외부 도구 접근이 없어 할루시네이션 리스크가 가장 높습니다.

U

User

Prompt

L

LLM

Response

R

Output

사용 예시

  • “이메일 초안 써줘”

  • “이 코드 리뷰해줘”

  • “마케팅 카피 만들어줘”

한계

  • 최신 정보 접근 불가

  • 사내 데이터 참조 불가

  • 정보를 지어낼 수 있음

관련 기술

  • Chain-of-Thought (Wei et al., 2022)

  • Zero-shot / Few-shot Prompting

  • 기본 ChatGPT / Claude 호출

L1

Augmented LLM (Tool Use)

Function Calling

RAG

Single Cycle

자율성

LLM이 필요할 때 외부 도구를 한 번 호출할 수 있습니다. 도구를 쓸지 말지를 LLM이 판단하고, 결과를 받아 최종 응답을 생성합니다. 하지만 한 번의 사이클로 끝나며, 결과가 부족해도 재시도하지 않습니다.

U

User

Query

L

LLM

Tool Call

API / DB / Search

Response

R

Output

도구 유형

  • 검색: RAG, 웹 검색

  • API: 날씨, 주가, DB 쿼리

  • 실행: 코드 인터프리터, 계산기

사용 예시

  • “오늘 서울 날씨 알려줘” → weather API

  • “Q3 매출 데이터 찾아줘” → DB 쿼리

  • Naive RAG: 벡터 검색 → 답변 생성

관련 기술

  • Toolformer (Schick et al., 2023)

  • MRKL Systems (Karpas et al., 2022)

  • Function Calling / Structured Output

L2

Chained / Sequential Agent

Pipeline

Deterministic

Multi-Step

자율성

여러 단계를 미리 정의된 순서대로 실행합니다. 앞 단계의 출력이 뒷 단계의 입력이 됩니다. Gate(검증 단계)를 넣어 품질을 체크할 수 있지만, 전체 흐름은 코드로 고정되어 있습니다.

1

분석

2

처리

G

검증

3

출력

문서 번역 파이프라인

문맥 분석

초벌 번역

용어 검증

최종 다듬기

코드 생성 파이프라인

요구사항

코드 생성

린트/테스트

리뷰/수정

특징

  • 실행 순서가 코드로 고정 (deterministic)

  • 각 단계에서 LLM이 동작하지만 전체 흐름은 LLM이 결정하지 않음

  • Latency = 각 단계의 합산

한계

  • 분기(branching)가 없음

  • 간단한 요청도 전체 파이프라인 통과 필요

  • 한 단계 실패 시 전체 중단

L3

Router / Branching Agent

Dynamic Routing

Classifier

Parallel

자율성

입력을 분석해서 적절한 경로로 분기합니다. LLM이 분류기(classifier) 역할을 수행하며, 각 브랜치는 독립적인 워크플로우입니다. 리소스 효율적이고 병렬 실행도 가능합니다.

U

Input

R

Router

Simple

직접 답변

Data

검색 파이프라인

Code

코드 생성

고객 지원 시스템

고객 메시지

“환불 요청” → 환불 처리 워크플로우

“기술 문의” → 기술 지원 워크플로우

“일반 문의” → FAQ 기반 응답

L4

ReAct / Loop Agent

True Agent

Self-Correction

Autonomous Loop

자율성

여기서부터 진정한 Agent입니다

LLM이 루프를 돌면서 스스로 판단하고, 도구를 선택하고, 결과를 평가하고, 필요하면 다시 시도합니다. ReAct(Reasoning + Acting) 패턴이 핵심이며, 종료 조건도 LLM이 판단합니다.

반복

T

Thought

상황 분석 & 판단

A

Action

도구 선택 & 실행

O

Observe

결과 확인 & 평가

!

Answer

ReAct 실행 예시: 리서치 에이전트

Thought

사용자가 2024년 한국 GDP를 묻고 있다. 최신 데이터니까 검색이 필요하다.

Action

web_search(“2024 한국 GDP”)

Observe

검색 결과가 2023년 데이터뿐이다. 더 최신 쿼리가 필요.

Thought

쿼리를 변경해서 재검색하자.

Action

web_search(“South Korea GDP 2024 IMF estimate”)

Observe

IMF 기준 1.7조 달러라는 결과 확인. 신뢰할 만한 출처.

Answer

2024년 한국 GDP는 IMF 추정 기준 약 1.7조 달러입니다…

핵심 특징

  • LLM이 실행 흐름을 제어

  • 자기 수정(self-correction) 가능

  • 종료 조건을 LLM이 판단

  • max_iterations 설정 필수

관련 논문

  • ReAct (Yao et al., 2022) - ICLR 2023

  • Reflexion (Shinn et al., 2023)

  • Tree of Thoughts (Yao et al., 2023)

L5

Planning Agent

Task Decomposition

Adaptive Replanning

Reflection

자율성

실행 전에 먼저 전체 계획을 세우고, 계획에 따라 단계별로 실행하며, 상황에 따라 계획을 동적으로 수정합니다. 장기 목표(long-horizon task) 처리가 가능합니다.

P

Plan

작업 분해

Task 1

Task 2

Task 3

Task 4

E

Execute

단계별 ReAct 실행

R

Reflect

결과 평가 & 계획 수정

Re-plan

“경쟁사 분석 보고서 만들어줘”

  1. 경쟁사 리스트 확정

  1. 재무 데이터 수집

회사 B 데이터 못 찾음

2’. Re-plan: 대안 소스에서 재검색

2’. 대안 소스에서 수집 완료

  1. SWOT 분석

  1. 보고서 작성

L6

Multi-Agent System

Collaboration

Specialization

Distributed

자율성

여러 에이전트가 각자의 역할, 도구, 프롬프트를 가지고 협업합니다. Orchestrator가 작업을 분배하고 결과를 통합하며, 각 에이전트가 독립된 컨텍스트를 가져 컨텍스트 윈도우 한계를 완화합니다.

O

Orchestrator

R

Researcher

Search, Fetch

C

Coder

IDE, Terminal

Q

Reviewer

Lint, Test

W

Writer

Docs, Format

Orchestrator-Worker

중앙 관리자가 작업을 분배하고 결과를 통합. 가장 일반적인 패턴.

Claude Code의 sub-agents

Evaluator-Optimizer

Generator가 생성, Evaluator가 평가 후 피드백. 반복적 개선.

코드 리뷰 자동화

Debate / Adversarial

Agent A가 주장, Agent B가 반론. Moderator가 최종 판정.

의사결정 지원 시스템

단계별 비교 요약

레벨자율성도구 사용흐름 결정대표 기술
L0없음없음코드ChatGPT 기본 호출
L1낮음단일 턴코드RAG, Function Calling
L2낮음순차코드LangChain Chains
L3중간분기코드+LLMSemantic Router
L4높음루프LLMReAct, Claude Tool Use
L5높음계획+루프LLMPlan-and-Execute, ADK
L6매우 높음분산다수 LLMCrewAI, AutoGen

추가 정리

핵심 요약

성숙도 7단계는 에이전트를 한 번에 복잡하게 만들지 않기 위한 기준이다. Simple LLM Call에서 시작해 Tool Use, Routing, ReAct, Planning, Multi-Agent로 올라갈수록 자율성은 커지지만 비용과 실패 가능성도 함께 커진다.

보충 해설

각 단계의 핵심 질문은 “이 단계의 복잡도가 실제 문제를 해결하는가”다. 도구 호출이 필요 없는데 Tool Use를 넣거나, 고정 절차로 충분한데 Planning Agent를 쓰면 디버깅 지점만 늘어난다. 성숙도는 목표가 아니라 선택 기준이다.

This post is licensed under CC BY 4.0 by the author.