AI Agent 정리 (1) — AI 에이전트 개념, 구조, 플랫폼 생태계
최근 LLM 기반 서비스가 발전하면서 단순한 챗봇을 넘어 스스로 판단하고 도구를 사용하며 작업을 수행하는 AI Agent 구조가 등장했다.
위키독스의 AI 에이전트 개발 문서를 정독하면서 AI 에이전트 개념 구조와 플랫폼 생태계까지의 내용을 정리해본다.
1. 왜 AI Agent가 등장했는가
초기 LLM 사용 방식은 매우 단순했다.
1
User → Prompt → LLM → Answer
이 방식의 한계
- 외부 데이터 사용 불가
- 상태 유지 어려움
- 복잡한 작업 수행 불가
- API 호출 불가
- 자동화 불가
즉
LLM은 답변은 잘하지만 일을 못 한다. (머리는 있지만 수행할 팔과 다리가 없음.)
이 문제를 해결하기 위해 등장한 것이
1
AI Agent
이다.
2. AI Agent란 무엇인가
AI Agent는 단순히 텍스트를 생성하는 모델이 아니라
목표를 가지고 판단하고 도구를 사용하고 작업을 수행하는 시스템
이다.
기본 구조
1
2
3
4
5
6
7
User
→ Agent
→ LLM
→ Tool
→ Memory
→ Planner
→ Result
핵심 특징
- Tool 사용 가능
- 상태 유지 가능
- 목표 기반 동작
- 반복 실행 가능
- 자동 의사결정 가능
즉
1
2
LLM = 뇌
Agent = 시스템
3. LLM과 Agent의 차이
| 구분 | LLM | Agent |
|---|---|---|
| 역할 | 텍스트 생성 | 작업 수행 |
| 상태 유지 | 없음 | 있음 |
| 도구 사용 | 불가 | 가능 |
| 자동화 | 불가 | 가능 |
| 반복 실행 | 불가 | 가능 |
Agent는 LLM을 포함하는 상위 개념이다.
4. Agent의 기본 동작 구조
Agent는 보통 다음 루프를 가진다.
1
think → act → observe → think
예시
- 사용자 질문 입력
- LLM이 행동 결정
- Tool 호출
- 결과 확인
- 다시 판단
- 결과 생성
이 구조를
1
Agent Loop
라고 한다.
5. Agent를 구성하는 핵심 요소
1) LLM
- 판단
- 계획
- 응답 생성
2) Tool
- API 호출
- DB 조회
- 검색
- 코드 실행
3) Memory
- 대화 기록
- 사용자 정보
- 이전 결과
4) Planner
- 작업 순서 결정
- 여러 단계 작업 수행
5) Executor
- 실제 행동 수행
구조
1
Planner → Tool → Memory → LLM → Result
6. Structured Output의 중요성
Agent에서는 자연어만 사용하면 안 된다.
예
1
검색해줘
이 아니라
1
2
3
4
{
"action": "search",
"query": "AI news"
}
처럼 구조화해야 한다.
이유
- 코드에서 처리 가능
- Tool 호출 가능
- 자동화 가능
- Multi Agent 가능
즉
1
Agent = 자연어 → 구조 → 행동
7. Agent에서 Tool이 중요한 이유
Agent는 Tool 없으면 의미가 없다.
가능한 Tool
- 검색 API
- DB 조회
- 이메일 전송
- 파일 생성
- 코드 실행
- 외부 서비스 호출
구조
1
LLM → Tool 선택 → Tool 실행 → 결과 → LLM
이 패턴을
1
Tool Calling
이라고 한다.
8. Memory가 필요한 이유
LLM은 상태가 없다.
문제
- 이전 대화 기억 못함
- 사용자 정보 없음
- 긴 작업 불가능
그래서 Memory가 필요하다.
종류
- Conversation memory
- Vector DB
- RDB
- Cache
Memory가 있어야
1
Agent = 상태 기반 시스템
9. Agent 구조 패턴
대표 패턴
ReAct
1
Reason → Act → Observe
Plan & Execute
1
Plan → Execute → Result
Tool Calling
1
LLM → Tool → LLM
Function Calling
1
LLM → JSON → Function → Result
10. Single Agent의 한계
Single Agent 구조
1
User → Agent → Tool → Result
문제
- 복잡한 작업 어려움
- 역할 분리 불가
- 유지보수 어려움
- 확장 어려움
그래서 등장한 구조
1
Multi Agent
11. Multi Agent 구조
여러 Agent가 역할을 나눔
1
2
3
4
5
Orchestrator
├ Research Agent
├ Tool Agent
├ Writer Agent
├ Reviewer Agent
장점
- 역할 분리
- 확장 가능
- 병렬 처리 가능
- 복잡한 작업 가능
실제 서비스는 대부분 Multi Agent로 간다.
12. AI Agent 플랫폼 생태계
Agent는 코드 한 파일이 아니다.
실제 구조
1
2
3
4
5
6
7
8
API Server
Agent Service
Tool Service
Vector DB
RDB
Queue
Batch
LLM API
즉
1
Agent = 플랫폼
13. 마무리
이번 글에서는 LLM과 AI Agent의 차이점과 AI Agent의 기본적인 구조에 대해 정리했다.
개념을 글로만 이해하는 것에는 한계가 있기 때문에, 직접 코드를 작성하면서 동작 흐름을 확인해보는 과정이 필요하다고 느꼈다.
마지막 정리로 Open LLM 실행 환경을 구성하고, 간단한 예제를 구현하면서 AI Agent의 구조를 익혀보려고 한다.