반응형
BrainAgent: AI가 0.01초 만에 질문을 분석하는 교통경찰
💡 BrainAgent는 질문이 들어오면 "검색이 필요한가? Jira를 봐야 하나? 바로 답해도 되나?"를 0.01초 만에 판단하는 AI 라우터입니다.
문제 상황
AI에게 "안녕"이라고 인사했는데 무거운 검색 엔진이 돌아가면 시간 낭비입니다. 반대로 "지난주 뭐 했지?"라고 물었는데 검색 없이 "모르겠어요"라고 하면 답답하죠.
더 큰 문제:
- 단순 인사에도 LLM 호출 → 비용 낭비
- 복잡한 질문인데 도구 선택 못 함 → 엉뚱한 답변
- 어떤 파이프라인을 써야 할지 매번 수동 지시 → 불편
해결책: BrainAgent
BrainAgent = 질문 분석 + 경로 결정 (판단만, 실행 안 함)
질문이 들어오면 BrainAgent가 먼저 분석하고, 어디로 보낼지 결정합니다. 실행은 MasterAgent가 담당합니다.
동작 방식: 2단계 라우팅
1단계: 규칙 기반 (80%)
패턴 매칭으로 LLM 호출 없이 즉시 결정합니다.
┌─ 규칙 기반 라우팅 ──────────────────────┐
│ │
│ 질문: "PK-1234 봐줘" │
│ ↓ │
│ [패턴 매칭] "PK-숫자" 감지 │
│ ↓ │
│ 결과: jira 파이프라인 │
│ │
│ 비용: $0, 시간: 10ms 미만 │
│ │
└─────────────────────────────────────┘
패턴 결정
| "안녕", "ㅎㅎ" | direct (바로 응답) |
| "PK-123 봐줘" | jira 파이프라인 |
| "@planning 읽어" | notion 파이프라인 |
2단계: LLM 기반 (20%)
규칙으로 판단 어려우면 Gemini Flash를 호출합니다.
┌─ LLM 기반 라우팅 ───────────────────┐
│ │
│ 질문: "지난주 작업 중 코드 관련된 것" │
│ ↓ │
│ [Gemini Flash 호출] │
│ ↓ │
│ 결과: rag + jira 파이프라인 │
│ │
│ 비용: Flash 1회, 시간: ~500ms │
│ │
└──────────────────────────────────┘
5가지 exec_type
BrainAgent가 결정하는 실행 타입입니다.
exec_type 언제? 예시
| direct | 일반 대화 | "안녕", "고마워" |
| tool | 명시적 명령 | "jira get PK-123" |
| master | 검색 필요 | "저번에 뭐했지?" |
| worker | 전문가 필요 | "로그인 기획해줘" |
| speckit | 기획→구현 | "speckit 시작" |
실제 출력 예시
📊 [08:14·670db96] | claude/opus | work | 📚rag
┌─ 라우팅 분석 ────────────────────┐
│ 실행 타입 : master │
│ 파이프라인 : rag │
│ 신뢰도 : 92% │
│ 이유 : 과거 대화 검색 필요 │
└───────────────────────────────┘
핵심 포인트
- 80% 질문은 규칙으로 즉시 라우팅 (비용 $0)
- BrainAgent는 판단만, MasterAgent가 실행
- 신뢰도 낮으면 사용자에게 재질문
💡 "이거 Jira에서 찾아", "RAG로 검색해" 안 해도 됩니다. BrainAgent가 알아서 판단합니다.
반응형
'AI > Ai Agent' 카테고리의 다른 글
| Self-Reflection: AI가 스스로 실수를 잡아내는 시스템 (0) | 2026.01.08 |
|---|---|
| MasterAgent: AI가 파이프라인을 실행하는 방법 (0) | 2026.01.08 |
| Hook: AI가 알아서 다 해주는 마법의 비밀 (0) | 2026.01.07 |
| Setup 시스템: 새 컴퓨터에서 5분 안에 AI 환경 완성하기 (0) | 2026.01.07 |
| AI Agent, 왜 지금 배워야 할까? (0) | 2026.01.07 |