AI/Ai Agent

BrainAgent(라우터): AI가 0.01초 만에 질문을 분석하는 교통경찰

코딩하는후운 2026. 1. 8. 09:38
반응형

BrainAgent: AI가 0.01초 만에 질문을 분석하는 교통경찰

💡 BrainAgent는 질문이 들어오면 "검색이 필요한가? Jira를 봐야 하나? 바로 답해도 되나?"를 0.01초 만에 판단하는 AI 라우터입니다.

문제 상황

AI에게 "안녕"이라고 인사했는데 무거운 검색 엔진이 돌아가면 시간 낭비입니다. 반대로 "지난주 뭐 했지?"라고 물었는데 검색 없이 "모르겠어요"라고 하면 답답하죠.

더 큰 문제:

  • 단순 인사에도 LLM 호출 → 비용 낭비
  • 복잡한 질문인데 도구 선택 못 함 → 엉뚱한 답변
  • 어떤 파이프라인을 써야 할지 매번 수동 지시 → 불편

해결책: BrainAgent

BrainAgent = 질문 분석 + 경로 결정 (판단만, 실행 안 함)

질문이 들어오면 BrainAgent가 먼저 분석하고, 어디로 보낼지 결정합니다. 실행은 MasterAgent가 담당합니다.


동작 방식: 2단계 라우팅

1단계: 규칙 기반 (80%)

패턴 매칭으로 LLM 호출 없이 즉시 결정합니다.

┌─ 규칙 기반 라우팅 ──────────────────────┐
│                                     │
│  질문: "PK-1234 봐줘"                 │
│           ↓                         │
│  [패턴 매칭] "PK-숫자" 감지             │
│           ↓                         │
│  결과: jira 파이프라인                  │
│                                     │
│  비용: $0, 시간: 10ms 미만             │
│                                     │
└─────────────────────────────────────┘

패턴 결정

"안녕", "ㅎㅎ" direct (바로 응답)
"PK-123 봐줘" jira 파이프라인
"@planning 읽어" notion 파이프라인

2단계: LLM 기반 (20%)

규칙으로 판단 어려우면 Gemini Flash를 호출합니다.

┌─ LLM 기반 라우팅 ───────────────────┐
│                                  │
│  질문: "지난주 작업 중 코드 관련된 것"   │
│           ↓                      │
│  [Gemini Flash 호출]              │
│           ↓                      │
│  결과: rag + jira 파이프라인         │
│                                  │
│  비용: Flash 1회, 시간: ~500ms      │
│                                  │
└──────────────────────────────────┘

5가지 exec_type

BrainAgent가 결정하는 실행 타입입니다.

exec_type 언제? 예시

direct 일반 대화 "안녕", "고마워"
tool 명시적 명령 "jira get PK-123"
master 검색 필요 "저번에 뭐했지?"
worker 전문가 필요 "로그인 기획해줘"
speckit 기획→구현 "speckit 시작"

실제 출력 예시

📊 [08:14·670db96] | claude/opus | work | 📚rag

┌─ 라우팅 분석 ────────────────────┐
│ 실행 타입  : master             │
│ 파이프라인 : rag                 │
│ 신뢰도     : 92%                │
│ 이유       : 과거 대화 검색 필요    │
└───────────────────────────────┘

핵심 포인트

  1. 80% 질문은 규칙으로 즉시 라우팅 (비용 $0)
  2. BrainAgent는 판단만, MasterAgent가 실행
  3. 신뢰도 낮으면 사용자에게 재질문
💡 "이거 Jira에서 찾아", "RAG로 검색해" 안 해도 됩니다. BrainAgent가 알아서 판단합니다.

 

반응형