← 블로그 목록
PART 2: 기술2025-02-04

에이전틱 워크플로우: 생각이 곧 시스템이 되는 순간

코드를 몰라도 시스템을 설계할 수 있다. 설계할 수 있으면, AI가 만들어준다.

에이전틱 워크플로우: 생각이 곧 시스템이 되는 순간


Mind the Gap Chronicles | PART 2: 실전 레퍼런스 (6/12)


새벽 3시, 무언가에 홀린 밤

2023년 어느 날 새벽. 화면에는 ChatGPT와 VS Code, 그리고 구글 검색 탭이 23개 열려 있었다. 커피잔은 5개째 쌓여갔다.

머릿속에 하나의 그림이 떠올랐다. AI 에이전트 여러 개가 각자 역할을 맡아, 서로 대화하면서 일을 해내는 시스템. 리서치 에이전트가 정보를 수집하면 전략 에이전트가 분석하고, 크리에이터 에이전트가 콘텐츠를 만들고, 비평 에이전트가 검수한다.

이거면 혼자서 에이전시 하나를 돌릴 수 있겠다고 생각했다. 클라이언트 이름만 넣으면 리서치부터 콘텐츠까지 자동으로 나오는 구조.

그날 밤, 나는 처음으로 에이전틱 워크플로우라는 개념을 만나고, 미쳐버렸다.


바이브코딩이라는 신세계

솔직히 고백하면, 나의 코딩 실력은 "코딩을 안다"가 아니라 "코딩이 뭔지 안다" 수준이었다. HTML 기초, Python 변수와 반복문 정도. 프레임워크도, 데이터베이스 설계도, 서버 배포도 할 줄 몰랐다.

그런데 바이브코딩을 만났다. 내가 원하는 것을 자연어로 설명하면, AI가 코드를 작성해주는 방식이었다.

"Python으로 OpenAI API를 호출해서, 브랜드 톤을 매개변수로 받아 마케팅 카피를 생성하는 함수를 만들어줘."

ChatGPT가 완벽한 코드를 뱉어냈다. 돌려보니 작동했다.

"...이게 되네?"

과거의 점들이 연결되는 순간이었다. 물류학과에서 배운 시스템 최적화 사고, 50개 클라이언트와 일하며 익힌 업무 프로세스 분해 습관, 코드를 못 쓰면서도 시스템 아키텍처에 관심을 둔 것. 당시에는 "쓸데없는 공부"처럼 보였던 것들이, 바이브코딩 시대가 오면서 가장 결정적인 무기가 되었다.

바이브코딩은 코딩의 민주화가 아니다. 설계의 민주화다. 코드는 AI가 쓴다. 하지만 "무엇을 만들어야 하는지"를 설계하는 것은 여전히 사람의 몫이다.


첫 2주: 세상을 바꿀 수 있다는 착각

에이전트 5개를 설계했다. 리서처, 전략가, 크리에이터, 비평가, 매니저. 각각의 역할과 입출력을 정의하고, 서로 데이터를 주고받는 파이프라인을 구축했다.

첫 3일 만에 기본 구조가 잡혔다. 일주일 뒤에는 에이전트 간 연결이 되었다. 2주째 되는 날, 처음으로 전체 파이프라인이 End-to-End로 돌아갔다.

새벽 4시. 클라이언트 이름 하나를 입력했을 뿐인데, 리서치 → 전략 → 콘텐츠 → 검수까지 자동으로 흘러갔다. 화면을 보며 소리를 질렀다.

사람이 10시간 걸리던 작업이 15분 만에 끝났다. "해볼 만하다." 이 생각이 처음으로 든 순간이었다.


후반 2주: 모든 것이 무너지다

하지만 문제는 그 다음이었다.

에이전트가 이전 대화를 잊어버렸다. 리서처가 수집한 정보를 전략가가 절반밖에 기억하지 못했다. 대화가 길어질수록 품질이 급락했다.

토큰 한계에 부딪혔다. 에이전트 5개의 대화와 데이터를 합치면 수만 토큰이었는데, 당시 GPT-4의 컨텍스트 윈도우는 8K에 불과했다. 정보가 잘려나갔다. 삼성 클라이언트인데 LG 전략을 쓰고 있는 기막힌 상황이 벌어졌다.

일관성이 붕괴했다. 같은 입력으로 10번 돌리면 10개의 전혀 다른 결과가 나왔다. 브랜드 톤이 매번 달랐다. 시스템이 아니라 도박이었다.

가장 황당했던 건 에러가 전파되는 문제였다. 리서처가 실패하면, 전략가가 "리서치 실패"라는 텍스트를 받아서 *"리서치 실패라는 주제에 대한 전략"*을 수립해버렸다. AI는 실패를 모른다. 그냥 앞으로 간다.


30일째 새벽, 노트북을 덮다

프롬프트를 50번 넘게 고쳤다. 요약 체인, 메모리 외부화, 토큰 분할, 에러 감지 로직. 할 수 있는 건 다 해봤다.

개선은 됐다. 하지만 프로덕션 레벨은 아니었다. 클라이언트에게 쓸 수 있느냐고 물으면, 답은 **"아니오"**였다.

실패.

한 달을 밤새워도 실패할 수 있다. 노력의 양이 아니라 설계의 방향이 중요하다. 나는 "AI 에이전트 5개를 동시에 돌리는 것"에 집착했지만, 정작 필요했던 것은 "AI와 사람이 역할을 나누는 구조"였다.


실패가 남긴 것

감정을 내려놓고 돌아보면, 이 실패는 세 가지를 가르쳐줬다.

첫째, AI는 개별적으로 놀라운 수준이었다. 리서처 에이전트가 3분 만에 수집한 정보의 양, 전략가의 논리, 크리에이터의 품질. 문제는 "협업"이었지, 개별 능력이 아니었다.

둘째, 완전 자동화가 아니라 부분 자동화가 답이었다. 에이전트 5개의 완전 자동 협업은 실패했지만, 에이전트 1개 + 사람의 확인은 성공했다. "AI는 초안까지만, 확정은 사람이 합니다" — 줄갭의 핵심 철학은 여기서 태동했다.

셋째, 설계할 수 있으면 만들 수 있는 시대가 왔다. 코딩을 거의 모르는 사람이 한 달 만에 AI 에이전트 시스템을 만들었다. 실패했지만, 만들어진 것 자체가 증거였다. 아이디어와 프로덕트 사이의 갭이 사라지고 있었다.


그리고 n8n을 만나다

실패한 에이전틱 워크플로우의 "설계 사고"는 살리되, 실행 인프라를 안정적인 도구로 교체했다. 그것이 n8n(워크플로우 자동화 도구)과의 만남이었다.

Python 스크립트로 일일이 코딩하던 것을 시각적 워크플로우로 바꿨다. 에러 핸들링이 내장되어 있었고, 실행 로그도 자동으로 기록됐다. 그리고 무엇보다, 완전 자동화가 아니라 사람의 확인 지점을 설계에 넣었다.

결과는 달랐다. 클라이언트 실전에 투입할 수 있는 수준이 되었다.

실패한 에이전틱 워크플로우가 남긴 유산:

  1. 줄갭의 핵심 철학 — "AI는 초안까지만, 확정은 사람이"
  2. 바이브코딩의 가능성 — 설계할 수 있으면 만들 수 있다
  3. "해볼 만하다"는 확신 — 이후 모든 시스템의 출발점

코딩이 아니라 판단이 남는다

바이브코딩 시대가 열리면서, 벽이 이동하고 있다.

과거에는 아이디어와 프로덕트 사이에 코딩 능력이라는 벽이 있었다. 지금은 그 벽이 설계 능력으로 이동했다. 그리고 머지않아 판단 능력으로 이동할 것이다.

결국 남는 것은 "무엇을 만들지 판단하는 능력"이다. 그것이 판단설계자(Decision Architect)의 출발점이다.


시리즈: Mind the Gap Chronicles | AI가 판단을 망치지 않게 설계합니다

같은 시리즈의 다른 글