본문 바로가기

LIFE

브라우저를 ‘조종’하는 에이전트와 대화형 워크플로우의 미래

결론부터 말하면...

업무 시스템은 이제 대화형 에이전트가 중심이 되고, 브라우저 제어 에이전트가 그 시작점이 되지 않을까 하는 생각으로 시작해 ㅋㅋ

 

에이전트 브라우저가 뭐길래?

예전 브라우저는 그냥 내가 직접 클릭하고 입력해서 정보만 소비하는 도구였지.
근데 에이전트 브라우저는 좀 다르다. AI가 내 대신 브라우저를 조작하는 ‘대리 사용자’ 느낌이거든.

예를 들어,

  • 자동 탐색: 링크를 타고 들어가서 필요한 정보만 쏙쏙 뽑아주고,
  • 폼 자동 작성: 내 입력 패턴을 학습해서 알아서 채워주고,
  • 툴 연계: 한 사이트에서 데이터를 가져와 다른 플랫폼에 전송하는 일까지 처리해.

Perplexity의 Comet 같은 서비스가 대표적이야.

내가 “이거 조사해줘”라고 말하면 클릭, 스크롤, 데이터 스크랩핑을 한 번에 다 해버리지. 

내 경우는 네이버에서 쇼핑할 때 장바구니까지 넣어주더라...

 

오픈소스 진영에서도 폭풍 성장 중

이건 대기업 전유물이 아니야. 오픈소스 생태계에서도 엄청 빨리 발전 중이거든.

  • Puppeteer, Playwright: 원래 테스트 자동화 툴이었는데, 여기에 AI 레이어를 얹어서 ‘의도 기반’ 브라우저 스크립트를 짤 수 있게 됐어.
  • LangChain 브라우저 커넥터: 자연어 명령만으로 웹 탐색과 데이터 수집 파이프라인을 만들 수 있고,
  • OpenAgent 프로젝트: 커뮤니티가 만든 워크플로우 레시피를 그대로 재활용 가능하게 해놨어.

덕분에 GitHub나 NPM에 가면 쓸만한 툴이 쏟아지고 있고, 커뮤니티 덕에 업데이트 속도도 장난 아니야.

 

툴 전환 대신 대화 전환

현업에서 제일 귀찮은 게 뭔지 알아?

바로 툴 전환이야.

  • 여러 시스템에 로그인해야 하고,
  • 각각 다른 UI 구조를 배워야 하고,
  • 데이터 옮길 때 중복 입력이나 오류까지 생기지.

근데 에이전트 브라우저 + 챗 인터페이스 조합이면 이야기가 달라져.

  1. 단일 창 통합: Slack이나 Teams 같은 채팅 창에서 바로 요청 가능
  2. 의도 실행: “어제 캠페인 비용 분석해줘” 한 줄이면 리포트랑 원본 링크까지 척척
  3. 실시간 피드백: 중간 결과도 메시지로 보고, 바로 추가 지시까지 가능

앞으로는 툴을 배우는 게 아니라 프롬프트 작성이 핵심 스킬이 되는 거지.

 

기술 구성 요소 뜯어보기

자연어 이해(NLU)

  • 의도 분류: 사용자가 검색·정리·업로드 중 뭘 원하는지 파악
  • 엔티티 추출: 날짜, 프로젝트명, 대상 플랫폼 같은 세부 정보 뽑기

브라우저 자동화

  • API 제어: Chromium DevTools로 세밀한 동작 처리
  • 비전 기반 조작: 버튼 위치나 입력칸을 이미지로 인식해 클릭·입력
  • 상태 추적: 로딩 지연이나 오류 상황도 감지하고 대응

워크플로우 오케스트레이션

  • 레시피 정의: YAML이나 JSON으로 단계별 작업을 스크립트화
  • 버전 관리: Git과 연동해 협업 가능
  • 모니터링: 실행 로그와 대시보드로 실시간 상태 체크

 

도입할 때 챙겨야 할 것들

  1. 보안과 권한 관리: OAuth나 SSO 연동해서 에이전트가 내 권한만 쓰도록 설정
  2. 투명성 확보: 실행 로그나 스크린샷 기록으로 추적 가능하게 만들기
  3. 유연한 설계: 부서별 맞춤 워크플로우를 쉽게 정의하고 공유할 수 있게
  4. 거버넌스: 중앙 관리팀의 승인 워크플로우와 부서 자율성을 적절히 조율

 

앞으로의 미래와 우리가 준비할 것

  • 프롬프트 설계 능력: 그냥 “검색해줘”가 아니라, 의도와 조건을 명확하게 전달할 수 있는 능력이 중요해질 거야.
  • 에이전트 생태계 확장: 분야별 레시피 공유 플랫폼이 폭발적으로 성장할 가능성이 커.
  • 인간-에이전트 협업: 사람은 전략과 의사결정, 에이전트는 반복 업무로 역할이 나뉘는 구조로 조직이 재편될 거야.

 

결국 업무의 본질은 문제 해결과 의사결정이잖아?
반복 클릭이나 데이터 정리 같은 건 대화형 에이전트한테 맡기고,

우리는 더 전략적이고 창의적인 일에 집중할 수 있는 시대가 다가오고 있어.

이제는 브라우저를 ‘조종하는 동료’를 맞이할 준비를 해야 할 때지.