ChatGPT 오퍼레이터는 정말 RPA를 대체할 수 있을까?

2025년 10월 14일

OpenAI의 오퍼레이터는 RPA와 비교할 때 비용, 확장성, 안정성에서 한계를 보인다. AI 모델의 추론 방식은 비용이 많이 들고, 확률 기반의 불안정성으로 인해 일관성을 보장하기 어렵다. RPA는 이미 성숙한 생태계를 갖추고 있으며, 기업들은 초기에는 RPA를 사용하고 고차원 의사결정에 AI를 활용하는 하이브리드 접근법을 선호하고 있다. 오퍼레이터는 혁신적이지만 현재로서는 실험적 도구에 그치고 있다.

ChatGPT의 AI 에이전트와 RPA 솔루션의 근본적 차이점 분석

🍎 바쁘다면 알짜배기만이라도 !

  • OpenAI 오퍼레이터는 GPU 집약적 추론 방식으로 작업당 $0.005-0.015 비용 발생, RPA는 스크립트 실행으로 추가 비용 없음

  • 확장성에서 오퍼레이터는 3-5개 동시 작업 제한, RPA는 무제한 병렬 처리로 수천 개 봇 운영 가능

  • 1000명 규모 3년 운영비: 오퍼레이터 720만 달러 vs RPA 650만 달러, 70만 달러 차이 발생

왜 모든 기대를 모았던 AI 에이전트가 벽에 부딪히고 있을까?

ChatGPT로 유명한 OpenAI의 오퍼레이터(Operator)가 2025년 1월 출시되면서 AI 에이전트 기반 자동화의 새로운 가능성을 제시했습니다. 그러나 혁신적인 기술임에도 불구하고, 기존 RPA(Robotic Process Automation) 대비 무언가 제대로 작동이 되지 않는 듯한 느낌을 받곤 합니다.

[GPT에서 에이전트 모드를 활용하면, Operator를 사용할 수 있습니다.]

Gartner에 따르면 2025년 RPA 시장은 전 세계적으로 1조 5천억 달러의 경제적 파급효과를 창출할 것으로 예상되며, 한국 시장도 2023년 5천억 원을 돌파하며 2020년 대비 2.5배 성장을 보였습니다. 그런데 왜 최첨단 AI 기술인 오퍼레이터는 이미 성숙한 RPA 시장에서 어려움을 겪고 있을까요?

문제의 핵심은 아키텍처의 근본적 차이에 있습니다.

Computer-Using Agent의 혁신과 그 이면의 한계

픽셀 데이터로 세상을 보는 AI의 도전

OpenAI 오퍼레이터는 Computer-Using Agent(CUA) 모델을 기반으로 작동합니다. 이는 GPT-4o의 시각적 처리 능력과 강화학습을 결합한 모델로, 웹브라우저의 스크린샷을 실시간으로 분석하여 버튼, 메뉴, 텍스트 필드 등을 식별합니다.

CUA는 HTML 구조에 의존하지 않고 순수하게 픽셀 데이터를 분석하여 작동하므로, 레거시 시스템이나 비표준 인터페이스에서도 동작할 수 있습니다. 픽셀 데이터를 분석한다는 것은 현재 화면에 표시된 GUI를 인식하고 클릭해야 하는 버튼이라던가 텍스트들의 정보를 찾아온다는 뜻입니다.

하지만 이러한 접근법에는 근본적인 제약이 따릅니다. 체인 오브 쏘트(Chain-of-Thought) 추론을 통해 복잡한 작업을 관리 가능한 단계로 나누어 처리하며, OSWorld 벤치마크에서는 38.1%에 그쳐 인간 수준인 72.4%와 큰 격차를 보였습니다.

모든 프로세스마다 픽셀 분석을 하기 때문에 대량의 토큰이 소모되기도 하고, 복잡한 프로세스(CAPTCHA나 복잡한 인터페이스)에 진입할 때에는 문제를 해결하지 못하고 멈춰버리기도 합니다.

위 영상에서도 네이버에서 영수증처리가 되지 않아, 목표를 아예 바꿔버리는 상황이 발생합니다.

왜 이런 일이 벌어질까요?

구조적 한계의 근본 원인: 왜 AI는 벽에 부딪힐 수밖에 없는가

OpenAI Operator vs RPA: 아키텍처 및 처리 방식의 근본적 차이

GPU 집약적 추론의 경제적 부담

OpenAI 오퍼레이터의 가장 근본적인 한계는 AI 모델의 추론 방식 자체에서 기인합니다. 매번 작업을 수행할 때마다 GPT모델이 스크린샷을 분석하고 의사결정을 내려야 하는데, 이는 토큰당 $0.005-0.015의 비용이 발생합니다.

단순한 데이터 입력 작업 1,000회를 처리할 경우를 가정하면, 오퍼레이터는 $50-75의 API 비용이 발생하지만 RPA는 사전 정의된 스크립트를 실행하므로 추가 비용이 전혀 발생하지 않습니다. 이는 근본적으로 클라우드 기반 추론 vs 로컬 스크립트 실행의 차이에서 오는 구조적 한계입니다.

복합적인 양식 처리나 리포트 생성 같은 복잡한 작업에서는 이 차이가 더욱 벌어집니다. (이런 비용 구조로는 대규모 기업 도입이 현실적으로 어려울 수밖에 없습니다.)

확률 모델의 본질적 불안정성

AI 모델은 본질적으로 확률 기반 추론을 수행합니다. 동일한 입력에도 매번 약간씩 다른 출력을 생성할 수 있으며, 이는 신경망의 확률적 특성 때문입니다.

기업의 재무 담당자가 매일 같은 데이터를 처리하는데 AI가 매번 다른 결과를 낸다면? 반면 RPA는 ”if-then-else” 구조의 결정론적 로직으로 동작하여 동일한 조건에서 항상 동일한 결과를 보장합니다.

이러한 차이로 인해 오퍼레이터는 병렬 처리가 어렵습니다. 각 인스턴스가 서로 다른 판단을 내릴 수 있어 일관성을 보장하기 어려운 반면, RPA는 독립적인 프로세스로 무제한 병렬 실행이 가능합니다.

스크린샷의 함정: 보안 취약점의 구조적 원인

오퍼레이터는 컴퓨터 비전 기반으로 픽셀 데이터를 분석하여 동작합니다. 웹사이트의 HTML 구조가 변경되어도 적응할 수 있는 장점이 있지만, 민감한 정보를 픽셀 수준에서 완전히 차단하기 어렵다는 근본적 한계를 가집니다.

RPA는 API나 DOM에 직접 접근하여 데이터를 처리하므로, 시스템 레벨에서 완벽한 접근 제어와 암호화를 적용할 수 있습니다. 이는 금융이나 의료 등 규제 산업에서 RPA가 선호되는 핵심 이유입니다.

성숙한 생태계 vs 실험적 기술

신경망 모델의 예측 불가능성

신경망 모델은 본질적으로 내부 동작 메커니즘을 완전히 이해하거나 예측할 수 없으며, 모델 업데이트 시마다 동작이 변경될 수 있습니다.

기업 환경에서는 감사 추적성과 예측 가능성이 필수적인데, 오퍼레이터는 "왜 그런 판단을 내렸는지" 명확히 설명하기 어렵습니다. RPA는 모든 실행 로직이 스크립트로 명시되어 있어 완벽한 추적성을 제공합니다.

비용 구조의 근본적 차이점

규모의 경제 측면에서 RPA는 압도적 우위를 보입니다. 초기 라이선스 비용 후 운영비가 최소화되는 RPA와 달리, 오퍼레이터는 사용량에 비례하여 구독료가 선형적으로 증가합니다.

1000명 규모에서 3년간 운영할 경우, RPA는 650만 달러, 오퍼레이터는 720만 달러로 약 70만 달러의 차이가 발생합니다. 이는 개별 구독 모델 vs 라이선스 기반 고정비의 차이에서 오는 구조적 한계입니다.

실무에서 발견되는 하이브리드 접근법의 지혜

"RPA로 Start, AI 에이전트로 Scale" 전략

흥미롭게도 실제 기업 현장에서는 "RPA로 Start, AI 에이전트로 Scale" 전략이 대세를 이루고 있습니다. 초기에는 고정 프로세스를 RPA로 빠르게 디지털화하고, 이후 KPI에 직접 영향을 주는 고차원 의사결정 영역을 AI 에이전트에게 위임하는 방식입니다.

이는 초기 투자를 낮추면서도 장기적 성과를 높이는 전략으로, RPA와 AI 에이전트가 경쟁 관계가 아닌 상호 보완적 관계임을 시사합니다.

콜롬비아 은행은 9,000대의 RPA 봇으로 연간 127,000시간을 절약하고 1,900만 달러의 비용을 절감했습니다. 반면 오퍼레이터는 아직 대규모 기업 도입 사례가 제한적이며, 주로 개별 작업 자동화에 그치고 있습니다.

미래 전망과 현실적 선택: 경쟁보다는 공존

대기업과 공공기관의 RPA 도입률이 40% 이상인 반면, 중소기업은 10%에 미치지 못하는 상황에서, 오퍼레이터의 높은 비용 구조는 여전히 높은 진입 장벽으로 작용합니다.

AI 프로젝트의 80%가 PoC에서 멈춘다는 현실을 고려할 때, 기업들은 검증된 RPA의 안정성을 포기하기 어려운 상황입니다. 오퍼레이터는 분명히 혁신적인 기술이지만, 현재로서는 연구 프리뷰 단계의 실험적 도구에 머물고 있습니다.

구조적 한계는 극복 가능한가?

오퍼레이터가 RPA를 구조적으로 넘을 수 없는 핵심적 이유는 규모의 경제성엔터프라이즈 안정성컴플라이언스 요구사항에서 기인합니다. RPA는 이미 성숙한 생태계를 구축했으며, 수많은 기업들이 검증된 안정성을 바탕으로 미션 크리티컬한 업무에 활용하고 있습니다.

이러한 구조적 차이는 단순한 기술적 개선으로는 해결되지 않습니다. GPU 집약적 추론확률 모델의 불안정성클라우드 종속성 등은 AI 에이전트의 본질적 특성에서 비롯되는 것이기 때문입니다.

기업들은 단순히 새로운 기술에 매혹되기보다는, 각 기술의 구조적 특성을 이해하고 비즈니스 요구사항에 맞는 최적의 조합을 선택하는 것이 중요합니다. (앞으로도 당분간은 두 기술이 각자의 영역에서 공존하며, 상호 보완적 역할을 수행할 것으로 전망됩니다.)


성장하는 기업들의 자동화

성장하는 기업들의 자동화

인바이즈가 고객의 자동화 여정에 함께 하겠습니다.

성장하는 기업들의 자동화

성장하는 기업들의 자동화

인바이즈가 고객의 자동화 여정에 함께 하겠습니다.

성장하는 기업들의 자동화

성장하는 기업들의 자동화

인바이즈가 고객의 자동화 여정에 함께 하겠습니다.