AI 클라우드, 이제 "승인된 도구"와 "실제로 작동 중인 도구"가 다른 회사가 됐다

AI 클라우드 환경에서 기업들이 직면한 가장 불편한 진실은 이것이다. 지금 이 순간, 당신의 IT 팀이 관리하고 있다고 믿는 클라우드 인프라와, 실제로 워크로드를 처리하고 있는 인프라가 서로 다른 시스템일 가능성이 높다. 이건 과장이 아니다. 조직도에는 없지만, 청구서에는 분명히 찍혀 있는 인프라. 승인 프로세스를 통과하지 않았지만, 핵심 업무를 처리하고 있는 AI 도구들. 이 두 세계의 간극이 지금 기업 클라우드 거버넌스의 핵심 균열로 번지고 있다.

파일럿이 어떻게 인프라가 되는가

모든 것은 작은 실험으로 시작된다.

마케팅팀 누군가가 AI 글쓰기 도구를 써보고 싶다고 한다. 데이터 분석팀은 LLM 기반 질의 도구를 "잠깐만" 연결해보기로 한다. 개발팀은 코드 리뷰 자동화를 "테스트 목적"으로 붙여본다. 각각의 결정은 합리적이다. 각각의 도구는 독립적으로 보인다.

문제는 이 "잠깐"이 6개월 후에도 계속 돌아가고 있다는 것이다.

이것이 업계에서 말하는 아키텍처 캡처(Architecture Capture) 현상이다. 공식 승인 없이 하나씩 붙은 AI 도구들이 어느 순간 실제 업무의 하중을 지탱하는 구조적 요소가 된다. 처음엔 실험이었던 것이, 어느 순간 "이걸 끄면 업무가 멈추는" 시스템이 된다.

그리고 이 시점에서 거버넌스 팀은 여전히 승인된 1번 인프라만 들여다보고 있다.

두 개의 인프라가 동시에 돌아가는 기업

현재 많은 기업이 사실상 이중 인프라 체제로 운영되고 있다고 봐도 무방하다.

첫 번째 인프라: IT 부서가 공식 승인하고, FinOps 팀이 추적하며, CTO가 보고받는 시스템. 거버넌스 문서가 있고, 소유자가 명확하며, 예산이 배정되어 있다.

두 번째 인프라: 각 팀이 자율적으로 도입한 AI 도구들이 만들어낸 그림자 레이어. 공식 승인 없이 클라우드 리소스에 연결되어 있고, 실제 비즈니스 워크로드를 처리하고 있으며, 아무도 전체 그림을 갖고 있지 않다.

흥미로운 점은 이 두 번째 인프라가 단순히 "불법적"이거나 "무분별한" 것이 아니라는 사실이다. 대부분의 경우, 팀 단위에서는 완전히 합리적인 결정들의 집합이다. 문제는 그 합리적 결정들이 조직 전체 수준에서 누적될 때 구조적 불투명성을 만들어낸다는 것이다.

AI 클라우드에서 "소유권"이 사라지는 방식

전통적인 클라우드 환경에서 소유권은 비교적 명확했다. 누가 요청했는가, 누가 승인했는가, 누가 비용을 지불하는가. 이 세 가지가 일치하면 거버넌스는 작동했다.

AI 클라우드 환경은 이 등식을 해체한다.

마케팅팀이 도입한 AI 콘텐츠 도구는 백엔드에서 클라우드 스토리지에 연결되어 있다. 그 스토리지는 IT 부서가 관리하는 계정에 있다. 비용은 공용 클라우드 청구서에 섞여 있다. 이 도구가 생성하는 에이전트 호출, 재시도 루프, 텔레메트리 데이터는 각각 다른 청구 항목으로 분산된다.

이제 질문을 던져보자. 이 도구의 소유자는 누구인가?

마케팅팀은 "우리가 쓰는 도구"라고 생각한다. IT 부서는 "우리가 승인하지 않은 도구"라고 인식한다. 재무팀은 "어디서 나오는 비용인지 모르는 항목"으로 처리한다. 그리고 보안팀은 이 도구의 존재 자체를 모를 수 있다.

소유권이 분산되어 있는 게 아니다. 소유권이 아무에게도 없는 상태가 된 것이다.

코딩은 죽었는가: 전 구글 CMO의 선언이 우리에게 묻는 진짜 질문에서도 다뤘듯, AI 도구의 대중화는 기술적 경계를 허물면서 동시에 책임의 경계도 함께 허물어버리는 경향이 있다. 누구나 쉽게 쓸 수 있게 된 도구는, 역설적으로 아무도 책임지지 않는 도구가 되기 쉽다.

"끌 수 없는" 인프라의 역설

이 문제가 특히 까다로운 이유가 있다. 두 번째 인프라에 속한 AI 도구들은 대부분 구조적으로 끄기 어렵다.

왜 그런가?

첫째, 해당 도구에 의존하는 워크플로우가 이미 형성되어 있다. 마케팅팀은 그 AI 도구 없이 콘텐츠를 만드는 방법을 잊었다. 개발팀은 코드 리뷰 자동화가 없으면 배포 속도가 절반으로 떨어진다.

둘째, 도구를 끄더라도 청구서가 줄지 않는 경우가 많다. 연결 유지 비용, 스토리지 잔존 데이터, 로깅 인프라 등은 "사용"과 "존재"가 분리되어 있기 때문이다. 도구를 비활성화해도 그 도구가 만들어놓은 인프라 레이어는 계속 비용을 발생시킨다.

셋째, 이 도구들이 처리하는 데이터가 어디에 어떻게 저장되어 있는지 파악하지 못한 상태에서 끄는 것은 데이터 유실 리스크를 동반한다.

결국 기업은 승인하지도 않은, 소유자도 불명확한, 거버넌스도 없는 인프라를 끌 수도 없는 상황에 처하게 된다.

AI 클라우드 거버넌스의 실질적 균열 지점

the letter a is placed on top of a circuit board

Photo by Numan Ali on Unsplash

이 문제를 단순히 "섀도 IT 관리를 더 잘하면 된다"는 프레임으로 보면 핵심을 놓친다.

전통적인 섀도 IT 문제는 가시성(visibility) 문제였다. 승인되지 않은 도구를 발견하고, 승인 프로세스로 편입시키거나 제거하면 됐다.

AI 클라우드 환경의 문제는 구조적 불투명성(structural opacity) 문제다. 도구의 존재는 알 수 있어도, 그 도구가 클라우드 인프라에 어떻게 연결되어 있는지, 어떤 비용을 어떤 경로로 발생시키는지, 어떤 데이터에 접근하는지를 파악하는 것이 근본적으로 어렵다.

Gartner의 클라우드 거버넌스 보고서에 따르면 기업의 상당수가 클라우드 지출의 30% 이상을 추적하지 못하는 것으로 나타나는데, AI 도구 도입이 가속화되면서 이 비율은 더 높아질 가능성이 있다.

핵심 균열은 세 곳에서 발생한다.

1. 승인 레이어와 실제 운영 레이어의 분리 거버넌스 팀이 승인한 아키텍처와 실제로 워크로드를 처리하는 아키텍처가 다르다. 이 간극이 클수록 보안 사고, 컴플라이언스 위반, 비용 폭탄의 리스크가 커진다.

2. 비용 서명(Cost Signature)의 붕괴 단일 AI 도구 요청이 토큰 비용, 라우팅 비용, 스토리지 비용, 에그레스 비용, 로깅 비용으로 분산되면서 기존 FinOps 프레임워크로는 비용의 원인을 추적할 수 없게 된다.

3. 책임 소재의 공백 도구를 쓰는 팀, 인프라를 관리하는 팀, 비용을 지불하는 팀이 모두 다르고, 어느 팀도 전체 그림을 갖고 있지 않다.

지금 당장 적용할 수 있는 세 가지 접근

이 문제를 완전히 해결하는 단일 솔루션은 없다. 하지만 균열을 줄이는 실질적인 접근은 있다.

첫째, AI 도구 인벤토리를 "사용 여부"가 아닌 "인프라 연결 여부" 기준으로 재작성하라.

지금 많은 기업의 AI 도구 목록은 "팀 A는 도구 X를 씁니다"는 형태다. 이것으로는 충분하지 않다. 필요한 것은 "도구 X는 클라우드 계정 Y의 스토리지 Z에 연결되어 있고, API 호출은 서비스 W를 경유하며, 로그는 버킷 V에 쌓입니다"는 수준의 인프라 연결 맵이다.

이 작업은 번거롭지만, 이것 없이는 두 번째 인프라의 실체를 파악할 수 없다.

둘째, "파일럿 종료 조건"을 사전에 명문화하라.

AI 도구 파일럿을 시작할 때, 종료 조건과 정식 도입 전환 조건을 문서화하는 것이 필요하다. "3개월 후 평가" 같은 모호한 조건이 아니라, "이 도구가 프로덕션 데이터에 접근하는 순간 자동으로 공식 거버넌스 프로세스가 트리거된다"는 구조적 장치가 필요하다.

파일럿이 인프라가 되는 것을 막는 가장 효과적인 방법은, 그 전환점을 자동으로 감지하고 대응하는 프로세스를 미리 만들어두는 것이다.

셋째, 비용 추적 단위를 "도구"에서 "연결"로 바꿔라.

"AI 도구 비용이 얼마인가"라는 질문은 AI 클라우드 환경에서 이미 답하기 어려운 질문이 됐다. 더 유효한 질문은 "이 도구가 만들어내는 클라우드 연결들이 각각 얼마의 비용을 발생시키는가"다.

AI와 전쟁이 동시에 강타한 캠퍼스채용: 인도 청년들이 마주한 이중 충격의 경제학에서 분석했듯, AI의 파급력은 우리가 예상하는 것보다 훨씬 넓은 영역에서, 예상치 못한 방식으로 비용을 발생시킨다. 클라우드 비용도 마찬가지다.

거버넌스의 질문이 바뀌어야 한다

기업 클라우드 거버넌스의 질문은 오랫동안 "우리는 무엇을 쓰고 있는가"였다. AI 도구가 본격적으로 인프라의 일부가 된 지금, 이 질문은 충분하지 않다.

진짜 필요한 질문은 이것이다.

"우리가 승인한 것과 실제로 돌아가는 것 사이의 간극은 얼마나 큰가?"

이 간극을 측정하고, 줄이고, 관리하는 것이 AI 클라우드 시대 거버넌스의 핵심 과제다. 승인된 인프라만 들여다보는 거버넌스는, 실제 인프라의 절반만 관리하는 것과 같다.

기술은 단순히 기계가 아니라, 인간의 삶을 풍요롭게 하는 도구다. 하지만 그 도구가 우리가 인지하지 못하는 방식으로 작동하기 시작할 때, 그 풍요는 예상치 못한 리스크와 함께 온다. 두 개의 인프라 사이의 간극을 직시하는 것, 그것이 지금 AI 클라우드를 진지하게 다루는 기업이 가장 먼저 해야 할 일이다.

NOCODE TECH STACKER