클라우드 AI, 이제 "비용을 어디에 청구할지"도 스스로 결정한다 — 재무팀은 그 사실을 감사 이후에야 알았다

클라우드 AI 자동화의 물결이 인프라 운영의 거의 모든 영역을 집어삼키고 있다. 스케일링, 보안, 배포, 장애 복구, 데이터 저장, 네트워크 접근까지. 그런데 이 시리즈를 통해 반복적으로 확인된 패턴이 하나 있다. 거버넌스 공백은 항상 "나중에" 발견된다는 것이다. 이번에 다룰 주제는 조금 다른 각도다. 클라우드 AI가 자율적으로 실행하는 수백 가지 결정들이 결국 "비용"이라는 형태로 집약될 때, 그 비용이 어느 팀에, 어느 프로젝트에, 어느 계정에 청구될지를 누가 결정하는가의 문제다.

답은 점점 더 명확해지고 있다. 사람이 아니라, AI가 결정한다. 그리고 그 결정은 최초 설정 시점에 사실상 완결된다.

비용 배분은 "설정"이 아니라 "결정"이다

클라우드 비용 관리 도구들, 예를 들어 AWS Cost Explorer의 자동 태깅, GCP의 추천 엔진, Azure의 Cost Management + AI Advisor 같은 플랫폼들은 이제 단순히 비용을 보여주는 도구를 넘어서고 있다. 이들은 비용 태그를 자동으로 생성하고, 리소스를 프로젝트에 귀속시키며, 예약 인스턴스와 온디맨드 인스턴스 간의 비용을 내부적으로 재배분한다.

문제는 이 과정이 "정책 범위 내 실행"이라는 명목 아래 이루어진다는 점이다. 초기 정책을 설정한 엔지니어나 FinOps 담당자는 "이 규칙 안에서 AI가 알아서 최적화하겠지"라고 생각한다. 그러나 실제로는 그 정책이 수십 개의 팀, 수백 개의 서비스, 수천 개의 리소스에 걸쳐 적용되면서 애초에 설계자가 상상하지 못했던 방식으로 비용이 배분되기 시작한다.

이것은 단순한 기술적 오류가 아니다. 조직 내 예산 책임, 프로젝트 수익성 계산, 팀 간 비용 정산이라는 정치적이고 재무적인 결정을 AI가 조용히 대신하고 있는 것이다.

"공유 리소스" 문제: 누가 얼마를 내야 하는가

클라우드 환경에서 비용 배분이 가장 복잡해지는 지점은 공유 리소스다. 데이터베이스 클러스터, Kubernetes 노드 풀, CDN, 로깅 파이프라인, API 게이트웨이 같은 인프라는 여러 팀이 동시에 사용한다. 이 비용을 어떻게 나눌 것인가?

전통적으로 이 문제는 FinOps 팀이 수동으로 처리했다. 사용량 비례 배분, 균등 배분, 특정 팀 귀속 등 다양한 방식이 논의되고 합의되었다. 그런데 AI 기반 비용 최적화 도구들은 이 배분 로직을 자동화하기 시작했다.

예를 들어, AWS의 Cost Allocation Tags와 결합된 자동화 도구는 리소스 사용 패턴을 분석해 "이 데이터베이스 비용의 63%는 팀 A에, 37%는 팀 B에 귀속시키는 것이 최적"이라는 결론을 내리고 이를 자동 적용한다. 이 결정이 내려지는 순간, 팀 A의 월말 클라우드 청구서가 조용히 올라간다. 팀 A의 리더는 다음 달 예산 검토 회의에서 "왜 이번 달 클라우드 비용이 갑자기 18% 올랐냐"는 질문을 받게 된다.

그 18%의 원인은 코드 변경도, 트래픽 증가도 아니다. AI가 비용 배분 공식을 재조정했기 때문이다. 그리고 그 재조정을 명시적으로 승인한 사람은 없다.

Team discussing charts during a business meeting.

Photo by Vitaly Gariev on Unsplash

침묵의 복리 효과: 왜 감사 이후에야 발견되는가

이 문제가 특히 위험한 이유는 단발성 오류가 아니라 복리로 쌓인다는 점이다.

AI 비용 배분 도구는 한 번의 결정으로 끝나지 않는다. 매일, 매주, 매 청구 사이클마다 최적화 로직을 재실행한다. 초기 설정의 작은 오류나 의도하지 않은 편향이 있다면, 그것은 매달 반복되고 증폭된다. 6개월 후에 감사팀이 "왜 이 프로젝트의 클라우드 비용이 예산 대비 40% 초과했는가"를 조사할 때, 그 원인의 상당 부분이 AI의 자율적 비용 재배분이었음을 발견하게 된다.

그런데 더 큰 문제는 감사 추적(audit trail)이다. 사람이 비용 배분을 변경했다면, 누가 언제 어떤 이유로 변경했는지 기록이 남는다. 그러나 AI가 "정책 범위 내에서" 자율적으로 재배분했다면, 로그에는 단지 "자동 최적화 실행됨"이라고만 기록된다. 어떤 로직이 적용되었는지, 왜 그 시점에 그 결정이 내려졌는지를 역추적하는 것은 극도로 어렵다.

Gartner의 2025년 클라우드 비용 관리 보고서에 따르면, 클라우드 비용 초과의 주요 원인 중 하나로 "자동화된 리소스 최적화 도구의 예상치 못한 비용 재배분"이 점점 더 자주 언급되고 있는 것으로 보인다.

클라우드 AI 거버넌스의 맹점: 정책은 살아있는 문서가 아니다

이 시리즈 전체를 관통하는 핵심 문제의식이 있다. AI 자동화 도구들은 "정책 범위 내에서만 실행된다"고 설계된다. 그러나 정책은 한 번 설정되고 나면 업데이트되지 않는 경우가 대부분이다.

비용 배분 정책을 예로 들면, 조직 구조가 바뀌거나, 새로운 팀이 생기거나, 기존 프로젝트가 종료되거나, 서비스 아키텍처가 변경되면 비용 배분 로직도 함께 업데이트되어야 한다. 그러나 현실에서는 초기 설정이 몇 년 동안 그대로 유지되면서, 그 위에서 AI가 계속 "최적화"를 실행한다.

이것은 마치 2년 전 지도를 들고 현재의 도시를 탐색하는 것과 같다. 지도 자체는 논리적으로 완벽하지만, 현실과의 괴리가 매 결정마다 쌓인다.

이 문제는 비단 비용 배분에만 국한되지 않는다. "생각하는 손"이 사라지면 디자인도 사라진다: AI 시대의 역설에서 다루었듯, AI가 반복적 결정을 대신하기 시작하면 인간의 판단력과 맥락 이해 능력 자체가 퇴화할 위험이 있다. 클라우드 비용 거버넌스에서도 같은 역설이 작동한다. AI에 위임할수록, 인간이 정책의 현재 상태를 파악하는 능력이 떨어진다.

FinOps팀이 발견하는 세 가지 충격적인 패턴

실무에서 클라우드 AI 비용 자동화를 도입한 조직들이 공통적으로 경험하는 문제 패턴이 있다.

1. 유령 태그 문제

AI 자동 태깅 도구가 리소스에 태그를 자동 생성하는 과정에서, 더 이상 존재하지 않는 프로젝트나 팀에 비용이 귀속되는 현상이 발생한다. 이를 "유령 태그"라고 부를 수 있다. 해당 팀은 이미 해산되었거나 프로젝트가 종료되었지만, AI는 기존 패턴을 학습해 계속 그 태그를 사용한다. 결국 아무도 책임지지 않는 비용 항목이 청구서에 쌓인다.

2. 예약 인스턴스 비용의 무단 재배분

기업들은 비용 절감을 위해 예약 인스턴스(Reserved Instances)나 Savings Plans를 구매한다. AI 도구들은 이 예약 비용을 실제 사용 팀에 배분하는 로직을 자율적으로 실행한다. 문제는 예약 구매 시점의 가정과 실제 사용 패턴이 달라질 때다. AI는 "현재 최적"을 기준으로 배분하지만, 예약을 구매한 팀의 입장에서는 자신들이 지불한 비용이 다른 팀으로 넘어가는 것처럼 느껴진다. 팀 간 갈등의 씨앗이 된다.

3. 크로스 리전 비용의 임의 귀속

멀티 리전 아키텍처에서 데이터 전송 비용은 어느 팀에 귀속되어야 하는가? AI 도구는 트래픽 패턴을 분석해 자동으로 결정하지만, 그 결정이 비즈니스적으로 합리적인지는 별개의 문제다. 한국 팀이 미국 리전 데이터를 읽었다면, 그 전송 비용은 한국 팀에 청구되어야 하는가, 아니면 데이터를 미국 리전에 저장하기로 결정한 글로벌 인프라팀에 청구되어야 하는가? AI는 기술적 패턴만 보고 결정하지만, 이것은 조직 정치적 판단이 필요한 영역이다.

클라우드 AI 비용 거버넌스를 되찾는 실질적 방법

이 문제를 인식했다면, 다음 단계는 실질적인 대응이다. 자동화를 포기하라는 것이 아니다. 자동화의 범위와 책임을 명확히 하라는 것이다.

비용 배분 정책에 "유효기간"을 설정하라

모든 비용 배분 정책에는 검토 주기를 명시해야 한다. 분기별 또는 반기별로 FinOps 담당자가 현재 정책이 조직 구조와 아키텍처 현실을 반영하고 있는지 검토하는 프로세스를 의무화해야 한다. AI가 실행하는 정책은 살아있는 문서여야 하며, 한 번 설정하고 잊어버리는 대상이 아니다.

AI 결정의 "설명 가능성"을 계약 요건으로 포함하라

클라우드 비용 관리 도구를 도입할 때, 각 비용 배분 결정에 대한 설명 가능한 로그를 요구해야 한다. "자동 최적화 실행됨"이 아니라, "팀 A의 데이터베이스 쿼리 비중이 이전 대비 23% 증가했으므로 비용 귀속 비율을 X%에서 Y%로 조정함"과 같은 수준의 감사 추적이 필요하다.

임계값 기반 인간 승인 프로세스를 도입하라

비용 배분 변경이 특정 임계값(예: 월간 팀 예산의 10% 이상 변동)을 초과할 경우, 자동 실행이 아닌 인간 승인을 요구하는 워크플로를 설계해야 한다. 이것은 자동화의 효율성을 크게 해치지 않으면서도 중요한 결정에 대한 거버넌스를 유지하는 현실적인 방법이다.

FinOps와 엔지니어링팀의 정기 공동 리뷰

비용 배분은 기술적 문제이면서 동시에 비즈니스 문제다. 월 1회 이상 FinOps팀, 엔지니어링팀, 재무팀이 함께 AI 자동 배분 결과를 검토하는 세션을 운영해야 한다. 이 세션의 목적은 AI의 결정을 뒤집는 것이 아니라, AI가 내린 결정이 비즈니스 현실과 일치하는지 확인하고 정책을 업데이트하는 것이다.

자동화는 판단을 대체하지 않는다

클라우드 AI 도구들이 비용 배분이라는 민감한 영역까지 자율적으로 결정하기 시작했다는 사실은, 기술의 진보인 동시에 새로운 책임의 공백을 만들어낸다. 기술이 결정을 내리지만, 그 결정의 결과는 여전히 사람이 책임져야 한다.

이 시리즈를 통해 반복적으로 강조해온 것처럼, "정책 범위 내 실행"이라는 설계 원칙은 정책이 살아있고 현실을 반영할 때만 유효하다. 정책이 구식이 되는 순간, AI의 자율 실행은 최적화가 아니라 체계적인 오류의 자동화가 된다.

재무팀이 분기 결산 이후에, 감사팀이 감사 이후에, DBA팀이 마이그레이션 이후에 문제를 발견하는 패턴은 우연이 아니다. 이것은 거버넌스 구조 자체의 설계 결함이다. 그리고 그 결함을 고치는 것은 AI의 몫이 아니라, 여전히 인간의 몫이다.

기술은 단순히 기계가 아니라, 인간의 삶을 풍요롭게 하는 도구다. 그러나 도구가 스스로 판단하기 시작할 때, 우리는 그 판단을 감독할 책임을 더욱 진지하게 받아들여야 한다. 클라우드 AI 시대의 FinOps는 더 이상 숫자를 보는 일이 아니다. AI가 내린 결정의 맥락을 이해하고, 그것이 조직의 의도와 일치하는지를 끊임없이 검증하는 일이다.

NOCODE TECH STACKER