Tempus AI의 11억 달러 유전자 데이터 거래: 당신의 DNA는 누구의 것인가?

이 사건이 단순한 개인정보 소송으로 보인다면, 그것은 아직 절반만 이해한 것이다. Tempus AI를 둘러싼 집단소송은 의료 AI 산업이 어떤 방식으로 데이터를 자본화하는지, 그리고 그 과정에서 개인의 가장 근본적인 정보인 유전자가 어떻게 상품화되는지를 적나라하게 드러낸다.

11억 달러짜리 유전자 도서관: 무슨 일이 있었나

2026년 4월 현재, 시카고 연방법원에는 헬스케어 AI 기업 Tempus AI를 상대로 한 복수의 집단소송이 계류 중이다. 원문 기사에 따르면, 핵심 쟁점은 두 가지다.

첫째, Tempus AI가 2025년 6억 달러에 인수한 Ambry Genetics의 유전자 검사 데이터베이스를 동의 없이 AI 모델 훈련에 활용했다는 것. 둘째, 이 데이터를 AstraZeneca, Bristol Myers Squibb, Pfizer 등 70개 이상의 제약·생명과학 기업에 판매하여 약 11억 달러 규모의 수익을 창출했다는 것이다.

Tempus AI의 2025 회계연도 매출은 12억 7,000만 달러다. 즉, 이 기업 매출의 상당 부분이 유전자 데이터의 상업화와 직간접적으로 연결되어 있다는 계산이 나온다. 회사 측은 자사 웹사이트에서 4,500만 건 이상의 비식별화된 환자 기록을 보유한 "임상·분자 데이터 라이브러리"를 운영한다고 밝히고 있다.

"비식별화"라는 허구: 경제학자가 주목하는 진짜 문제

여기서 기사가 표면적으로 다루지 않는 맥락을 짚어야 한다. 소송 원고 측은 다음과 같이 주장한다.

"유전자 데이터는 비식별화될 수 없다. 이러한 데이터는 본질적으로 고유한 생체 표지자 역할을 하기 때문이다. DNA와 같은 유전자 데이터는 본질적으로 식별 가능하다." — 2026년 4월 15일 소장

이 주장은 법적 수사(修辭)가 아니라 과학적 사실에 가깝다. 미국 국립보건원(NIH)이 인용한 연구에 따르면, 유전자 정보는 계보학 데이터베이스와 공공 기록을 교차 참조하여 개인을 재식별하는 것이 가능하다. 이름과 생년월일을 지운다고 해서 DNA가 익명이 되지는 않는다. 규제 전문 변호사 레이첼 로즈의 표현을 빌리자면 "이름과 생년월일을 제거하는 것과 유전자 정보를 익명화하는 것은 완전히 다른 차원의 문제"다.

경제학적 시각에서 이 문제는 더욱 흥미롭다. 기업이 데이터를 "비식별화했다"고 선언하는 순간, 그 데이터는 개인정보보호법의 적용 범위에서 벗어나 자유롭게 거래 가능한 상품이 된다. 이는 일종의 규제 차익 거래(regulatory arbitrage)다. 비식별화라는 기술적 주장을 방패 삼아 법적 의무를 회피하면서, 동시에 데이터의 상업적 가치는 최대한 보존하는 구조다.

내가 2008년 금융위기 이후 줄곧 강조해온 것처럼, 시스템 내의 정보 비대칭은 언제나 가장 취약한 쪽이 비용을 치르는 방식으로 귀결된다. 당시에는 모기지 담보부 증권의 위험이 숨겨졌고, 지금은 유전자 데이터의 재식별 가능성이 숨겨지고 있다.

글로벌 금융 체스판에서의 데이터 경제: 누가 진짜 수혜자인가

이 사건을 거시경제적 맥락에서 재배치해 보자. Tempus AI의 비즈니스 모델은 사실 새로운 것이 아니다. 이른바 "데이터 플라이휠(data flywheel)" 전략이다. 환자 데이터를 수집하고 → AI 모델을 훈련시켜 → 정밀의료 솔루션을 개발하고 → 그 데이터와 솔루션을 제약사에 판매하는 순환 구조다.

문제는 이 플라이휠이 돌아가는 연료가 환자 본인의 동의 없이 채취된 유전자 정보일 수 있다는 데 있다. 6억 달러에 Ambry Genetics를 인수하고, 그 데이터베이스를 활용해 11억 달러 규모의 계약을 체결했다면, 그 차익의 상당 부분은 데이터 원소유자—즉 유전자 검사를 받은 수백만 명의 환자들—에게 귀속되지 않은 셈이다.

글로벌 금융의 체스판에서 이 구조를 보면, 제약사들도 결코 수동적 구매자가 아니다. AstraZeneca, Pfizer 같은 기업들이 이 데이터를 구매한 것은 신약 개발 파이프라인을 단축하기 위해서다. 유전자 데이터 기반의 타깃 발굴은 전통적인 임상시험 방식 대비 개발 기간과 비용을 극적으로 줄일 수 있다. 내가 이전에 FDA의 plausible mechanism pathway를 분석하며 지적했듯, 의료 자본 배분의 효율화는 분명한 가치를 창출한다. 그러나 그 효율화가 누군가의 동의 없이 수집된 생체 정보 위에 서 있다면, 경제적 효율성의 논리만으로는 정당화될 수 없다.

Tempus AI 사태가 드러내는 구조적 취약점

이 소송이 단순히 Tempus AI 한 기업의 문제가 아닌 이유는 헬스케어 AI 산업 전반의 데이터 수집·활용 관행을 겨냥하기 때문이다. UNC Health의 최고분석책임자 라치니 무사비가 최근 강조한 것처럼, 분석팀이 데이터 요청의 맥락을 깊이 이해하지 않고 단순히 "티켓을 처리하는" 방식으로 접근할 때 이런 구조적 문제가 발생한다. 데이터의 윤리적 출처와 활용 목적에 대한 근본적 질문 없이 기술적 효율성만을 추구할 때, 시스템 전체가 취약해진다.

NHS England의 팀 카로에가 지적한 것처럼 AI가 임상 부채와 건강 불평등을 해소하는 도구가 될 수 있다는 것은 사실이다. 그러나 그 전제는 데이터 주체의 신뢰가 확보된 상태여야 한다. 신뢰 없는 데이터 생태계는 장기적으로 AI 의료의 가장 큰 장애물이 될 것이다.

이 지점에서 한국의 사이버보험 시장 분석에서 내가 지적한 구조적 문제가 겹쳐 보인다. 한국 기업들이 사이버 사고를 내재화하며 리스크를 숨기듯, 헬스케어 AI 기업들도 데이터 활용의 법적·윤리적 리스크를 "비식별화"라는 기술적 주장 뒤에 숨기는 경향이 있다. 두 경우 모두 리스크가 사라진 것이 아니라 단지 보이지 않게 된 것뿐이다.

또한 AI 윤리의 언어 문제에서 논의된 것처럼, "책임"이라는 단어가 아무도 실제로 책임지지 않게 만드는 구조가 이 사건에서도 반복된다. Tempus AI는 "비식별화"를 주장하고, 제약사는 "구매한 데이터를 활용했을 뿐"이라고 할 것이며, 규제 당국은 사후적으로 소송이 제기된 후에야 움직인다.

a close up of a typewriter with a paper on it

Photo by Markus Winkler on Unsplash

경제적 도미노 효과: 이 소송이 업계에 미칠 파장

이 소송의 결과가 어떻게 되든, 이미 경제적 도미노 효과는 시작됐다고 봐야 한다. 몇 가지 시나리오를 살펴보자.

첫째, 데이터 인수 가격 재산정. 앞으로 헬스케어 데이터베이스를 보유한 기업의 M&A 가격 산정에서 법적 리스크 프리미엄이 반드시 반영될 것이다. Tempus AI가 Ambry Genetics를 6억 달러에 인수했을 때, 그 가격에 잠재적 소송 비용이 충분히 반영됐을지는 의문이다.

둘째, 제약사의 데이터 공급망 실사 강화. AstraZeneca, Pfizer 등 70개 이상의 제약사들은 이제 자신들이 구매한 데이터의 출처와 동의 절차를 소급하여 검토해야 하는 압박에 직면할 가능성이 있다. 이는 상당한 법무 비용과 잠재적 공동 피고 지위를 의미할 수 있다.

셋째, 헬스케어 AI 기업의 밸류에이션 조정. 데이터 자산의 법적 지위가 불확실해지면, 이를 핵심 경쟁력으로 삼는 기업들의 밸류에이션 모델 자체가 흔들린다. 시장은 이 리스크를 어떻게 가격에 반영할 것인가.

소프트웨어 결함이 하드웨어 리콜을 집어삼키는 자동차 산업과 마찬가지로, 헬스케어 AI에서도 "보이지 않는 레이어"의 리스크가 기업 전체의 가치를 뒤흔드는 시대가 열리고 있다.

독자에게 드리는 관점 전환

이 사건을 바라보는 일반적 시각은 "대기업이 또 개인정보를 침해했다"는 분노의 서사다. 그러나 경제학자의 눈으로 보면 질문은 달라진다.

당신의 유전자 데이터는 얼마의 가치가 있는가? Tempus AI의 계산에 따르면, 수백만 명의 유전자 데이터 포트폴리오는 최소 11억 달러의 가치를 지닌다. 그런데 그 가치의 창출에 기여한 개인들은 단 한 푼도 받지 못했다. 이것은 단순한 프라이버시 침해가 아니라, 경제적 수탈(economic extraction)의 문제다.

헬스케어 AI가 정밀의료의 미래를 열 수 있다는 것은 부정하기 어렵다. 그러나 그 미래가 지속 가능하려면, 데이터 제공자인 환자가 단순한 원료 공급원이 아니라 가치 창출의 파트너로 인정받는 구조가 필요하다. 일부 연구자들은 유전자 데이터의 동의 기반 공유 모델이 장기적으로 더 지속 가능한 데이터 생태계를 만든다고 주장하며, 이는 경제적으로도 타당한 논거다.

교향곡의 비유를 빌리자면, 지금 헬스케어 AI 산업은 1악장의 화려한 알레그로를 연주하고 있다. 그러나 3악장의 지속 가능한 안단테로 넘어가려면, 오케스트라 전체—기업, 규제 당국, 그리고 데이터 주체인 환자—가 같은 악보를 보고 연주해야 한다. Tempus AI 소송은 그 악보가 아직 쓰이지 않았음을 알리는 불협화음이다.

글로벌 금융의 체스판에서 가장 강력한 말은 정보를 가진 쪽이다. 문제는 그 정보가 어떻게 획득됐는가이다. 그 질문에 답하지 못하는 비즈니스 모델은, 아무리 정교한 AI를 얹어도 결국 모래 위에 세운 성에 불과하다.

NOCODE TECH STACKER