본문 바로가기

Study

구글 vs 엔비디아, 진짜 싸움은 아직 시작도 안 했어

AI 인프라 이야기를 보다 보면 자꾸 이런 제목이 보여.

“구글, 엔비디아에 도전장”, “엔비디아 시대 끝났다”, “이제 TPU가 GPU를 대체한다” 이런 식의 헤드라인은 늘 자극적이야.

이번에도 비슷했어.
구글 클라우드가 8세대 AI 전용 칩인 TPU 8t와 8i를 공개하면서 또 한 번 “엔비디아 긴장해야 하는 거 아니냐”는 분위기가 만들어졌거든.

근데 실제로 뜯어보면 이야기는 훨씬 복잡해. 결론부터 말하면 이건 “구글이 엔비디아를 죽이겠다”가 아니라 “엔비디아를 계속 쓰면서도, 우리만의 무기를 더 강하게 만들겠다”

에 훨씬 가까운 이야기야. 진짜 싸움은 GPU 전쟁이 아니라 클라우드 사업자들의 생태계 싸움이거든.

 

[Source: ChatGPT 생성]

 

엔비디아 왕국에 돌 던진 구글, 진짜 맞짱일까?

구글이 이번에 발표한 건 8세대 TPU 시리즈 두 종이야.

하나는 TPU 8t, 다른 하나는 TPU 8i. 이 둘은 역할이 완전히 달라.

  • TPU 8t: 학습(Training) 전용
  • TPU 8i: 추론(Inference) 전용

쉽게 말하면 8t는 거대한 AI 모델을 훈련시키는 근육 몬스터고, 8i는 이미 학습된 모델을 빠르게 서비스에 붙이는 실무형 플레이어야.

예를 들어

  • Gemini 같은 초거대 모델을 처음부터 학습시키는 건 8t
  • 수많은 사용자가 동시에 AI 서비스를 쓰는 상황에서 빠르게 응답하는 건 8i

이런 느낌이지. 구글은 여기서 꽤 강한 숫자도 던졌어.

  • 이전 세대 대비 최대 3배 빠른 학습 속도
  • 달러당 최대 80% 더 좋은 성능
  • 한 클러스터에 TPU 100만 개 이상 연결 가능

즉, 더 빠르고 더 싸고 더 적은 에너지로 더 크게 라는 클라우드 인프라의 핵심 키워드를 전부 들고 나온 거야. 근데 여기서 중요한 건
“그래서 엔비디아 끝났냐?”가 아니야.

진짜 질문은 이거지. 구글은 정말 엔비디아를 대체하려는 걸까?

 

우린 칩도 만들지만… 엔비디아도 계속 씁니다

여기서 흥미로운 포인트가 나와. 기사 제목만 보면 완전 선전포고처럼 보이는데 실제로 구글이 하는 행동은 엄청 현실적이야.

구글은 분명하게 말했어. “우리는 여전히 엔비디아 GPU를 적극적으로 사용한다”

심지어 더 나아가서 엔비디아의 최신 칩인 Vera Rubin도 올해 안에 구글 클라우드에서 제공하겠다고 밝혔다.

이게 의미하는 건 명확해. 이번 TPU 발표는 “엔비디아를 치우겠다”가 아니라

“엔비디아도 쓰고, 우리 칩 옵션도 더 강하게 키우겠다”에 가까워.

쉽게 말하면 엔비디아는 기본 옵션이고 TPU는 전략 옵션인 거야. 그리고 더 재밌는 건 구글이 엔비디아와 같이 협업도 하고 있다는 점이야.

대표적으로 Falcon. 이건 구글이 공개한 소프트웨어 기반 네트워킹 기술인데 이걸 엔비디아 시스템에서도 더 효율적으로 돌릴 수 있도록 같이 작업하고 있어.

즉, 겉으로 보면 칩 전쟁인데 실제로는 “엔비디아에 더 잘 연결되는 클라우드”를 만드는 싸움에 더 가까워.

 

왜 “엔비디아 끝났다”는 예측은 계속 틀릴까

이런 이야기는 사실 처음이 아니야. 2016년쯤에도 “구글 TPU 등장 = 엔비디아 위기” 라는 말이 있었어. 유명 분석가들도 그렇게 봤고.

근데 지금은?

정반대야. 엔비디아는 AI 시대의 상징이 됐고 거의 AI 인프라의 통화 같은 존재가 됐어. 왜 이런 일이 벌어졌을까? 이유는 간단해.

사람들이 이걸 제로섬 게임으로 봤기 때문이야.

“구글이 칩 만들면 엔비디아 매출은 줄겠지”라고 생각했는데 현실은 AI 수요가 너무 빨리 커져서 칩이 늘어나도 다 팔리는 상황이 된 거야.

오히려 하이퍼스케일러는 자기 칩을 만들고 동시에 엔비디아 GPU도 더 많이 사고 엔비디아는 더 강해졌다

라는 이상한 구조가 만들어졌지. 이제 엔비디아는 단순한 칩 회사가 아니라 AI 인프라의 표준 처럼 움직이고 있어.

그래서 “자체 칩 = 엔비디아 버리기” 라는 공식은 성립하지 않아.

 

구글은 왜 굳이 TPU를 8세대까지 밀까?

그럼 질문이 생겨. 이렇게 엔비디아랑 잘 지내면서 왜 굳이 TPU를 계속 만드는 걸까? 답은 크게 3가지야.

1. 마진과 차별화

클라우드 사업은 생각보다 단순해. 비슷한 인프라를 더 잘 팔아야 해.

그런데 모두가 같은 GPU를 팔면 차별화가 어려워져.

이때 “우리는 엔비디아도 있고 우리만의 TPU도 있습니다” 이건 엄청 강한 카드가 돼.

특히 Google Search, YouTube, Gemini 같은 내부 서비스에서 직접 TPU를 돌려보고 그 경험을 외부 고객용 상품으로 팔 수 있다는 건 엄청 큰 장점이야. 직접 써본 사람이 제일 잘 팔 수 있으니까.

2. 스케일의 게임

이번 발표에서 구글이 강조한 것 중 하나가 TPU 100만 개 클러스터였어.

이건 그냥 숫자 자랑이 아니야. 초거대 모델 학습과 글로벌 서비스 수준의 추론을 자기 클라우드 안에서 완전히 장악하겠다는 선언에 가까워.

엔비디아 칩을 사와서 붙이는 것도 가능하지만 자체 칩 + 자체 네트워크 스택으로 가면 튜닝도 더 정교해지고 비용 구조도 훨씬 유리해져.

결국 클라우드는 스케일 싸움이거든.

3. 장기적인 보험

솔직히 지금은 엔비디아 없이는 못 살아에 가까워.

아마존도 마이크로소프트도 구글도 마찬가지야. 하지만 10년 뒤도 그럴까? 그건 아무도 몰라.

그래서 지금부터 자기 칩 생태계 를 키워두는 거야. 이건 당장의 킬러 전략이 아니라 장기 보험이야. 가격 협상력도 생기고 제품 전략도 훨씬 유연해지거든. TPU는 지금의 무기이면서 미래의 보험이기도 해.

 

우리에게 이게 왜 중요할까

이걸 그냥 반도체 뉴스로 보면 놓치는 게 많아. 이게 곧 인프라 전략의 변화거든. 예전에는 단순했어.

“GPU 몇 장 필요하지?” 거의 이게 전부였어.

근데 앞으로는 달라져.

  • 엔비디아 GPU
  • 구글 TPU
  • AWS 전용 칩
  • Azure AI 인프라
  • 네트워킹 스택
  • 배포 툴체인

이걸 다 같이 봐야 해.

예를 들어 학습은 TPU 8t, 서비스 추론은 TPU 8i, 특정 고객 대응은 엔비디아 GPU, 이런 식의 멀티 벤더 전략이점점 현실이 될 가능성이 커. 즉, “엔비디아만 알면 된다” 시대가 끝나고 있다는 거야. 앞으로는 AI 인프라 아키텍처를 설계하는 능력 자체가 경쟁력이 된다.

 

진짜 싸움은 칩이 아니라 생태계야

정리하면 이번 발표는 엔비디아를 이길 칩 이 아니라 엔비디아를 포함한 생태계를 어떻게 장악할 것인가

에 대한 이야기야. 구글은 자체 칩으로 비용을 줄이고 엔비디아 최신 칩도 받아들이고 Falcon 같은 네트워크 기술까지 붙여서 클라우드 전체를 패키지로 만들고 있어

즉 “엔비디아 vs 구글”이 아니라 “엔비디아 + 구글 + 각자 칩” 이 섞인 복합 생태계가 만들어지고 있는 거야.

그래서 관전 포인트는 이거야. 구글이 엔비디아를 이길까? 가 아니라 구글이 엔비디아를 활용하면서 얼마나 자기 마진과 통제권을 키울까?

이게 진짜 질문이야. 그리고 이 싸움은 이제 시작됐어.