본문 바로가기
카테고리 없음

AI 버블론, 새로운 논거로 등장한 GPU 감가상각 이슈

by 인포서비스남 2025. 11. 12.
반응형

AI 버블론, 새로운 논거로 등장한 GPU 감가상각 이슈

최근 투자 시장에서는 다시 한 번 ‘AI 버블’ 논의가 뜨겁게 떠오르고 있습니다. 이전에는 ‘순환 투자’나 ‘왼발이 오른발을 밟는 구조’라는 서사가 중심이었지만, 이번엔 GPU 감가상각(depreciation)이 새로운 논거로 등장했습니다. 즉, “AI 버블은 GPU 회계 착시다”라는 주장이 퍼지고 있는 것이죠.

AI 버블론 이미지

1️⃣ GPU 실제 사용 수명 2~3년설의 근거

이 주장은 Meta의 Llama 3 기술 보고서에서 비롯됐습니다. 보고서에 따르면 Meta는 Llama 3.1 405B 모델 훈련 시 H100 GPU 16,384개를 사용했고, 54일간 훈련 과정에서 총 466회 중단(interruption)이 발생했습니다. 그중 419회는 비계획적 장애였죠.

  • 평균 3시간마다 1회 장애 발생
  • 유효 훈련 시간은 약 90% 이상 유지

이를 바탕으로 계산하면 GPU의 연간 고장률(AFR)은 약 9% 수준이며, 3년 누적 고장률은 약 27%에 달합니다. 즉, 3년 내 GPU의 4분의 1 이상이 고장난다는 계산이 가능하다는 겁니다.

고부하 환경에서 GPU는 열 손상이 빠르게 진행됩니다. 따라서 실제 사용 수명은 2~3년 정도로 짧아질 수 있다는 추론이죠. 비슷한 예로 과거 GPU 채굴용 카드도 3년 이내에 높은 고장률을 보였습니다. 훈련과 채굴은 공통적으로 GPU를 극한 부하로 가동한다는 점에서 유사합니다.

Azure, AWS, GCP 등 주요 CSP들의 GPU 장애율은 모두 비공개입니다. 이 수치는 영업기밀에 속하기 때문입니다.

2️⃣ 그러나 몇 가지 ‘하지만’이 있다

(1) 모든 GPU 수명이 그렇게 짧을까?

Meta의 데이터에서 ‘중단 횟수’가 GPU 고장을 직접 의미하지는 않습니다. 최근에는 Validation 자동화사전 검증 시스템이 강화되면서 중단 빈도는 과거 대비 크게 줄었습니다. 이제는 하루에 몇 차례 수준으로 안정화된 셈입니다.

NVIDIA는 불량 GPU를 출하 전 단계에서 걸러내는 검증 공정을 개선했으며, 현재의 실제 연간 고장률은 6% 미만으로 추정됩니다. 즉, GPU의 내구성이 과거보다 훨씬 개선되었다는 점이죠.

(2) 훈련용 GPU와 추론용 GPU는 다르다

훈련용 GPU와 추론용 GPU는 부하 특성이 완전히 다릅니다.

  • 훈련용 GPU: 고온·고부하 환경 → 수명 짧음
  • 추론용 GPU: 부하가 낮고 온도 안정 → 수명 길음

추론용 GPU의 연간 고장률은 일반적으로 3% 이하, 일부는 2% 미만으로 보고됩니다. 따라서 클라우드 사업자들이 평균 6년 감가상각을 적용하는 것은 충분히 합리적입니다.

게다가 현재는 훈련보다 추론용 GPU 비중이 빠르게 늘고 있습니다. AI 비즈니스의 수익은 대부분 추론 단계에서 발생하기 때문이죠. 결국 GPU 전체 평균 수명은 5~6년 수준으로 보는 것이 현실적입니다.

(3) 기술 세대교체로 GPU가 조기 퇴역될까?

기술 발전 속도가 빠르다 보니 “새 GPU가 등장하면 기존 GPU가 조기 폐기되지 않느냐”는 의문도 있습니다. 하지만 실제 시장은 반대로 움직이고 있습니다.

CoreWeave CEO는 “기존 H100 GPU 임대계약이 끝나도, 새 계약은 기존 가격의 95% 수준에서 재체결됐다”고 밝혔습니다. 심지어 A100 GPU도 전량 판매 완료된 상태입니다.

즉, GPU 공급이 절대적으로 부족한 상황에서는 구형 GPU가 조기 퇴역할 가능성은 거의 없다는 뜻입니다.

3️⃣ GPU 감가상각 문제는 ‘버블’의 본질이 아니다

그렇다면 정말로 ‘AI 버블’의 근본 원인이 GPU 감가상각일까요? 그보다는 AI 산업 구조의 본질적 변화를 이해해야 합니다.

  • 인터넷 시대: 인프라와 애플리케이션이 분리 → 인프라 과잉
  • AI 시대: 애플리케이션이 인프라를 견인 → 인프라 부족

즉, AI는 인프라와 응용이 동시 확장되는 구조입니다. AI 서비스 수요가 늘면 클라우드, 데이터센터, 반도체, 전력까지 모두 연쇄적으로 수요가 폭증합니다.

실제로 CoreWeave의 주문잔량(backlog)은 30억 달러에서 55억 달러로 급증했습니다. 대형 CSP들의 미인식 수익(RPO) 또한 빠르게 늘고 있죠. 현재 GPU, 전력, 데이터센터 모두 2026년 생산분까지 매진 상태입니다.

4️⃣ 버블이 생길 수 있는 유일한 지점은 ‘애플리케이션’

아이러니하게도 진짜 버블은 AI 애플리케이션(App) 영역에서 발생할 가능성이 큽니다. 즉, 기술 발전이 예상보다 느려서 매출이 기대만큼 성장하지 못할 때 버블이 현실화된다는 것입니다.

AI 에이전트(Agent)의 발전 속도가 더딘 이유 중 하나는 여전히 연산력(Compute) 부족에 시달리고 있기 때문입니다. 결국 이 부족을 해소하기 위해 기업들이 GPU와 클라우드 투자를 무리하게 늘리고, 수익성이 떨어진 애플리케이션 기업이 먼저 도산할 가능성이 높습니다.

즉, 이번 버블은 인터넷 버블과 정반대로 인프라가 아닌 애플리케이션 기업부터 무너질 수 있다는 것이죠.

 

5️⃣ ‘누가 부채를 지고 있나’를 보면 버블의 위치가 보인다

  • 인터넷 버블: 부채는 인프라 기업이 지고, 수익은 앱 기업이 가져감
  • AI 버블: 부채와 가치 포착이 모두 애플리케이션·클라우드 쪽에 집중

하지만 만약 OpenAI, Anthropic 등 핵심 플레이어들이 향후 3년간 연매출을 3~9배 성장시키고, GPU·전력·데이터센터의 초과수요가 5년 이상 지속된다면 이것은 단순한 버블이 아니라 지속 가능한 성장 구조일 수도 있습니다.

💡 결론: 연산력은 ‘시간’을 빌려주는 존재

AI 산업의 본질은 연산력(Compute)에 있습니다. 연산력은 시간을 빌려주는 존재이며, 그 시간은 성장(Growth)으로 갚아야 합니다.

갚지 못하면 그것은 버블이 되고, 갚아내면 그것은 문명을 밝히는 새로운 등불이 됩니다.

즉, AI 산업의 현재는 단순한 거품이 아니라 ‘시간을 빌린 성장 실험’이라 할 수 있습니다. 그리고 그 실험의 결과는 향후 3년 안에 명확히 드러날 것입니다.

출처:   https://x.com/fi56622380/status/1988179489772499338?s=20

 

 

 

2026년 주식 산업 연간 전망

 

2026년 주식 산업 연간 전망

2026년 주식 산업 연간 전망 목차2026년 산업 연간전망 — 섹터별 핵심 리포트로 빠르게 이동합니다.2026년 반도체 산업전망: 슈퍼사이클의 서막2026년 전기전자 산업전망: AI가 여는 새로운 성장 사

bybluetrain.com

워런 버핏의 마지막 주주서한

 

워런 버핏의 마지막 주주서한

워런 버핏의 마지막 주주서한 변역버크셔 해서웨이 주식회사보도자료즉시 배포용 – 2025년 11월 10일, 오마하, 네브래스카오늘 워런 E. 버핏(Warren E. Buffett)은 A주 1,800주를 B주 2,700,000주로 전환하

bybluetrain.com

 

 

주식 투자 정보 연구소

 

finance.thesmileinfo.com

 

 

최신 지원금 - 정부지원금 찾기

나이와 지역을 선택하여 받을 수 있는 정부지원금을 쉽게 찾아보세요. 최신 정부지원금 정보를 실시간으로 제공합니다.

support.thesmileinfo.com

 

 

 

반응형