[태그:] #AI인프라

  • [2026.04.11 IT 리포트]SKT·Arm·리벨리온, AI 추론 인프라 공동 개발: 미래 데이터센터 혁신을 겨냥하다

    SKT·Arm·리벨리온, AI 추론 칩 개발

    1. 개요

    SK텔레콤(SKT), 글로벌 반도체 설계 기업 Arm, 그리고 국내 AI 반도체 스타트업 리벨리온이 AI 데이터센터 인프라 고도화를 위해 전략적 파트너십을 체결하였습니다. 이들은 AI 추론(inference)에 특화된 서버 솔루션을 공동 개발하고, 이를 SKT의 AI 데이터센터에서 실증할 계획입니다 . 이번 협력은 AI 산업의 패러다임이 ‘학습(training)’에서 ‘추론’으로 이동하는 가운데 이루어졌으며, 전력 효율과 비용 경쟁력을 극대화하는 데 초점을 맞추고 있습니다 .


    2. 협력 배경

    2.1 AI 산업의 변화

    최근 몇 년간 AI 산업은 대형 언어 모델(LLM) 개발과 학습에 많은 자원을 투입해왔습니다. 그러나 이제는 학습을 넘어 실제로 서비스를 구동하는 추론 단계의 중요성이 커지고 있습니다 . 추론은 365일 24시간 계속되어야 하는 작업으로, 전력 소모와 운영 비용이 큰 문제로 대두되고 있습니다 . 기존에는 GPU가 주로 사용되었으나, 이는 반복적이고 가벼운 추론 작업에는 오히려 과도한 전력을 소모하고 비용이 높다는 한계가 존재합니다 .

    2.2 효율적인 인프라의 필요성

    따라서 업계에서는 전력 효율이 높으면서도 비용 경쟁력을 갖춘 새로운 인프라가 필수적이라는 인식이 확산되고 있습니다 . 이에 따라 AI 추론에 특화된 NPU(신경망처리장치)와 범용 처리에 강한 CPU(중앙처리장치)를 결합한 ‘이종 컴퓨팅(heterogeneous computing)’ 구조가 주목받고 있습니다 .


    3. 공동 개발 솔루션의 특징

    3.1 Arm AGI CPU와 리벨카드 결합

    Arm AGI CPU는 Arm이 35년 역사상 처음으로 직접 생산하는 데이터센터용 프로세서로, AI 추론 서비스에 최적화되어 있습니다 . 리벨리온의 리벨카드(RebelCard™)는 대규모 AI 추론 작업에 특화된 NPU로, 두 칩을 하나의 서버에 통합함으로써 시스템 전체의 효율성을 극대화할 수 있습니다 .

    3.1.1 이종 컴퓨팅 구조

    • CPU: 데이터 입출력, 네트워크 통신, 메모리 관리 등 범용 작업을 총괄합니다.
    • NPU: AI 추론 연산을 전담하여 빠르고 효율적인 처리를 지원합니다.

    이러한 구조는 기존 GPU 중심의 시스템보다 낮은 전력 소모와 운영 비용으로 동일하거나 더 우수한 성능을 제공할 것으로 기대됩니다 .

    3.2 실증 및 적용 계획

    SKT는 개발된 솔루션을 자사의 AI 데이터센터에 적용하여 성능과 안정성을 검증할 계획입니다 . 또한, 자체 개발한 AI 파운데이션 모델인 ‘A.X K1’을 해당 서버에서 운영하는 방안도 적극적으로 검토 중입니다 .


    4. 기대 효과 및 시장 영향

    4.1 저전력·고효율 인프라 확보

    이번 협력을 통해 SKT는 저전력·고효율의 AI 추론 인프라를 확보하게 되며, 이는 앞으로 AI 데이터센터 사업의 경쟁력을 크게 높일 것입니다 . 특히, 전력 효율이 곧 운영 비용과 직결되기 때문에, 새로운 서버 아키텍처는 데이터센터 운영에 있어 획기적인 변화를 가져올 것으로 예상됩니다 .

    4.2 업계 선례로서의 의의

    SKT, Arm, 리벨리온 간의 협력은 엔비디아 GPU 중심이던 기존 생태계에서 벗어나 CPU와 NPU를 결합한 새로운 방식을 도입하는 첫 사례가 될 것으로 평가됩니다 . 이는 향후 AI 인프라 시장에서 다양한 칩셋 조합과 기술 혁신을 촉진할 수 있는 중요한 전환점이 될 것입니다.


    5. 각 사의 입장 및 전망

    • SK텔레콤: “추론에 최적화된 인프라와 독자 파운데이션 모델 A.X K1을 결합한 풀 패키지를 제공함으로써 AI 데이터센터 경쟁력을 더욱 강화해 나가겠다.”고 밝혔습니다 .
    • Arm: “AI 추론 수요가 급속하게 증가함에 따라, 대규모 배포에 최적화된 데이터센터 인프라가 중요해지고 있다.”며 이번 협력의 의미를 강조했습니다.
    • 리벨리온: “리벨카드와 풀스택 소프트웨어 경쟁력을 바탕으로 차세대 AI 데이터센터를 지탱하는 핵심 축이 될 것”이라고 자신감을 나타냈습니다.

    6. 인포그래픽 제안

    아래는 이번 SKT·Arm·리벨리온 협력의 핵심 내용을 시각적으로 정리한 인포그래픽 예시입니다.

    Screenshot
    주요 특징
    
    Arm AGI CPU + 리벨카드 NPU 결합
    이종 컴퓨팅 아키텍처 적용
    전력 효율 및 운영 비용 절감
    A.X K1 모델 운영 검토
    
    시장 영향
    
    GPU 중심 생태계에서 벗어난 새로운 대안 마련
    저전력·고효율 인프라 확산 기대
    AI 데이터센터 경쟁력 강화

    7. 결론

    SKT·Arm·리벨리온의 이번 협력은 AI 산업의 패러다임 변화에 발맞춰, 효율적이고 경쟁력 있는 추론 인프라를 구축하기 위한 중요한 시도입니다. CPU와 NPU를 결합한 새로운 서버 아키텍처는 향후 데이터센터 운영 방식에 큰 변화를 가져올 것으로 기대되며, 이는 궁극적으로 AI 서비스 제공의 비용과 환경 부담을 줄이는 데 기여할 것입니다. 이러한 혁신은 국내외 IT 업계에도 긍정적인 영향을 미쳐, AI 인프라 시장의 다변화와 발전을 앞당길 것으로 보입니다.


    용어집

    • AI 추론(Inference): 학습된 인공지능 모델이 실제 데이터를 기반으로 판단하거나 예측하는 과정으로, 실시간 서비스 제공의 핵심이다. AI 산업 패러다임에서 학습(training) 중심에서 추론 중심으로 무게중심 이동이 일어나고 있다.
    • NPU(Neural Processing Unit): AI 추론 작업에 최적화된 특수 하드웨어 프로세서로, GPU 대비 전력 효율이 뛰어나고 데이터 입출력과 AI 연산을 효과적으로 처리하는 이종 컴퓨팅 아키텍처의 핵심 구성 요소이다.
    • 이종 컴퓨팅 아키텍처(Heterogeneous Computing Architecture): 서로 다른 종류의 프로세서(CPU, NPU 등)를 결합하여 각 장치가 가장 적합한 작업을 분담함으로써 성능과 전력 효율을 극대화하는 컴퓨팅 구조이다.
    • Arm AGI CPU: Arm이 설계 및 직접 생산한 최초의 데이터센터용 CPU로, AI 추론 워크로드에 최적화된 Neoverse CSS V3 아키텍처를 기반으로 높은 에너지 효율과 낮은 전력 소비를 구현한다.
    • 리벨리온 리벨카드(Rebellion RevelCard): 리벨리온이 개발한 4개의 NPU 칩렛과 5세대 고대역폭메모리(HBM3E)를 결합한 AI 추론 가속기 모듈로, 페타플롭스급 연산능력을 갖추고 기존 GPU 대비 최대 40~50% 낮은 전력 소모를 실현한다.
    • 페타플롭스(PetaFLOPS): 초당 1,000조(10^15) 부동소수점 연산을 처리할 수 있는 컴퓨팅 성능 단위로, AI 대규모 연산 처리 능력을 평가하는 척도이다.
    • PoC(Proof of Concept, 기술실증): 새로운 기술이나 시스템이 실제 환경에서 정상 작동하는지 성능, 안정성 등을 검증하는 초기 실증 단계이다.
    • AI 파운데이션 모델(Foundation Model): 대규모 데이터로 학습되어 다양한 AI 응용에 활용될 수 있는 범용 인공지능 모델로, SKT의 ‘A.X K1’이 대표적 사례이다.
    • PER(Price Earnings Ratio, 주가수익비율): 주가를 주당순이익으로 나눈 값으로, 기업의 수익 대비 주가 수준을 평가하는 대표적인 재무 지표이다.
    • PBR(Price to Book Ratio, 주가순자산비율): 주가를 주당순자산가치로 나눈 비율로, 기업의 자산 대비 시장 가치를 나타내는 지표이다.
    • EBITDA(Earnings Before Interest, Taxes, Depreciation, and Amortization): 이자, 세금, 감가상각비 차감 전 영업이익으로, 기업 실질적인 영업 수익성과 현금 창출 능력을 평가하는 재무 지표이다.
    • TCO(Total Cost of Ownership, 총소유비용): 제품 또는 시스템의 구매부터 운영, 유지 보수, 폐기까지 발생하는 총 비용으로, AI 데이터센터 운영비용 평가 시 중요한 척도이다.
    • HBM3E(High Bandwidth Memory 3E): 고대역폭 특성을 가진 최신 메모리 기술로, AI 연산에 필요한 대량 데이터의 빠른 입출력을 지원한다.
    • 소버린 AI 인프라(Sovereign AI Infrastructure): 한 국가나 지역이 독자적으로 구축·운영하는 AI 추론 인프라로, 데이터 주권 및 보안 측면에서 중요한 의미를 가진다.
    • 에너지 효율성(Energy Efficiency): 주어진 작업량을 처리하는 데 소비되는 에너지의 효율성으로, AI 추론 인프라의 핵심 경쟁력 요소 중 하나이다.