엔비디아가 13일 일본에서 ‘엔비디아 AI 서밋 재팬’을 열고 소프트뱅크와 함께 세계 최초로 ‘AI-RAN’ 시범 서비스를 실증했다고 밝혔다. AI-RAN은 하나의 장비로 인공지능(AI) 및 5세대(5G) 통신 서비스를 동시에 제공하는 솔루션이다.

소프트뱅크는 가나가와 현에서 실시한 실외 실험을 통해 엔비디아 가속 AI-RAN 솔루션이 캐리어급 5G 성능을 달성했으며, 네트워크의 초과 용량을 사용해 AI 추론 워크로드를 동시에 실행할 수 있음을 입증했다고 설명했다.

기존 통신사 네트워크는 피크 부하를 처리하도록 설계돼 평균 해당 용량의 3분의 1만 사용했다. 이제 통신사는 AI-RAN이 제공하는 공통 컴퓨팅 기능을 통해 나머지 3분의 2 용량을 AI 추론 서비스를 위해 수익화할 수 있을 것으로 예상된다.

엔비디아와 소프트뱅크는 통신 사업자가 새로운 AI-RAN 인프라에 1달러의 자본을 투자할 때마다 약 5달러의 AI 추론 수익을 얻을 수 있을 것으로 예상하고 있다. 운영 비용과 자본 비용을 고려할 때 소프트뱅크는 인프라에 추가하는 모든 AI-RAN 서버에 대해 최대 219%의 수익을 달성할 수 있을 것으로 보고 있다.

소프트뱅크는 이번 실험에서 엔비디아 AI 엔터프라이즈를 사용해 자율주행 자동차 원격 지원, 로보틱스 제어, 엣지에서의 멀티모달 검색 자동 생성을 포함한 실제 AI 추론 애플리케이션을 구축했다. 모든 추론 워크로드는 소프트뱅크의 AI-RAN 네트워크에서 최적으로 실행될 수 있었다.

소프트뱅크의 완전 소프트웨어 정의 5G 무선 스택은 엔비디아의 AI 컴퓨팅 플랫폼에 최적화돼 있다. 아울러 소프트뱅크가 엔비디아 에리얼 쿠다 가속 RAN 라이브러리를 기반으로 강화한 L1 소프트웨어가 포함된다. 소프트뱅크는 기존 5G 네트워크 인프라보다 40% 적은 전력을 사용할 수 있는 엔비디아 에리얼 RAN 컴퓨터-1 시스템을 향후 자사 솔루션에 통합할 계획이다.

또한 엔비디아는 소프트뱅크가 엔비디아 AI 엔터프라이즈 소프트웨어를 사용해 로컬 보안 AI 컴퓨팅에 대한 수요를 충족할 수 있는 AI 마켓플레이스를 구축할 계획이라고 발표했다. 소프트뱅크는 세계 최초로 엔비디아 DGX B200 시스템을 공급 받을 예정이다.

젠슨 황 엔비디아 최고경영자(CEO)는 “일본은 전 세계에 영향을 미치는 기술 혁신을 선도해온 오랜 역사를 갖고 있다. 소프트뱅크가 엔비디아의 풀스택 AI, 옴니버스, 5G AI-RAN 플랫폼에 대한 막대한 투자를 함으로써 일본은 AI 산업 혁명의 글로벌 리더로 도약하고 있다”며 “일본은 통신, 교통, 로보틱스, 의료 산업 전반에 걸쳐 새로운 성장의 시대를 주도해 AI 시대에 인류에게 큰 혜택을 제공할 것”이라고 말했다.

소프트뱅크 사장 겸 CEO인 미야카와 준이치는 “전 세계 국가와 지역이 사회와 경제 성장을 위해 AI 도입을 가속화하고 있으며, 사회는 중대한 변화를 겪고 있다. 소프트뱅크는 엔비디아와의 오랜 협력을 통해 이러한 변화를 최전선에서 주도하고 있다”며 “매우 강력한 AI 인프라와 AI를 위한 5G 네트워크를 재창조하는 새로운 분산형 AI-RAN 솔루션 ‘아이트라스(AITRAS)’를 통해 일본 전역과 전 세계에서 혁신을 가속화할 것”이라고 밝혔다.

By 진 김