카카오, GPU 인프라 구축 순항… 안산 데이터센터서 84% 완료

GPU 인프라 구축이 진행 중인 카카오 데이터센터 안산 전경. 카카오 제공

 

카카오가 정부로부터 제공 받은 그래픽처리장치(GPU)를 기반으로 최신 GPU 인프라를 구축 중이라고 29일 밝혔다.

 

정부는 인공지능(AI) 3대 강국 도약이라는 목표 아래 글로벌 빅테크 엔비디아의 GPU를 민간에 지원하는 국책 사업을 펼치고 있다. 지난 8월 사업자로 선정된 카카오는 총 2424장의 GPU를 확보, 이를 5년간 위탁 운영하며 국내 AI 연구 및 개발 환경을 지원할 계획이다.

 

해당 인프라는 경기 안산시의 ‘카카오 데이터센터 안산’에 구축 중이다. 한양대 에리카 캠퍼스 안에서 2024년 1월부터 가동 중인 해당 데이터센터는 연면적 4만7378㎡이며 랙 4000개 서버 10만 대 이상을 보관할 수 있다.

 

카카오 측은 “현재 전체 할당량의 약 84%에 해당하는 255노드(GPU 2040장)의 인프라 구축을 완료했다. 이는 당초 제출했던 연내 구축 목표치인 64노드 대비 4배를 상회하는 규모”라며 “데이터센터 안산의 인프라 역량과 GPU 클러스터 구축 및 운영 노하우를 바탕으로 당초 계획 대비 구축 일정을 앞당길 수 있었다”고 설명했다.

 

실제 데이터센터 안산은 고집적(高集積) 서버 운영에 필수인 안정적 전력 공급 시스템과 냉각 시스템을 선제적으로 마련했다. 특히 고성능 GPU 서버에서 발생하는 열을 효과적으로 관리하기 위해 뜨거운 공기를 격리해 냉각 장치로 바로 순환시키는 밀폐 시스템인 ‘열복도 밀폐시스템(Hot Aisle Containment System)’을 적용했다.

 

아울러 카카오는 인프라 제공뿐만 아니라 이용자가 AI 모델 개발에 집중할 수 있는 소프트웨어 환경도 지원한다. 국가 AI 컴퓨팅 자원 지원 포털과 연동된 통합 플랫폼을 통해 이용자가 포털에서 카카오엔터프라이즈가 운영하는 카카오클라우드로 손쉽게 진입할 수 있도록 했으며, 카카오클라우드의 AI 플랫폼인 쿠브플로우(Kubeflow)를 제공한다. 쿠브플로우는 클라우드 네이티브 환경에서 보다 쉽고 빠르게 머신러닝 워크플로우를 구축하고 실행할 수 있다.

 

김세웅 카카오 AI시너지 성과리더는 “대규모 GPU 인프라를 안정적으로 구축하고 운영하는 것은 AI 경쟁력의 핵심”이라며 “데이터센터 및 클라우드 역량을 바탕으로 안정적이고 효율적인 AI 개발 환경을 제공해 국내 AI 생태계 발전에 기여하겠다”고 말했다.

 

현재 회사는 구축을 완료한 255노드에 대해 네트워크 및 성능 테스트를 진행 중이며, 내년 1월 2일부터 과학기술정보통신부와 정보통신산업진흥원이 베타서비스 공모를 통해 선정한 산·학·연 과제에 최신 컴퓨팅 자원을 제공할 예정이다.

 

박재림 기자 jamie@segye.com

[ⓒ 세계비즈앤스포츠월드 & segyebiz.com, 무단전재 및 재배포 금지]