News

2024-05-02

[Ai EXPO 2024] 無소음 머신러닝 솔루션 공개, 핵심은? 액침냉각. 웰메이드시스템 (잘컴) 이희제 과장

공랭 대비 우월한 쿨링 기술 '수랭 그리고 액침냉각'

인공지능(Ai), 머신러닝(ML), 딥러닝, 빅데이터 등 24년 지금 현대 공학기술의 총아라 불리는 기술이다. 핵심은 더 빠른 컴퓨팅 파워. 인류가 증기기관을 발명한 이후 가장 빠른 진화를 거듭하는 시대로 불리지만, 결정적인 선결과제가 있다. 발전을 가로막아 제동을 거는 복병 '바로 발열'이다.
고도화하는 반도체는 성능 상승과 맞물려 전력 소모량이 증가하고 덕분에 필연적으로 발열을 수반한다. 식혀주기 위한 쿨링 솔루션이 실과 바늘처럼 따르지만 제한된 면적을 꽉꽉 채운 하드웨어가 유체공학에 기반한 저항에 가로막히지 않고 열이 외부로 발산함을 목표로 풍량을 극대화할수록 마찰에 의한 소음도 제곱수로 커진다.
사무 환경과 분리된 IDC를 운영하고 있다면 대수롭지 않지만 그게 아닌 근거리에서 GPU 머신이 돌아가는 연구소나 대학교 혹은 서비스 환경이라면 온종일 '윙윙' 거리는 소음만큼 머리 아플 일도 없다. 하루 24시간 1년 365일.. 회전하면서 발생하는 굉음은 맨 정신으로 감당할 수준을 뛰어넘기 때문. 그렇다고 장비 없이는 되는 것도 없다.
그렇다면 해결책은? 웰메이드컴퓨터 (잘컴)가 Ai EXPO 2024에 나온 이유다.
img
▲ 자체 디자인한 워터블록을 적용 RTX4090 그래픽카드 7장으로 구성한 ML 서버. 전면에는 소형 컴퓨터(라즈베리파이)를 이용해 개발한 실시간 모니터링 디스플레이가 부착됐다.
크게 두 가지를 내세웠다. 물을 사용하는 수랭 그리고 특수처리한 용액을 이용한 액침 냉각(Liquid Immersion Cooling)이다. 수랭은 가장 대중적이며 어느 정도 검증된 방식이지만 영역이 일반적인 PC 기반에 머무르고 있다. 보통 하루 12시간 이내의 사용성을 목표로 설계되고 내구성도 그게 걸맞게 보증한다. 하지만 ML 솔루션은 1년 365일 구동되는 경우도 허다하고, 연산을 시작하면 풀로드가 걸리기에 기밀성도 유지되어야 한다.
전시한 ML 솔루션에는 RTX 4090 그래픽카드 7장이 들어갔다. RTX 4090 수정 쿨러는 슬롯 3개를 차지할 정도로 두껍지만 웰메이드컴퓨터는 슬롯 1개 두께로 높이를 낮췄다. 자체 디자인한 워터블록을 사용해 발열을 냉각하고 동시에 두께를 낮춰 7장 그래픽카드를 설치했다. 라디에이터는 65T 두께에 480mm 제품이다. 팬 8개를 장착해 RTX 4090 그래픽카드 7장이 내뿜는 엄청난 발열을 효과적으로 대응한다.
결정적으로 조용하다. 더구나 현장에 설치한 시스템은 풀 부하로 가동하는 상태임에도 팬 회전수가 최대 3000 RPM을 넘지 않기에 무척 조용하다는 것이 회사 측 설명이다. 여기에 완제품 서버 대비 30% 저렴한 가격을 내세워 비용 경쟁력까지 사수했다. ML 수요가 계속되는 대학이나 연구소에서 꾸준히 납품하는 회사의 결과물이라는 점도 주목할 수 있다.
img
▲특수처리한 용액을 이용한 액침 냉각(Liquid Immersion Cooling)적용 ML 서버
두 번째는 특수처리한 절연유를 이용한 액침 냉각(Liquid Immersion Cooling) 시스템이다. 쉽게 말해 하드웨어를 용액에 담그면 그 자체로 냉각이 이뤄지는 방식이다. 기성 솔루션이 42U에 설치하는 형태로 출시되고 있지만 웰메이드컴퓨터 (잘컴)는 이 또한 커스텀으로 디자인해 일반적인 시스템의 크기에 적용할 수 있게 했다.
동일 서버밀도에서 냉각용량을 극대화 가능한 방식이며, 동시에 점성이 있는 절연유 특성상 휘발하지 않기에 밀봉하지 않아도 된다 설계 유연성까지 확보했다. 또한, 절연유 속에 황이 없어서 기판에 부식이 없으며, 최대 5만 볼트 대응 쿨링용량으로 현존하는 솔루션에 모두 적용할 수 있다. 결정적으로 최대 15년 워런티를 보장한다. 이러한 특징으로 인해 공랭 혹은 수랭 쿨링 솔루션 대비 경쟁력이 월등한 기술이라는 것.
한국 ML 시장에서는 이제야 등장한 냉각 방식이지만 미국 등지에서는 수요가 많고 내구성이 우수해 기존 공랭 혹은 수랭을 대체하는 방식으로 뜨고 있다는 설명이다. 현장에는 용액에 하드웨어를 담근 상태에서 가동하는 모습을 보여주고 있지만, 이렇게 하기 위해 단지 통에 용액을 가득 채워 담그는 것이 아닌 용액의 성질에 반응하지 않는 호스를 사용하는 등 전문 업체를 통해 도입해야 하는 이유도 설명했다.
굉장히 신기한 냉각 솔루션으로 그치는 것이 아닌 자체 개발한 모니터링 솔루션도 선보였다. 라즈베리파이를 이용한 ML 머신 모니터링 솔루션이다. 시스템에 S/W를 설치하고 모니터링하는 것이 아닌 별도 소형 컴퓨터(라즈베리파이)를 연결해 실시간으로 모니터링해 시스템 상태를 안내하는 솔루션이다. 이 또한 웰메이드컴퓨터 (잘컴)가 자체 개발한 것으로, 특수 용도에 사용하는 시스템인 상태 체크가 중요하다는 점에서 개발했음을 안내했다.
◆ 관련기사
딥러닝 솔루션도 핸드메이드! 웰메이드컴퓨터 박창범 대표
분업화로 경쟁력 UP! 웰메이드컴퓨터 박창범 대표· 김광묵 과장
----
By 김현동 에디터 Hyundong.kim@weeklypost.kr
〈저작권자ⓒ 위클리포스트, 무단전재 및 재배포 금지〉
웰메이드 로고웰메이드 로고

[본사] 서울특별시 용산구 원효로 164, 씨모어 201호 [제1공장] 서울특별시 용산구 새창로45길 78, 301호(신계동,진성빌딩) Copyright ⓒ Wellmade Computer T. 02-706-4799

유튜브 로고유튜브 로고