Blog_Post_Radioss-Azure_April2020


Radioss는 HyperWorks Unlimited Virtual Appliance에서 솔버의 일부로 제공됩니다.
HWUL 무료체험판을 등록하시려면 여기를 클릭하십시오.

* 이번 포스팅은 클라우드 파트너인 Microsoft Azure와 공동으로 작성되었습니다.

충돌 시뮬레이션은 자동차 제조업체에게 고가의 물리적 충돌 테스트를 대신하는 수단이며, 궁극적으로 생명을 구하는데 큰 도움이 됩니다. 널리 사용되는 Radioss는 충돌성, 에어백 성능 및 복잡한 변수들을 포함해 멀티피직스이면서 고도의 비선형적이고 계산 집약적인 문제에 대해 구조 해석을 수행합니다.

차량 제조업체는 Radioos를 사용하여 설계를 세밀하게 수정하고, 빠른 기능을 활용해 더 짧은 시간 내에 더 많은 설계를 해서 제품 출시 기간을 단축시킵니다.

클라우드에서의 충돌 시뮬레이션

고성능 컴퓨팅(HPC)에 대한 수요가 증가함에 따라 클라우드는 사내 컴퓨팅 리소스의 인기 있는 대안이 되었습니다. 알테어는 최근 Radioss로 우수한 성능 결과를 달성하기 위해 Microsoft Azure와 협력했습니다.

Radioss의 성능 저하 없이 Azure에서 최대 64개의 노드로 확장되었고, 결과적으로 온-프레미스 시스템에서 운영한 것과 비슷했습니다.

클라우드는 사내 리소스가 제한된 고객에게 매력적인 옵션입니다. Azure와 같은 클라우드 컴퓨팅 리소스를 사용하면 이론적으로 애플리케이션 확장성 및 잠재적 작업 크기 측면에서 제한이 없습니다.

시간 제약이 있는 사용자는 클라우드의 더 많은 노드에 액세스하여 더 빠른 결과를 얻을 수 있으며, 사내 데이터 센터를 보유한 조직은 클라우드로 이동하여 더 많은 모델을 실행하고 더 빨리 작업을 완료할 수 있습니다.

Azure의 기술

Azure의 Radioss는 대규모 작업과 시간에 중요한 워크로드를 위해 최신 Intel 프로세서 및 고속 InfiniBand™ 인터커넥트에 액세스할 수 있도록 지원하므로, 기업은 대규모 초기 자본을 투입하지 않고도 바로 사용할 수 있습니다.

사용자는 Azure HC 시리즈에서 최대 13,200개의 코어가 필요한 작업을 실행할 수 있습니다. 이러한 VM(가상 머신)은 강력한 Intel® Xeon® Platinum 프로세서와 100기가비트 InfiniBand 인터커넥트를 갖추고 있어 가장 강력한 슈퍼컴퓨터에 필적하는 베어 메탈 성능을 제공합니다.

우리가 실행한 벤치마크에 사용된 클라우드 아키텍처는 HPC에 최적화된 Azure HC44rs 인스턴스입니다. 노드 구성은 인스턴스당 2.7GHz의 코어 44개와 코드당 8GB 메모리(인스턴스당 352GB)를 갖춘 Intel Xeon Platinum 8168 프로세서입니다.

이 시스템에는 고속 로컬 스토리지(700GB SSD)도 포함되어 있습니다.

Radioss 최적화

최고의 성능으로 Radioss 설정을 최적화하기 위해 I/O 병목 현상을 방지하는 로컬 SSD 스토리지를 사용하는 것이 중요하다고 강조했으며, 우수한 확장성을 유지하기 위해 Hybrid MPI 및 OpenMP를 사용했습니다.

Pure MPI는 최대 16개의 인스턴스까지 우수한 성능을 제공하지만, 코어당 10,000개 미만의 요소를 가진 32 및 64노드 인스턴스에는 하이브리드가 더 효과적이라는 것이 입증되었습니다.

Radioss는 MPI 도메인 분해, OpenMP 병렬화 및 AVX512 벡터화를 사용하는 높은 하이브리드 병렬 코드입니다. 향상된 성능으로 대규모 HPC 클러스터에서 고효율을 얻을 수 있으며 MPI 튜닝 및 OpenMP 설정이 가능합니다.

Radioss는 강력한 솔버로, 병렬로 정확한 반복성과 더불어 이중 정밀도(기본값) 또는 확장된 단일 정밀도를 제공합니다.

벤치마크 결과

우리가 실행한 벤치마크는 시속 50km의 Ford Taurus 정면충돌 시뮬레이션이었는데, 1000만 개의 원소와 2.5mm 메시 크기의 정교한 모델을 사용했습니다. 전체 실행 시뮬레이션 시간은 120ms(확장성 테스트의 경우 2ms)였습니다.

figure-1-1

아래의 “성능 테스트” 그래프는 2ms의 시뮬레이션 시간 단축 동안 수행된 한 인스턴스 (44 코어)에서 64 인스턴스 (2,816 코어)까지의 확장성 테스트 결과를 보여줍니다.

2ms 시뮬레이션을 완료하는 데 필요한 중앙 처리 장치 (CPU)의 경과 시간은 단일 인스턴스를 사용하는 경우 3,535 초에서 64개의 인스턴스를 사용하는 경우 163초로 거의 22배 감소했습니다.

이 모델 크기의 경우 속도 향상은 최대 16개의 인스턴스 (704 코어)까지 준선형으로 유지됩니다. 32 및 64 인스턴스에서 CPU 코어당 계산할 로컬 요소 수가 10,000 개 미만으로 떨어지면 효율성이 떨어지며, 이는 고급 CPU에서 충분한 병렬 처리를 유지하기에 좋은 지점입니다.

MPI 및 OpenMP를 기반으로 하는 하이브리드 병렬화는 솔루션 개발 시간을 더욱 단축시키는 데 도움이 됩니다.

figure-2

아래의 “스피드 업” 그래프는 Azure와 동급 최강의 슈퍼 컴퓨터에서 얻은 일부 결과 간의 확장성 곡선을 비교하는 것이며 거의 차이가 없음을 보입니다. 즉, Azure 클라우드에서 달성할 수 있는 확장성 수준은 최고의 베어 메탈만큼 우수합니다.

figure-3

애자일 컴퓨팅의 미래

Azure에서 Radioss가 효율적으로 실행되고 베어메탈 클러스터에 버금가는 높은 노드 수에서 확장성을 제공하므로 사용자는 클라우드 기술을 최대한 활용하고 사내 리소스에서 최대한 신속하게 결과를 얻을 수 있습니다.

Azure는 민첩한 컴퓨팅을 위한 성능과 유연성을 제공하며, 사용자는 원격 시각화 도구를 비롯하여 PBS Works 제품군을 통해 배포의 불편함을 줄일 수 있습니다.

Radioss에서 발견한 우수한 확장성을 통해 솔루션 구현 시간을 대폭 단축하고 Azure에서 대규모 충돌 시뮬레이션 분석 및 설계 최적화를 실행하는 제품 혁신 속도를 높일 수 있습니다. 또한 기업은 예산 지출을 자본 비용(CapEx)에서 운영 비용(OpEx)으로 전환할 수 있습니다.

클라우드의 성능과 확장성을 통해 아이디어에서 결정, 실행까지 가속화되고 많은 온-프레미스에서 가능한 것보다 더 빠르게 실행될 수 있습니다.

마이크로소프트는 최근 Azure HBv2 시리즈 가상 머신을 발표하여 최대 4개의 이중 정밀도와 8개의 단일 정밀 테라 플롭을 지원하므로 클라우드에서 훨씬 더 인상적인 애플리케이션 성능을 기대할 수 있습니다.

원문은 여기에서 확인하실 수 있습니다.

감사합니다.
한국알테어