
소식 중국 계산 알고리즘, 엔비디아 GPU 성능 800배 향상?
- BarryWhite
- 조회 수 322
- 2025.02.04. 22:07
이 알고리즘은 특히 페리다이나믹스(PD)라는 비국소 이론의 효율성을 높이는 데 초점을 맞추고 있으며, 이를 통해 재료의 파괴 및 손상 모델링 분야서 큰 진전을 이룰 수 있을 것으로 기대됩니다.
페리다이나믹스는 항공우주, 토목 공학, 군사 분야 등서 재료의 파괴를 예측하는 데 널리 사용되지만, 기존의 시뮬레이션 방식은 막대한 컴퓨팅 자원을 필요로 한다는 단점이 있었습니다. 하지만 양양 부교수 팀은 엔비디아의 CUDA 기술을 활용해 알고리즘 설계와 메모리 관리를 최적화함으써 이 문제를 해결했다고 합니다.
그 결과, 개발된 PD-General 프레임워크는 엔비디아 RTX 4070 GPU서 기존 직렬 프로그램에 비해 최대 800배나 빠른 속도 향상을 보여줬으며, OpenMP 기반 병렬 프로그램보다도 100배 더 빠른 성능을 달성했다고 합니다. 이런 성능 향상은 대규모 시뮬레이션서 수백만 개의 입자를 사용해 4,000번의 반복 단계를 5분 만에 완료하고, 고해상도 2D 단축 인장 문제서 6,985만 번의 반복을 2분 이내에 처리할 수 있는 수준입니다.
이 발전은 연구자들이 고가의 고성능 컴퓨팅 클러스터 대신 소비자 등급의 GPU를 사용해 시뮬레이션을 수행할 수 있게 해준다는 점에서 매우 중요합니다.
또, 널리 사용 가능한 GPU서 고성능 시뮬레이션을 달성할 수 있게 되면서 서방 국가의 첨단 컴퓨팅 하드웨어에 대한 의존도를 줄일 수 있다는 점도 주목할 만합니다. 특히 중국과 러시아는 현재 진행 중인 무역 제한과 제재 속서 이런 기술 발전을 통해 독자적인 연구 개발을 촉진할 수 있을 것으로 기대됩니다.
이 연구 결과는 컴퓨팅 역학 분야서 중요한 진전을 보여주는 것으로, 재료 과학, 엔지니어링, 그리고 방위 응용 분야서 더 빠르고 접근 가능한 시뮬레이션을 가능하게 할 것입니다. 연구 결과는 2025년 1월 8일 중국 전산역학 저널에 발표됐으며, 연구팀은 이런 최적화 기술이 페리다이나믹스 외에도 다른 과학적 계산 분야에서도 GPU 성능을 향상시킬 수 있을 것으로 보고 있습니다.
이 발전은 중국이 소프트웨어 최적화에 투자해 제한된 하드웨어로 더 많은 것을 달성하려는 노력으로 분석됩니다. 미국 정부의 첨단 모델 제한이 큰 의미가 없는 상황서, 소프트웨어 최적화가 새로운 대안으로 부상하고 있다고 볼 수 있습니다.
하지만, 탐스하드웨어에 따르면 전문가들은 800배라는 성능 향상 주장에 대해 비판적인 시각을 제기하고 있습니다. 그들은 직렬 프로그램과의 비교는 비현실적이며, OpenMP 기반 프로그램과의 비교 또 어떤 백엔드(CPU 또는 GPU)를 사용했는지에 따라 결과가 달라질 수 있다고 지적합니다.
또, OpenMP는 일반적으로 레거시 코드서 멀티코어 또는 GPU 가속을 위해 사용되므로, 100배의 성능 향상은 놀라운 결과가 아닐 수도 있다는 분석도 있습니다. 이에 따라, 이 연구가 GPU 컴퓨팅 수준의 표준 속도 향상인지, 아니면 새로운 알고리즘의 획기적인 발전인지에 대한 추가적인 검증이 필요하다는 의견도 있습니다.
특히, 과학 및 엔지니어링 코드서 일반적으로 사용되는 fp64가 아닌 소비자 등급의 GPU를 사용했다는 점을 들어 정밀도 관리가 중요한 혁신 요소일 수 있다는 분석도 있습니다.
