소식 AMD 라데온 7900 XTX, 최적화 통해 스테이블 디퓨전 890% 성능 향상
- 뉴스봇
- 조회 수 654
- 2023.08.20. 10:45
이번 주에 인텔과 AMD는 모두 소프트웨어 스택을 최적화하여 제너레이티브 AI의 속도를 크게 향상시켰으며, 그 결과 AMD의 RTX 7900 XTX가 제너레이티브 AI(특히 A111/X포머를 사용한 Stable Diffusion)에서 엔비디아 RTX 4080보다 달러당 성능이 더 높아졌습니다.
현재 스테이블 디퓨전(Stable Diffusion)이 SaaS가 아닌 현지화된 제너레이티브 AI의 대부분을 차지한다는 점을 고려할 때, 이는 중요한 이정표이며 마침내 NVIDIA에 경쟁 상대가 생겼습니다.
PyTorch 경로 대신 Microsoft Olive 및 DirectML을 사용하면 AMD 7900 XTX는 초당 1.87회 반복에서 초당 18.59회 반복으로 크게 향상됩니다! AMD의 자세한 가이드는 여기에서 확인할 수 있습니다. Automatic111의 이러한 성능 수준은 안정적 확산에 대한 SHARK 기반 접근 방식에 매우 근접하며, 제너레이티브 AI와 관련하여 이 회사를 확실히 지도상에 올려놓았습니다. 결과적으로 7900 XTX는 적어도 현재 가격에서는 비교 대상인 RTX 4080보다 달러당 약간 더 높은 GenAI 성능을 제공합니다(Stable Diffusion /A111에서).
스 RTX 4080 16GB(WBM 아카이브 링크는 여기)였고, 뉴에그에서 찾을 수 있는 가장 저렴한 AMD 라데온 7900 XTX는 MSI 게이밍 라데온 RX 7900 XTX 24GB(WBM 아카이브 링크는 여기)였다. 숫자를 계산하기 전에, NVIDIA와 달리 AMD 경로는 사용자가 조금 더 기술에 정통해야 한다는 점을 언급하고 싶습니다(AMD 경로는 PyTorch 대신 Microsoft Olive를 사용하며 대부분의 자동 설치 프로그램은 이에 필요한 종속성을 자동으로 설치하지 않을 가능성이 높습니다) - 따라서 편의성이 중요한 요소라면 여전히 NVIDIA를 사용하는 것이 좋습니다. 그러나 전문가와 소규모 기업은 일반적으로 비용 기반이 충분하다면 초기 설정의 번거로움을 피할 수 있으며, 여기서는 실제로 그런 것 같습니다.
GPU | MARKET PRICE | CONFIGURATION | SD PERF (IT/S) | DOLLARS SPENT PER IT/S |
NVIDIA RTX 4080 | $1099 | A111 (PyTorch) | 19.41* | $56.6 |
AMD Radeon 7900 XTX | $969 | A111 (Microsoft Olive) | 18.59 | $52.1 |
AMD Radeon 7900 XTX | $969 | SHARK | 20.76* | $46.6 |
*= data taken from Puget Systems comparison published on Jul 31, 2023. |
보시다시피, AMD 실리콘은 마침내 안정적인 확산 A111에서 4080에 비해 더 높은 가치를 제공할 정도로 GenAI에서 빛을 발하기 시작했습니다. AMD 7900 XTX는 초당 18.59회의 반복을 제공하여 사용자는 초당 52.1달러를 지불하는 반면, NVIDIA RTX 4080은 초당 19.41회의 반복을 제공하여 사용자는 초당 56.6달러를 지불합니다. 사용자가 덜 일반적인 SHARK 구현을 선택하면 Radeon 7900 XTX의 경우 초당 46.6달러까지 가치 제안을 이끌어낼 수 있습니다. 따라서 공식적으로 AMD는 제너레이티브 AI에 관심이 있는 소비자를 위한 공식적인 경쟁자입니다.
이는 또한 AMD가 조금만 더 관심을 기울인다면 엔비디아의 AI 야망에 강력한 경쟁자가 될 수 있다는 것을 의미합니다. 대부분의 사람들이 지하실에서 LLM을 실행하지는 않겠지만, 향후 12개월 이내에 GenAI와 SLM/ULM은 모든 곳에서 사용되며 많은 생산성 워크플로우의 일부가 될 것입니다. 인텔과 AMD가 엔비디아가 크게 앞서 있는 시장에서 어떻게 포지셔닝하느냐에 따라 AI가 지배하게 될 세상에서 어떻게 살아남을 수 있을지가 결정될 것입니다.
기사 더 읽기
아크도 드라이버 업데이트되면서 향상폭 크다 싶었는데 900%는 ㄷㄷ