미니 ARM. Cortex-X1과 Cortex-A78 발표
- 스퀴니
- 조회 수 654
- 2020.05.26. 22:33
ARM은 Cortex-X1과 Cortex-A78을 발표하였습니다
먼저 Cortex-A78은 아키텍처 변경, 사용 가능한 클럭 속도 향상 및 7nm에서 5nm 제조로의 전환으로 Cortex-A77보다 지속적인 성능을 20% 향상시킵니다. ARM에 따르면 2.1GHz 5nm Cortex-A78은 2.3GHz 7nm Cortex-A77보다 최대 50 % 적은 전력을 소비합니다. 이는 배터리 수명 혜택을 얻게 됩니다.
한편 Cortex-A78의 성능향상은 덜 인상적입니다. 이 수정된 마이크로아키텍처는 일반적인 상황에서 고작 7% 향상된 것에 그칩니다. 그러나 전력 소비가 4% 감소하므로 Cortex-A78이 A77 및 A76보다 보다 더 긴 피크 성능을 유지할수 있습니다.
또한 크기도 작아져 쿼드 코어 클러스터의 면적을 15% 절약 할 수 있습니다. 이를 통해 실리콘의 추가 GPU, NPU 또는 기타 구성 요소를위한 더 많은 공간을 확보하거나 가격을 낮출 수 있습니다.
마이크로 아키텍처로 본다면 Arm은 많은 중요한 변화를 경험했습니다. 우선 Cortex-A78에는 공간 절약의 대부분이 이루어지는 32kB L1 캐시 구성 옵션이 제공됩니다. Arm의 파트너는 코어 성능을 향상시키기 위해 더 친숙한 64kB L1 캐시를 선택할 수도 있습니다.
ARM은 또한 실행 유닛에 두 번째 정수 다중 유닛과 추가로드 주소 생성 유닛 (AGU)을 도입하여 데이터로드 대역폭을 50% 증가시킵니다. 또 다른 최적화로는 보다 융합 된 명령어와 명령어 스케줄러의 효율 개선, 레지스터 이름 변경 구조 및 재정렬 버퍼가 포함됩니다. 결론은 Cortex-A78이 A77보다 더 작고 최적화 된 CPU라는 것입니다.
Cortex-A78은 성능 대비 최대 효율을 목표로합니다. 배터리 수명에는 좋지만 내년에 안드로이드가 애플과의 격차를 좁히기를 희망하는 애호가에게는 그리 좋지 않습니다.
이 성능 애호가들에게는 다음 새로 나온 제품이 필요합니다
Cortex-X1 : 극한의 성능
Cortex-X1은 ARM 의 새로운 CXC 프로그램의 첫 결과물입니다. CXC를 통해 ARM의 파트너는 일반적인 로드맵에서 성능 포인트를 가져오고 이를 위해 CPU를 설계합니다. 올해의 집단적 접근은 ARM Cortex 라인업의 성능을 매우 향상시키는 것입니다.
Cortex-X1의 경우 ARM 은 Cortex-A77에 비해 성능이 30% 향상 될 것으로 예상합니다. 정수 크런칭에서 Cortex-A78에 비해 23%의 인상적인 성능을 발휘하여 까다로운 워크로드에서 확실한 승자가 될것입니다. Cortex-X1은 또한 이 두CPU의 머신 러닝 능력의 2배를 자랑합니다.
접근 방식에는 큰 변화가 있습니다. 그 빠른성능은 더 넓은 표면적과 증가된 전력소모로 발생합니다. 즉 실리콘 평방 밀리미터당 멀티 스레드 성능과 효율성이 떨어집니다. 따라서 스마트 폰 SoC가 쿼드 Cortex-X1 클러스터를 사용하지 않을 것으로 추정됩니다. 단일 Cortex-X1이 3 개의 Cortex-A78과 짝을 이룰 가능성이 높습니다. 이러한 구성은 쿼드 코어 Cortex-A76 클러스터보다 15 % 더 많은 영역을 차지하면서 단일 스레드 부스트 같은 많은 것을 제공합니다.
Cortex-X1의 목표 성능을 달성하려면 여러 가지 주요 마이크로 아키텍처 변경이 필요했습니다. 우선 코어에는 A77 및 A78보다 많은 캐시메모리가 있습니다. L2 캐시는 최대 1MB까지 가변적이며 대역폭을 두 배로하여 성능 이점을 극대화하는 반면 공유 L3 캐시는 이전 세대의 두 배인 8MB에 도달 할 수 있습니다. 흥미롭게도 Cortex-X1에는 8MB 구성을 허용하는 특정 DSU (Dynamic Shared Unit)가 포함되어 있으며 클러스터의 모든 Cortex-A78과 해당 메모리를 공유합니다.
더 큰 캐시는 더 강력한 실행 코어에 의해 보완됩니다. SIMD 부동 소수점 명령어 처리는 4x-128 비트의 대역폭으로 두 배가되어 2 배의 머신 러닝 향상을 만들어냅니다. 이 프로세서는 또한 224 개의 입력 명령으로 비 순차적 실행 윈도우를 40 % 늘렸습니다. 이는 프로세서가 한 번에 더 많은 작업을 수행 할 수 있도록 더 많은 명령 레벨 병렬 처리를 제공합니다.
https://www.androidauthority.com/arm-cortex-x1-cortex-a78-1119666/
X1 = 헤라
A78 = 허큘리스
G78 = 보르