미니 RDNA 아키텍쳐 모바일 화에 대해서 주저리주저리
- 흡혈귀왕
- 조회 수 843
- 2019.11.26. 18:16
흐음...
일단 팩트 트루만 놓고보자면
1. 7nmHPC Navi의 RDNA는 경우 전성비가 7nmHPC Vega20 대비 아주 유의미하게 개선된건 맞음
2. 단 여전히 엔비디아의 12nmFFN공정의 튜링 대비는 떨어지는것도 사실
흐음....일단 Navi나 Vegra20의 경우 클럭 성능을 위해서 TSMC사의 고성능 옵션인 7nmHPC 공정을 사용
하였습니다.
고밀도 옵션인 7nmFF의 경우 6.0T의 고밀도 저전력 셀을 사용하고 CPP나 Mx등도 고성능 옵션 대비 작습니다.
실제 단순 트랜지스터밀도만 놓고보면 무려 48% 정도 차이납니다.
일반적으로 단순히 노드 옵션상
고밀도는 저전력에 작은 셀이고, 고성능은 고클럭에 큰 셀입니다....
모바일 AP같은 애들은 HPC가 필요없어서 주로 고밀도 옵션의 셀로 제조되고있죠....
여기서 체크하고 넘어가야할것은 바로
1. 삼성이랑 AMD가 라이센스한 RDNA가 RDNA1인가 아니면 RDNA2인가?
2. 별도의 IP 최적화나 커스텀 없이 삼성 노드에 맞게 설계된 코어가 그대로 들어갈것인가?
두 가지입니다....
첫번째 부분에 대해 이야기하자면
1세대 RDNA는 아직 GCN에 그림자가 남아있는 아키텍쳐입니다.
2세대 RDNA2부턴 GCN을 버리고 진정한 Navi일것으로 추정되는데.....
GCN을 버리고 프론트엔드나 백엔드 최적화만으로도 전성비는 충분히 올릴수있을것으로 보입니다.
두번째 부분은
과연 IP 고대로 노드에 맞게 설계된 코어 고대로 탑재될까에 대해서 인데 이부분은 사실상 아닐 가능성이
아주아주높습니다. 삼성의 경우 사실상 연산쪽이나 센서허브 기능을 현재 NPU+DSP가 대체하고있고
비디오 촬영도 자체 MFC가 처리하고있습니다.
그런의미에서 IP가 고대로 쓰이지않고 쳐낼부분은 쳐내질겁니다.
연산 관련기능이나 비디오엔진이 그러하겠죠.....
게다가 정황상 엑시노스에 적용되는 RDNA는 최소 4nmLPE 공정내지는 3nmGAE가 될것으로
추정되는지라 결국 엑시노스에 적용되는 AMD GPU의 전성비는
기능컷팅+고밀도 셀 최적화 여부로 갈리게될것입니다.....
1세대 RDNA도 그렇고 Vega도 그렇지만 특정 클럭 스윗스팟을 넘어서 전성비가 개판나는것이지
사실 저클럭에선 나름 나쁘지않은 효율성을 보여주고있죠....(뻥안치고)
번외로 S12에 RDNA 탑재 확률은 아직은 반반이지 않을까하네요...(양념통닭도 아니고;;;;)
노트11에 달릴놈(??)은 이미 스펙이 확정된지라 노트11은 아닐테구요
아마
노트12로 갈수록 가능성은 높아질것으로 보입니다.
S12에 탑재될수도있고 아닐수도있는 그런 상황이라 아직 큰 기대는 접어두고 기다려야할듯합니다...
당장 노트11용 AP에 더 주목중이라......
<요약>
1. 7nmHPC Navi의 RDNA는 경우 전성비가 7nmHPC Vega20 대비 유의미하게 개선된건 맞음
2. 단 여전히 엔비디아의 12nmFFN공정의 튜링 대비는 떨어지는것도 사실
3. 삼성이랑 AMD가 라이센스한 RDNA가 1세대 RDNA가 아니라 2세대 RDNA일 가능성도 있음
2세대일 경우 GCN 부분이 완전빠져서 1세대와 다른 모습을 보여줄수도 있음
4. 별도의 IP 최적화나 커스텀 없이 삼성 노드에 맞게 설계된 코어가 그대로 들어갈리 없고
분명 연산관련 부분과 비디오 엔진 부분은 NPU+DSP랑 MFC가 처리하기에 컷팅이 될것으로 보임(즉 다이어트)
5. PC쪽처럼 고성능 옵션이 아닌 저전력 고밀도 옵션의 셀로 제조될것이라 사이즈는 더 작아지고
전성비는 더 개선될 여지있음 무엇보다 4nmLPE나 3nmGAE로 나올 가능성이 높음
6. S12에 RDNA의 탑재 가능성은 아직은 지켜봐야할 부분으로 보임...
7. 노트11용 AP 기대
오히려 화웨이폰은 말리달고도 겜이 상대적으로 더 잘돌아가던데요..?
정확히말하면 가끔 갤럭시에서 gpu성능에비해 과도한 프레임드랍이나
뚝뚝끊기는경우가 적다고할까요. s10만봐도 그런경우가있고..
갤럭시가 게임에서 뭔가 발열제어한다고 성능을낮추는건지
아니면 게임런처 게임옵티마이즈 이런어플떄문인지
상대적으로 못돌리더군요..
그리고 삼성말리가 유독좋은건가요?
그냥 화웨이가 여태 말리 유닛수를 적게넣은거뿐인데 -_-
기린990은 gpu유닛수 많이넣어서 s10보다 좋잖아요..?
그냥 980이전에는 gpu유닛수는 적게넣으면서 그거 커버하려고
무리하게 고클럭으로 내서 전력효율,성능 둘 다 별로였던거 뿐입니다;;;
이거.. 삼성 중급ap들도 똑같이 일어나는현상이에요
크기만 큰 똥말리가지고 어떻게든 해보려고 중급ap에
gpu유닛수 적게넣고 고클럭으로 돌리니까 중급ap따위가
스로틀링걸리고 난리나죠;; 그런거보면 삼성이라고
탈똥말리는 아닌거같습니다만
그건 어디까지나 화웨이 사정이니깐요
ARM에서 "너 특정 개수만큼 코어수 넣지마!!" 한게
아닌 이상 그들 선택이고 결과물입니다.
삼성도 말리써서 욕먹는게 자기들 선택인거처럼요...
게다가 화웨이든 삼성이든 둘이 공정 기술이 동일하지않아
노드 최적화에 따른 어드밴티지도 정확히 판단 불가입니다...
당장 9810때랑 970때 10nmFF가 10nmLPP 대비
노드도 좀더 작고 트랜지스터밀도도 더 작았지만 정작 다이에서
코어 사이즈 비교해보면 9810의 Mali-G72가 970의 Mali-G72 대비
더 작았습니다.
이렇게 노드에 맞게 코어 최적화 설계도 분명 무시 못할부분이구요...
반대로 8nmLPP 엑시9820보다 7nmFF 980의 Mali-G76이
더 사이즈가 작습니다. 대충만봐도 30% 이상이요...
이건 8nmLPP의 스탠다드셀이 메탈트랙이 8.59T이고
7nmFF가 6.0T 스탠다드셀을 써서 그렇습니다....
결국 노드별 최적화 설계에 따른 성능 부분도 고려하면
동일 IP라도 차이가 발생할수밖에 없습니다...
오 이글 올앤만에 본에요