로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

미니 m1 텐서플로우 테스트

  • idsr
  • 조회 수 2354
  • 2021.08.10. 13:46

맥os 용 텐서플로우가 기존에 알파 버전으로 공개 되었는데 12 베타로 넘어가면서 정식 공개 되었습니다.

 

기존:

https://github.com/apple/tensorflow_macos

 

신규:

https://developer.apple.com/metal/tensorflow-plugin/

 

metal 디바이스로 가속화 하므로 x86 AMD gpu 달린 모델들도 지원이 될거같습니다

m1으로 테스트 하였지만 아직 패키지 호환성등 때문에 x86 쪽에서 더 쓸모가 있을거같네요

 

https://www.tensorflow.org/tutorials/quickstart/beginner?hl=ko

위 예시로 돌려봤고 모델이 작아서 크기만좀 키워서 진행 해봤습니다

스크린샷 2021-08-10 오후 1.27.09.png

학습셋 모양은 (60000,28,28) 입니다

 

스크린샷 2021-08-10 오후 1.14.07.png

스크린샷 2021-08-10 오후 1.14.50.png

스크린샷 2021-08-10 오후 1.28.03.png

 

알파버전때 설명을 보면 MLCompute 기기로 연산된다고 하는데 

mlcompute device 설정 옵션이 cpu, gpu, any 라고만 되어있었습니다

gpu 사용량이 거의 100%로 잡히는거 보니 gpu 가속이 메인이 되는거 같기는 합니다.

 

https://www.youtube.com/watch?v=H6ZpMMDvB1M

위에 geohot으로 알려진 george hotz가 m1 디버깅 하면서 Apple Neural Engine이 ANE라고 ml 인스트럭션이 따로 있는걸 찾긴 했는데

접근이 mlcompute로 말고는 못하는듯 한거같았습니다

https://github.com/geohot/tinygrad

여기서 리버스 엔지니어링 해서 Relu 인스트럭션 밖에 아직 가속화를 못하기도 하였습니다

아마 위 텐플에서는 ANE 보조가 될거같긴 하지만 인스트럭션 파보기 전까지엔 모르겠네요

 

비교를 위해서 동일모델 3080에서 돌린 결과는 다음과 같습니다

스크린샷 2021-08-10 오후 1.34.17.png

속도가 대략 4배 차이가 나네요 m1 gpu가 대략 1050~1060 정도의 학습 속도가 나온다고 알려져 있었습니다

 

애플 실리콘쪽 지원이 기대되었던 이유는 cpu,gpu 공유 메모리 때문이었습니다

3080만 하더라도 10기가 밖에 안되서 nvidia쪽이 메모리에 짜기 때문에 큰 모델 + 큰 배치로 돌릴수가 없어서 보통

더 비싼 지피유 또는 멀티 지피유를 쓰거나 아니면 배치 크기를 줄일수 밖에 없었습니다

스크린샷 2021-08-10 오후 1.37.47.png

하지만 m1이 16기가 램 옵션인데도 아직은 가용 최대 메모리가 5기가 정도로 잡혀있는거같긴 합니다

(제가 프로그램을 많이 키고 있어서 일수도 있습니다 - 실험 떄 사용된 메모리 13기가 정도. 다 끄고 확인해봐야 할듯하긴 합니다)

추후에 메모리 32기가 옵션등이 나올것으로 예상 되는데 정말 그떄는 arm용 패키지들 지원과 파이토치 가속화만 추가 된다면

이때까지 엔비디아와 담쌓으면서 고려 되지 않았던 맥이 오히려 학습용으로 가성비 있어 지는게 말도 안되는 소리는 아닐것 같습니다

 

하지만 엔비디아, amd등도 direct storage지원이 늘어나는 추세라 어떻게 바뀌어 나갈지는 기대 됩니다

 

 

 

댓글
11
TM.Roh
1등 TM.Roh
2021.08.10. 13:48

근데 M1이야 작아서 CPU, GPU를 동시에 메모리 공유를 하지만

이후 프로 라인업에 들어갈 애플실리콘들은

분명히 실리콘 크기가 매우 커져서 M1같은 설계를 못할텐데

그때도 메모리를 CPU, GPU 공유가 가능할지 모르겠어요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
글쓴이
idsr TM.Roh 님께
2021.08.10. 13:58

그럴거 같기도 합니다 m1x쪽으로 추정되는 외장 gpu가 계속 포착되고 있어서 지피유 메모리 풀을 따로 둘거같기는 해요

어떻게 확장을 해나갈지 궁금합니다

[idsr]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh idsr 님께
2021.08.10. 14:08

그냥 pc형태랑 비슷할거같아요

다이렉트스토리지같은 기술 애플도 만들어서 적용하려나요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:05

M1 옆에 메모리 붙어있는것과 메모리 공유 시스템을 구현하는건 아무런 관련이 없습니다

 

엑박 플스같은 콘솔도 메모리가 물리적으로 떨어져 있지만 서로 공유하는 구조입니다. 애플이 굳이 하나로 묶어서 패키징한 이유는 면적이 줄어들기 때문입니다. 

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:07

플스나 엑박은 cpu와 gpu가 한 칩에 통합되어있지 않나요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:10

혹시 프로 라인업에 들어갈 애플 실리콘은 플스나 엑박보다 커질거라고 보시는건가요

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:10

넵넵 맞습니다 다른거는 다 몰라도

맥프로에 들어갈 애플실리콘은

매우 큰게 사실이니깐요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:11

근데 cpu와 gpu가 따로 패키징되어 있어도 공유구조 구현하는데는 아무런 문제가 없습니다

이미 그런 형태의 pc도 출시되었거든요

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:12

그런 빅칩도 공유구조를 구현하려면 비용이 심하지 않을까요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:13

빅칩을 만드는거 자체가 비용이 더 들어가지요

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:15

맥프로에 들어가는 칩들은 다 빅칩이니깐요

그런 시스템에도 공유 메모리 구조를 구현하는게 효율적이고 더 이득이 되나 여쭤본겁니다

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:18

성능은 물론이고 비용측면에서도 더 효율적일 겁니다. 다른 제조사에선 호환성 때문에 잘 시도하지 못한것일 뿐이라고 봐요 

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:22

그정도인가요 이론상으로는 좋은데

실제로 적용하기에 어려움이 있는지 실제로 이제 빅칩탑재되는 맥들은

따로 외장으로 되어있다고 하는 루머도 보이고 그러네요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:24

지금 애플 실리콘이나 아이폰 패드에도 gpu 쪽 캐시로 작용하는 tbdr 메모리 같은것이 달려있습니다. 그런 용도로 달려있는 것일수도 있지요

[johnas]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:23

그리고 애플쪽 개발 문서를 보면 애플 실리콘은 공유 메모리 아키텍처라고 설명하고 있어 향후 애플 실리콘은 기본적으로 공유 메모리 구조라고 생각해도 무방할 듯 합니다.

 

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:24

좋네요 작업, 연산부분에서도 공유구조가 되게 효율적인데

실제로 구현이 된다면 매우 좋을거같습니다

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
멜로엘로
2등 멜로엘로
2021.08.10. 18:16

M1에서는 원래 텐서플로우가 안되었던건가요 ? 

[멜로엘로]님의 댓글을 신고합니다. 취소 신고
글쓴이
idsr 멜로엘로 님께
2021.08.10. 18:17

직접 avx 인스트럭션 빼고 컴파일 해서 cpu로는 가능했습니다

[idsr]님의 댓글을 신고합니다. 취소 신고
멜로엘로
멜로엘로 idsr 님께
2021.08.10. 18:20

아 글을 더 읽어보니 gpu모드도 지원이 된다는 말이었군요. 듣기로는 cpu버전도 생각보다 빠르다고 듣긴 했는데 ㅎㅎ

[멜로엘로]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 230228 수정 file admin 18.08.04 117065 13
핫글 음향 갤럭시 버즈3 프로 실사용기(레딧) [27] updatefile 여가어딥미코 06:39 1564 11
핫글 미니 KT LTE는 진짜 못써먹겠네요 [12] 흡혈귀왕 11:16 498 5
핫글 미니 갤갤펌) 버즈3 물리식 버튼이라는군요 [7] 애애앵 00:13 1431 5
49945 미니 와 근데 폴드3는 정말.. 제가 꿈꾸던 기기에 한없이 가깝네요. [15] file Stellist 21.08.08 992 3
49944 미니 폴드 계속 219 하십쇼 [7] 아재건달_보노뭘보노 21.08.09 827 3
49943 미니 삿슈 file 닉포토 21.08.09 202 3
49942 미니 퀄컴, TSMC에 파운드리 더 맡긴다 [1] Railgun 21.08.09 276 3
49941 미니 현실적으로 부수입 개념은 광고 말고는 딱히 없긴 해요 [22] [성공]함께크는성장 21.08.09 501 3
49940 미니 778G 메모리스펙논란은 퀄컴이 한술 뜬거죠.jpg [3] file 스퀴니 21.08.09 538 3
49939 미니 갤럭시 광고가 신경 덜 쓰이는 이유. [8] 뒷동산 21.08.09 575 3
49938 미니 샀슈 file SAMDDD 21.08.09 177 3
49937 미니 펑합니다. [16] 긴닉네임24643649 21.08.09 706 3
49936 미니 폴드 3, 플립 3는 유럽만 비싼가 보네요 [12] 하렌쿠우 21.08.09 405 3
49935 미니 갤럭시Z폴드4는 얼마나 에볼루션적인 제품일려나요 [3] S22울트라존버 21.08.09 484 3
49934 미니 영상까지 나온거면 언팩 끝난거 같은데 카더 21.08.09 229 3
49933 미니 본인 방금까지 투고 하는 상상함 [2] sourire 21.08.09 313 3
49932 미니 이번 언팩은 진짜 레전드네요 [8] Terrapin 21.08.09 1741 3
49931 미니 아직까지 안털린 정보 뭐가 있는지 한번 정리해봅시다. [20] Stellist 21.08.09 756 3
49930 미니 폴드3, 플립3 민팃 보상판매 금액 예상 뇌피셜 [5] file TM.Roh 21.08.09 1426 3
49929 미니 폴드3 스냅888 발열에 대한 정보가 별로 없네요 [17] rlaustlr 21.08.09 946 3
49928 미니 뭔가 초기 갤럭시의 갬성이 그리워지네요. [7] CaffeineJuice 21.08.10 702 3
49927 미니 s7fe 정식 출시일 7월 23일... [3] 존버합니다 21.08.10 433 3
49926 미니 양심있으면 셀룰러 버전 구매자 보상판매 열어야죠 [5] [성공]함께크는성장 21.08.10 373 3
49925 미니 비교하기에도 무색한 750G VS 778G 성능비교 [9] TM.Roh 21.08.10 2910 3
49924 미니 750G+통신모듈 에서 778G-통신모듈 해도 5만원이 싸지는건.. [9] 존버합니다 21.08.10 606 3
49923 미니 이번 FE 와이파이는 리뷰 안하실 분들 많을 것 같네요 [26] sourire 21.08.10 869 3
미니 m1 텐서플로우 테스트 [11] file idsr 21.08.10 2354 3
49921 미니 LG Q31 안드로이드 11 업데이트 [8] file LG산흑우 21.08.10 306 3

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...