로그인 해주세요.

미니기기 / 음향 게시판 *스마트폰과 PC, 카메라, 스피커 등 IT 미니기기와 음향기기에 관해 교류하는 게시판입니다.

미니 m1 텐서플로우 테스트

  • idsr
  • 조회 수 2350
  • 2021.08.10. 13:46

맥os 용 텐서플로우가 기존에 알파 버전으로 공개 되었는데 12 베타로 넘어가면서 정식 공개 되었습니다.

 

기존:

https://github.com/apple/tensorflow_macos

 

신규:

https://developer.apple.com/metal/tensorflow-plugin/

 

metal 디바이스로 가속화 하므로 x86 AMD gpu 달린 모델들도 지원이 될거같습니다

m1으로 테스트 하였지만 아직 패키지 호환성등 때문에 x86 쪽에서 더 쓸모가 있을거같네요

 

https://www.tensorflow.org/tutorials/quickstart/beginner?hl=ko

위 예시로 돌려봤고 모델이 작아서 크기만좀 키워서 진행 해봤습니다

스크린샷 2021-08-10 오후 1.27.09.png

학습셋 모양은 (60000,28,28) 입니다

 

스크린샷 2021-08-10 오후 1.14.07.png

스크린샷 2021-08-10 오후 1.14.50.png

스크린샷 2021-08-10 오후 1.28.03.png

 

알파버전때 설명을 보면 MLCompute 기기로 연산된다고 하는데 

mlcompute device 설정 옵션이 cpu, gpu, any 라고만 되어있었습니다

gpu 사용량이 거의 100%로 잡히는거 보니 gpu 가속이 메인이 되는거 같기는 합니다.

 

https://www.youtube.com/watch?v=H6ZpMMDvB1M

위에 geohot으로 알려진 george hotz가 m1 디버깅 하면서 Apple Neural Engine이 ANE라고 ml 인스트럭션이 따로 있는걸 찾긴 했는데

접근이 mlcompute로 말고는 못하는듯 한거같았습니다

https://github.com/geohot/tinygrad

여기서 리버스 엔지니어링 해서 Relu 인스트럭션 밖에 아직 가속화를 못하기도 하였습니다

아마 위 텐플에서는 ANE 보조가 될거같긴 하지만 인스트럭션 파보기 전까지엔 모르겠네요

 

비교를 위해서 동일모델 3080에서 돌린 결과는 다음과 같습니다

스크린샷 2021-08-10 오후 1.34.17.png

속도가 대략 4배 차이가 나네요 m1 gpu가 대략 1050~1060 정도의 학습 속도가 나온다고 알려져 있었습니다

 

애플 실리콘쪽 지원이 기대되었던 이유는 cpu,gpu 공유 메모리 때문이었습니다

3080만 하더라도 10기가 밖에 안되서 nvidia쪽이 메모리에 짜기 때문에 큰 모델 + 큰 배치로 돌릴수가 없어서 보통

더 비싼 지피유 또는 멀티 지피유를 쓰거나 아니면 배치 크기를 줄일수 밖에 없었습니다

스크린샷 2021-08-10 오후 1.37.47.png

하지만 m1이 16기가 램 옵션인데도 아직은 가용 최대 메모리가 5기가 정도로 잡혀있는거같긴 합니다

(제가 프로그램을 많이 키고 있어서 일수도 있습니다 - 실험 떄 사용된 메모리 13기가 정도. 다 끄고 확인해봐야 할듯하긴 합니다)

추후에 메모리 32기가 옵션등이 나올것으로 예상 되는데 정말 그떄는 arm용 패키지들 지원과 파이토치 가속화만 추가 된다면

이때까지 엔비디아와 담쌓으면서 고려 되지 않았던 맥이 오히려 학습용으로 가성비 있어 지는게 말도 안되는 소리는 아닐것 같습니다

 

하지만 엔비디아, amd등도 direct storage지원이 늘어나는 추세라 어떻게 바뀌어 나갈지는 기대 됩니다

 

 

 

댓글
11
TM.Roh
1등 TM.Roh
2021.08.10. 13:48

근데 M1이야 작아서 CPU, GPU를 동시에 메모리 공유를 하지만

이후 프로 라인업에 들어갈 애플실리콘들은

분명히 실리콘 크기가 매우 커져서 M1같은 설계를 못할텐데

그때도 메모리를 CPU, GPU 공유가 가능할지 모르겠어요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
글쓴이
idsr TM.Roh 님께
2021.08.10. 13:58

그럴거 같기도 합니다 m1x쪽으로 추정되는 외장 gpu가 계속 포착되고 있어서 지피유 메모리 풀을 따로 둘거같기는 해요

어떻게 확장을 해나갈지 궁금합니다

[idsr]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh idsr 님께
2021.08.10. 14:08

그냥 pc형태랑 비슷할거같아요

다이렉트스토리지같은 기술 애플도 만들어서 적용하려나요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:05

M1 옆에 메모리 붙어있는것과 메모리 공유 시스템을 구현하는건 아무런 관련이 없습니다

 

엑박 플스같은 콘솔도 메모리가 물리적으로 떨어져 있지만 서로 공유하는 구조입니다. 애플이 굳이 하나로 묶어서 패키징한 이유는 면적이 줄어들기 때문입니다. 

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:07

플스나 엑박은 cpu와 gpu가 한 칩에 통합되어있지 않나요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:10

혹시 프로 라인업에 들어갈 애플 실리콘은 플스나 엑박보다 커질거라고 보시는건가요

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:10

넵넵 맞습니다 다른거는 다 몰라도

맥프로에 들어갈 애플실리콘은

매우 큰게 사실이니깐요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:11

근데 cpu와 gpu가 따로 패키징되어 있어도 공유구조 구현하는데는 아무런 문제가 없습니다

이미 그런 형태의 pc도 출시되었거든요

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:12

그런 빅칩도 공유구조를 구현하려면 비용이 심하지 않을까요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:13

빅칩을 만드는거 자체가 비용이 더 들어가지요

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:15

맥프로에 들어가는 칩들은 다 빅칩이니깐요

그런 시스템에도 공유 메모리 구조를 구현하는게 효율적이고 더 이득이 되나 여쭤본겁니다

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:18

성능은 물론이고 비용측면에서도 더 효율적일 겁니다. 다른 제조사에선 호환성 때문에 잘 시도하지 못한것일 뿐이라고 봐요 

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:22

그정도인가요 이론상으로는 좋은데

실제로 적용하기에 어려움이 있는지 실제로 이제 빅칩탑재되는 맥들은

따로 외장으로 되어있다고 하는 루머도 보이고 그러네요

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:24

지금 애플 실리콘이나 아이폰 패드에도 gpu 쪽 캐시로 작용하는 tbdr 메모리 같은것이 달려있습니다. 그런 용도로 달려있는 것일수도 있지요

[johnas]님의 댓글을 신고합니다. 취소 신고
johnas
johnas TM.Roh 님께
2021.08.10. 16:23

그리고 애플쪽 개발 문서를 보면 애플 실리콘은 공유 메모리 아키텍처라고 설명하고 있어 향후 애플 실리콘은 기본적으로 공유 메모리 구조라고 생각해도 무방할 듯 합니다.

 

[johnas]님의 댓글을 신고합니다. 취소 신고
TM.Roh
TM.Roh johnas 님께
2021.08.10. 16:24

좋네요 작업, 연산부분에서도 공유구조가 되게 효율적인데

실제로 구현이 된다면 매우 좋을거같습니다

[TM.Roh]님의 댓글을 신고합니다. 취소 신고
멜로엘로
2등 멜로엘로
2021.08.10. 18:16

M1에서는 원래 텐서플로우가 안되었던건가요 ? 

[멜로엘로]님의 댓글을 신고합니다. 취소 신고
글쓴이
idsr 멜로엘로 님께
2021.08.10. 18:17

직접 avx 인스트럭션 빼고 컴파일 해서 cpu로는 가능했습니다

[idsr]님의 댓글을 신고합니다. 취소 신고
멜로엘로
멜로엘로 idsr 님께
2021.08.10. 18:20

아 글을 더 읽어보니 gpu모드도 지원이 된다는 말이었군요. 듣기로는 cpu버전도 생각보다 빠르다고 듣긴 했는데 ㅎㅎ

[멜로엘로]님의 댓글을 신고합니다. 취소 신고
취소
번호 분류 제목 글쓴이 날짜 조회 수
공지 공지 사이트 이용 수칙 230228 수정 file admin 18.08.04 114859 13
핫글 미니 S23시리즈 배터리가 오래 갔던이유(디스플레이) 외 여러가지 [24] file GalaxyBudsSeries 24.06.12 1421 21
핫글 미니 이번 WWDC에서 가장 괜찮아 보인 것 [17] file MrGom™ 24.06.12 1628 18
핫글 미니 플레이 스토어 검색 방법이 바꼈네요 [8] file 펄럭펄럭 24.06.12 830 7
128045 미니 GPU는 x86 Arm 관련 없는건가요? [3] 딸기따알기 21.08.12 341 0
128044 미니 기술 발전이 참 눈부시네요 [4] [성공]함께크는성장 21.08.12 526 5
128043 미니 갤럭시 워치 4 시리즈 광고 엄청 괜찮네요? [7] 하렌쿠우 21.08.12 412 0
128042 미니 화소가 커지면 사진이 어두워지나요? [4] 비둘기야먹자 21.08.12 195 0
128041 미니 폴드3 게이밍 영상 [11] 피묻은고라니 21.08.12 751 3
128040 미니 워...치 취소...분 결제 성...공 했읍니...다. [4] file 만두는호빵이다. 21.08.12 461 10
128039 미니 워치4 인기가 좋네요? [8] file 프로입털러 21.08.12 616 2
128038 미니 그러고 보니 갤럭시탭은 한동안 8인치대 이하 신제품 탭이 없군요. [4] 달무리 21.08.12 355 0
128037 미니 갑자기 udc 불호 얘기가 나오길래... [4] 한겹 21.08.12 450 2
128036 미니 폴드3 게임성능 미니5만큼은 나올까요? [3] 또하나의가족Gamsung 21.08.12 401 0
128035 미니 광고 논란 정리해보자면... [22] CodenameKhan 21.08.12 781 10
128034 미니 이마트 폴드3 자급제 사전예약 했습니다 [2] 케이쁨 21.08.12 385 1
128033 미니 갤폴드 예약 어디서들 하나요? 홈플러스 디프에서 하는데 괜찮은지 봐주세요 [1] 므트므트므트 21.08.12 294 0
128032 미니 폴드는 그냥 화면내장 카메라를 빼는게 나았을듯 하네요 [14] 영어천재갓태문 21.08.12 554 0
128031 미니 삼성 이번 Z시리즈 카메라 센서 정보(중국버전) [1] file 좌지우건 21.08.12 523 3
128030 미니 폴드 UDC를 보니 노치가 이해갑니다 [3] sourire 21.08.12 713 2
128029 미니 udc 끄고 펀치홀같이 쓰고 싶다 하시는거 [4] file idsr 21.08.12 668 1
128028 미니 UDC.. [6] Terrapin 21.08.12 418 2
128027 미니 폴드 사고 싶은데 게임때문에... [11] trigun 21.08.12 344 0
128026 미니 갤럭시 캠퍼스 스토어는 소식없나요? [2] 수줍은킹콩 21.08.12 371 0
128025 미니 폴드3 UDC 품질이 별로라지만 [16] file 슈갤럼 21.08.12 939 13
128024 미니 버즈 라이브 이상 쓰시는 분들 케이스 어느거 쓰시나요? [8] Angry 21.08.12 209 0
128023 미니 루머] 픽셀6, 삼성 센서 및 모뎀 사용? [3] 좌지우건 21.08.12 366 5
128022 미니 이번 폴드 UDC는 [3] Pmg0207 21.08.12 451 5
128021 미니 플립이랑 폴드 성능향상치가 다르네영 [5] file TM.Roh 21.08.12 542 3

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

사용자 정의

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.

서버에 요청 중입니다. 잠시만 기다려 주십시오...