AI MS, 최신 SLM 시리즈 공개
- BarryWhite
- 조회 수 223
- 2024.08.27. 19:13
https://www.digitaltoday.co.kr/news/articleView.html?idxno=531168
마이크로소프트는 최근 소형언어모델 파이-3(Phi-3) 시리즈 최신 모델인 파이-3.5 시리즈를 공개했다.
회사 측에 따르면 4월 출시된 Phi-3는 언어, 추론, 코딩, 수학 등 다양한 벤치마크에서 유사하거나 더 큰 모델보다도 우수한 성능과 비용 효율을 제공할 수 있도록 설계됐다. 이번에 새롭게 공개된 파이3.5 미니(Phi-3.5-mini), 파이-3.5-비전(Phi-3.5-vision),파이-3.5-MoE( Phi-3.5-MoE) 모델로 이뤄져 있다.
파이-3.5-미니는 다국어 지원이 강화됐다. 영어 및 다양한 언어에서 고성능을 유지하며, 특히 아랍어, 네덜란드어, 핀란드어 등의 언어에서 성능이 크게 개선됐다. 38억개 파라미터(매개변수)로 긴 문서 요약, 멀티턴 대화 및 정보 검색 작업이 뛰어나다. 12만8000개 컨텍스트 길이를 지원해 긴 문서나 회의록 처리에도 유용하게 활용할 수 있다.
회사 측은 "8000개 컨텍스트 길이만 지원하는 구글 젬마-2(Gemma-2) 보다 더 우수한 성능을 제공한다. 라마-3.1-8B-인스트럭트(Llama-3.1-8B-instruct), 미스트랄-7B-인스트럭트-v0.3(Mistral-7B-instruct-v0.3), 미스트랄-니모-12B-인스트럭트-2407(Mistral-Nemo-12B-instruct-2407) 등 훨신 큰 모델들과 비교해도 경쟁력 있는 성능을 보여준다"고 강조했다.
파이-3.5-비전은 멀티 프레임 이미지 이해 및 추론이 개선됐다. 이를 통해 다양한 이미지와 비디오 벤치마크에서 성능이 향상됐다. 슬라이드 요약, 비디오 요약, 이미지 스토리텔링 등의 작업에서 높은 정확도와 효율성을 보여주며, 다양한 산업에서 활용될 수 있다고 마이크로소프트는 설명했다.