미니 잡담: 데이터를 볼 때 평균값? 중간값? 대표성은...?
- Section31
- 조회 수 604
- 2023.10.14. 22:04
평균값 : 산술평균은 N개의 변량을 모두 더하여 그 개수로 나눈 것입니다.
중간값 : N개의 변량을 가장 작은 것부터 가장 큰 것까지 일렬로 죽 나열했을 때, 상위 50% 지점에 있는 값입니다.
평균값은 전반적으로 일정 수준의 주기를 갖고 느리게 진동하거나, 데이터들을 줄세웠을 때 정규분포를 갖는 등,
완만한 변화양상을 갖는 데이터를 분석할 때 대표성을 갖습니다.
반대로 중간값(median)은 간헐적인 이상치가 속출하는 경우 - 예를 들면 게임 중 프레임 드랍 등등 - 에 적합합니다.
평균은 극단값 즉 이상치가 속출하게 되면 왜곡에 굉장히 취약해집니다.
그래서 중앙값을 강고(robust)하다고 하는 것으로, 중앙값이 왜곡의 영향을 가장 덜 받기 때문입니다.
밑의 그림은 왜 평균값이 극단값에 의한 취약성을 보여주는지를 나타내는 모식도입니다.
댓글
12
1등 범퀴
WayBack
범퀴 님께
2등 콜홍
WayBack
콜홍 님께
글쓴이
Section31
콜홍 님께
noop
Section31 님께
글쓴이
Section31
noop 님께
MaxPax
noop 님께
3등 Butzed
범퀴
Butzed 님께
Butzed
범퀴 님께
여우같은하비
2023.10.14. 22:06
2023.10.14. 22:14
2023.10.14. 22:14
2023.10.14. 22:15
2023.10.14. 22:17
2023.10.14. 22:50
2023.10.14. 22:52
2023.10.15. 01:49
2023.10.14. 22:34
2023.10.14. 22:44
2023.10.14. 23:24
2023.10.14. 22:52
걍 신뢰도 없음;;