R
R / Rsudio 평균값 중앙값 최빈값을 구해보자(최빈값편)
dooooh
2020. 2. 28. 15:52
반응형
이번엔 최빈값에 대해 알아보겠습니다.
이름에서 알 수 있듯이 제일 많이 등장한 값을 말합니다. 자료의 성질에 따라 한 개가 아닐 수도 있고 존재하지 않을 수도 있습니다.
R로 최빈값을 찾기위해 2가지 과정으로 진행하겠습니다.
1. 주어진 자료의 최빈값 찾기
2. R의 함수를 이용하여 최빈값 찾기
step1) 최빈값을 찾아보자~
자료의 수가 적은 경우에는 직접 찾아볼 수 있지만... 그것이 여의치 않은 경우에는 2가지 과정만 거쳐주면 됩니다.
1) 각 자료마다 빈도수를 계산한다
2) 빈도수를 비교한다
크기가 큰 데이터를 마주치게되면 막막해지는 경우가 많습니다. 이럴 때는 좀 더 작은 범위로 세분화시켜서 비교해보면 좀 더 쉽게 원하는 정보를 얻을 수 있습니다.
적당한 숫자들로 예를 들어보겠습니다.
18, 10, 13, 12, 20, 24, 13, 24, 18, 13
최빈값이 딱 보이지 않는다면 위의 방법을 이용하면 됩니다.
18 |
10 |
13 |
12 |
20 |
24 |
|
2 |
1 |
3 |
1 |
1 |
2 |
표를 보면 최빈값이 13 인 것을 바로 알 수 있습니다.
step2) R 함수를 이용하여 최빈값을 찾아보자구요
최빈값을 찾아주는 Mode() 라는 함수는 R패키지의 DescTools에 있습니다.
Mode() 함수를 이용하여 위의 예에서 최빈값을 찾아보도록 하겠습니다.

R을 이용하여 구해본 결과 위와 같은 결과가 나왔습니다.
최빈값이 한 개가 아닌 경우도 살펴보겠습니다.

최빈값이 1, 2 2개이기 때문에 3번째 값으로 NA가 나오게 됩니다.
이처럼 R을 이용하면 데이터가 커도 손쉽게 최빈값을 구할 수 있습니다~
반응형