코딩하는 수학과생 :: R / Rsudio 평균값 중앙값 최빈값을 구해보자(최빈값편)


반응형

이번엔 최빈값에 대해 알아보겠습니다.

 

이름에서 알 수 있듯이 제일 많이 등장한 값을 말합니다. 자료의 성질에 따라 한 개가 아닐 수도 있고 존재하지 않을 수도 있습니다.

 

R로 최빈값을 찾기위해 2가지 과정으로 진행하겠습니다.

 

1. 주어진 자료의 최빈값 찾기

2. R의 함수를 이용하여 최빈값 찾기

 

step1) 최빈값을 찾아보자~

 

자료의 수가 적은 경우에는 직접 찾아볼 수 있지만... 그것이 여의치 않은 경우에는 2가지 과정만 거쳐주면 됩니다.

1) 각 자료마다 빈도수를 계산한다

2) 빈도수를 비교한다

 

크기가 큰 데이터를 마주치게되면 막막해지는 경우가 많습니다. 이럴 때는 좀 더 작은 범위로 세분화시켜서 비교해보면 좀 더 쉽게 원하는 정보를 얻을 수 있습니다.

 

적당한 숫자들로 예를 들어보겠습니다.

 

18, 10, 13, 12, 20, 24, 13, 24, 18, 13

 

최빈값이 딱 보이지 않는다면 위의 방법을 이용하면 됩니다.

 

18

10

13

12

20

24

2

1

3

1

1

2

 

표를 보면 최빈값이  13  인 것을 바로 알 수 있습니다.

 

step2) R 함수를 이용하여 최빈값을 찾아보자구요

 

최빈값을 찾아주는 Mode() 라는 함수는 R패키지의 DescTools에 있습니다.

 

Mode() 함수를 이용하여 위의 예에서 최빈값을 찾아보도록 하겠습니다.

 

R을 이용하여 구해본 결과 위와 같은 결과가 나왔습니다.

 

최빈값이 한 개가 아닌 경우도 살펴보겠습니다.

최빈값이  1, 2  2개이기 때문에 3번째 값으로 NA가 나오게 됩니다.

 

이처럼 R을 이용하면 데이터가 커도 손쉽게 최빈값을 구할 수 있습니다~

반응형
Posted by dooooh
,