R
R / Rstudio Standard deviation 표준편차 구해보자
dooooh
2020. 3. 3. 20:22
반응형
이번에는 표준편차를 구해보겠습니다. 만약 기본적인 통계지식이 없으시다면 이전글에 포스팅한 분산편을 보고오셔야 이해할 수 있습니당.
이전글 : 2020/03/03 - [R] - R / Rstudio Variance 분산을 구해보자
R / Rstudio Variance 분산을 구해보자
그냥 안할때는 막막했는데 막상 하나씩 하다보니까 재밌는것 같기도하구 ㅋㅅㅋ 이번에는 분산을 한번 구해볼텐데 이전 글에 썼던 평균값, 중앙값, 최빈값을 보고오는게 R에서 데이터가 이렇구나~~~ 하고 이해가..
dooooh.tistory.com
우선 표준편차는 sigma(σ) 라는 기호를 사용하여 나타냅니다.
분산이 데이터셋의 퍼진 정도를 알려준다면 표준편차는 각 데이터가 평균으로부터 얼마나 떨어져 있는지 알려줍니다.
표준편차를 구할때에는 분산을 구하고 루트를 씌워 구합니다.
R을 이용하여 2가지 방법으로 표준편차를 구해보겠습니다.
1. 분산에 루트 씌워 구하기
2. sd() 함수 이용하기
위는 두가지 방법으로 이전 글에서 예시로 들었던 분산으로부터 표준편차를 구한것입니다. 데이터 수가 적다보니까 오차가 생긴 모습입니다.
여기서 나온 표준편차가 의미하는 바는 무엇일까요?
표준편차는 위에서 말한것과 같이 평균으로 부터 얼마나 떨어져 있는가를 알려줍니다.
실제로 데이터의 68.3%가 1시그마 안에 포함되어있고 95%가 2시그마 안에 99.7%가 3시그마 안에 포함되어 있을것으로 예측할 수 있습니다. 만약 3시그마를 벗어난다면 매우 드문 경우를 나타냅니다.
반응형