편찻값 : 데이터 분석을 위한 기본수학 - 11

반응형
반응형

편 찻값 : 데이터 분석을 위한 기본 수학 - 11

 

빅데이터 분석을 위한 기초수학

 

 

1. 편찻값

 '편 찻값'이라는 말은 다 들어보았을 텐데요 

학생 때 모의시험 결과에는 이 말이 쓰여있었는데, 이 '편 찻값'의 계산 방법이나 의미를 정확히 알고 있는

사람은 많지 않은 것 같습니다.

 

 대다수는 ' 편 찻값 50은 평균, 편찻값 60은 상당히 우수, 편찻값 70은 대단히 우수. 반대로 편찻값 40이면 좀 위험하다..' 

이런 이미지 정도만 가지고 있을 뿐이죠

 지금까지 배워온 표준편차(나 분산)는 데이터의 흩어진 정도를 나타냈습니다. 표준편차가 작다는 것은 데이터가 평균 주위에 집중되어 있음을 나타냅니다. 한편 편 찻값은 데이터 전체 속에 있는 특정한 데이터가 얼마나 '특수'한 지를 측정하는 지표입니다.

 

 편차 값은 평균을 50으로 하고, 거기서 표준편차의 값 1개 분만큼 벌어질 때마다 +-10을 합니다. 편 찻값의 계산식은 다음과 같습니다.

 

편찻값의 계산식

 

편찻값 = 50 + ((특정 데이터 - 평균) / 표준편차) x 10 

 

 그럼 B반의 데이터로 100점인 학생의 편 찻값을 계산해보자. B반의 평균은 50점, 표준편차는 루트 640점이었다

 

100점인 학생의 편찻값 = 50 + ((100-50) / 루트 640) x10 

                                      = 50 + ((50/8 루트 10) x10)

                                      = 50 + (25/4) 루트 10

                                      = 69.764...

 

 역시 100점인 학생은 '대단히 우수'하다

예를 들어 수능시험처럼 많은 사람이 치르는 시험의 결과는 '정규분포'라고 불리는 분포가 됩니다. 

정규분포에서는 모든 데이터의 약 7할(68.26%)은 표준편차 1개 분 안에 들어간다는 것을 알 수 있습니다.

 

 

 

반응형

 

반응형

댓글

Designed by JB FACTORY