편 찻값 : 데이터 분석을 위한 기본 수학 - 11 빅데이터 분석을 위한 기초수학 1. 편찻값 '편 찻값'이라는 말은 다 들어보았을 텐데요 학생 때 모의시험 결과에는 이 말이 쓰여있었는데, 이 '편 찻값'의 계산 방법이나 의미를 정확히 알고 있는 사람은 많지 않은 것 같습니다. 대다수는 ' 편 찻값 50은 평균, 편찻값 60은 상당히 우수, 편찻값 70은 대단히 우수. 반대로 편찻값 40이면 좀 위험하다..' 이런 이미지 정도만 가지고 있을 뿐이죠 지금까지 배워온 표준편차(나 분산)는 데이터의 흩어진 정도를 나타냈습니다. 표준편차가 작다는 것은 데이터가 평균 주위에 집중되어 있음을 나타냅니다. 한편 편 찻값은 데이터 전체 속에 있는 특정한 데이터가 얼마나 '특수'한 지를 측정하는 지표입니다. 편차 값은 ..
표준편차 : 데이터 분석을 위한 기본 수학 - 10 빅데이터 분석을 위한 수학력 안녕하세요 오늘도 데이터분석을 위한 기본 수학 10번째 시간으로, 분산에 이어 오늘은 표준편차에 대해서 알아보도록 할게요~!! 1. 표준편차 분산은 평균으로부터의 차가 확실하게 보이므로 평균 주위에 흩어진 정도를 나타내기에는 아주 적합하지만 2가지 문제가 있습니다. (1) 값이 너무 커진다. (2) 단위가 [본래 단위^2] 이 됩니다. 앞의 A반과 B반 데이터의 경우 A반의 분산 = 166.66....[점^2] B반의 분산 = 640 [점^2] 이었는데 이 값만 보면 '도대체 몇 점 만점인 시험이야?', '점^2은 뭐지..?'라는 생각이 드는 분들도 적지 않을 거예요 심지어 이렇게 A반과 B반의 분산을 나란히 쓰면 A반이 평..