편 찻값 : 데이터 분석을 위한 기본 수학 - 11 빅데이터 분석을 위한 기초수학 1. 편찻값 '편 찻값'이라는 말은 다 들어보았을 텐데요 학생 때 모의시험 결과에는 이 말이 쓰여있었는데, 이 '편 찻값'의 계산 방법이나 의미를 정확히 알고 있는 사람은 많지 않은 것 같습니다. 대다수는 ' 편 찻값 50은 평균, 편찻값 60은 상당히 우수, 편찻값 70은 대단히 우수. 반대로 편찻값 40이면 좀 위험하다..' 이런 이미지 정도만 가지고 있을 뿐이죠 지금까지 배워온 표준편차(나 분산)는 데이터의 흩어진 정도를 나타냈습니다. 표준편차가 작다는 것은 데이터가 평균 주위에 집중되어 있음을 나타냅니다. 한편 편 찻값은 데이터 전체 속에 있는 특정한 데이터가 얼마나 '특수'한 지를 측정하는 지표입니다. 편차 값은 ..
표준편차 : 데이터 분석을 위한 기본 수학 - 10 빅데이터 분석을 위한 수학력 안녕하세요 오늘도 데이터분석을 위한 기본 수학 10번째 시간으로, 분산에 이어 오늘은 표준편차에 대해서 알아보도록 할게요~!! 1. 표준편차 분산은 평균으로부터의 차가 확실하게 보이므로 평균 주위에 흩어진 정도를 나타내기에는 아주 적합하지만 2가지 문제가 있습니다. (1) 값이 너무 커진다. (2) 단위가 [본래 단위^2] 이 됩니다. 앞의 A반과 B반 데이터의 경우 A반의 분산 = 166.66....[점^2] B반의 분산 = 640 [점^2] 이었는데 이 값만 보면 '도대체 몇 점 만점인 시험이야?', '점^2은 뭐지..?'라는 생각이 드는 분들도 적지 않을 거예요 심지어 이렇게 A반과 B반의 분산을 나란히 쓰면 A반이 평..
분산 : 데이터 분석을 위한 기본 수학 - 9 빅데이터를 위한 수학력 안녕하세요 오늘도 데이터 분석에 필요한 기본 수학 아홉 번째 시간입니다. 오늘은 분산에 대해서 설명드리겠습니다~! 사실 제곱근, 분배법칙 , 곱셈 같은 기초적인 것까지 자세히 설명드렸습니다.. 오늘 배우는 분산(Vx)를 구하는 공식을 끌어내려면 곱셈 공식이 필요하고, 분산에서 표준편차를 구할 때도 루트 계산이 중요합니다. 1. 분산 여기서의 목표는 평균을 기준으로 해서 흩어진 정도를 조사하는 것입니다. 앞에서 배웠던 A반과 B반의 데이터를 사용해서 그 방법을 살펴보겠습니다. A반 : 50 60 40 30 70 50 B반 40 30 40 40 100 먼저 각 반의 평균(두 반 모두 50점)과의 차를 정리해봅니다 A반(평균 : 50점) 점..
제곱근, 데이터 분석을 위한 기본 수학 빅데이터를 위한 기본 수학 먼저 '제곱근'의 정의부터 알아보자. '제곱'이란 같은 수를 거듭 곱한 것을 말하며 '근'은 그 건의 근원이 되는 수다. ㅇ 정의 !! - 제곱하면 a가 되는 수를 a의 제곱근이라고 한다. 바꿔 말하면, x^2 = a의 해를 말한다. 예를 들어 a = 4인 경우, x^2 = 4이며, 2^2 = 4 (-2)^2 = 4 이므로, x = +- 2로 4의 제곱근은 2나 -2 임을 알 수 있다. 루트(근호) 4의 제곱근이 2와 -2인 것은 그렇다 해도, 예를 들어서 그럼 5는?? ' 5의 제곱근'은 제곱해서 5가 되는 수다. 2^2 = 4 3^2 = 9 이므로 5의 제곱근(중에서 양수인 것)은 2와 3 사이의 수일 것이다. 그러나 이것은 너무 대략..