데이터 정리를 위한 기본수학 -1

반응형
반응형

데이터 정리를 위한 기본 수학

빅데이터 분석에 필요한 기본 수학

안녕하세요 저희는 너무나도 다양하고 방대한 데이터 속에 살고 있는데,
그 데이터를 활용하고 사용하는데 필요한 기초적인 기본 수학을 공유드리려 합니다.

해당 내용은 '통계가 빨라지는 수학력(나가노 히로유키)'의 내용입니다 :)

목 차

  1. 들어가는 말
  2. 평균
  3. 나눗셈의 2가지 의미

1. 들어가는 말

 통계란 수집한 데이터를 정리하고 분석하는 학문입니다.

데이터 정리에 필요한 평균과 비율, 그래프에 대해서 알아보려고 하는데 워낙 기본 수학이다 보니,

"그걸 누가 몰라?"라고 생각하실 수 도 있어서 책에 예시로 나온 문제를 보여드립니다.

 

(문제) 어느 중학교 3학년 학생 100명의 키를 측정해 평균을 계산했더니 163.5cm였다.

이 결과로부터 확실하게 옳은 것은?

 

(1) 키가 평균인 163.5cm보다 큰 학생과 작은 학생이 각각 50명씩 있다.

(2) 100명의 학생 모두의 키를 더하면 163.5cm x 100 = 16,350cm와 같다

(3) 키를 10cm마다 '130cm 이상 140cm 미만인 학생', '140cm 이상 150cm 미만인 학생',

... 과 같이 나누면 '160cm 이상 170cm 미만인 학생'이 가장 많다

 

이 문제는 2011년 일본 수학회가 전국 약 6,000명의 대학생을 대상으로 실시한 '대학생 수학 기본조사'의 1번 문제입니다.

이 문제의 정답률은 76%로, 대학생 4명 가운데 1명은 틀린 문제입니다.

답을 자신 있게 말하실 수 있나요??

(답은 맨 아래에서 말씀드리겠습니다)

 

2. 평균


 평균(平均)이란, 말 그대로 평평하게 고르는 것입니다.

 

높이가 다른 세 개의 직사각형(높이가 각각 2, 7, 3)이 있다고 생각해보면 높이 7의 직사각형을 잘라서

평평하게 될 수 있도록 높이가 4인 직사각형이 되도록 만들어 붙이면 되죠

직사각형의 세로 높이가 평균, 가로길이가 개수, 그리고 면적은 합계가 됩니다.

 

평균 x 개수 = 합계

(세로) (가로) (면적)

 

이것으로부터 ,

 

평균 = 합계 / 개수됩니다.

 

기호를 써서 기본식으로 나타내면

 

x(평균) = (x1+x2+x3 + xn) / n

 

(예제 1-1) 6명의 학생이 있는 A반과 5명의 학생이 있는 B반의 수학 시험 점수를 모은 것이다 각반의 평균을 구하라

A반(점) : 50, 60, 40, 30, 70, 50

B반(점) : 40, 30, 40, 40, 100

A반 평균 = (50+60+40+30+70+50) / 6 = 300 / 6 = 50점

B반 평균 = (40+30+40+40+100) / 5 = 250 / 5 = 50점

 

두 반의 평균은 50점이고 사람 수(개수)가 달라도 서로 비교할 수 있습니다.

다만 A반은 평균 미만이 2명, B반은 평균 미만이 4명으로 B반은 단 한 명이 평균점수를 확 올려주고 있죠

이처럼 데이터에는 평균으로는 알 수 없는 특징도 있습니다.

그래서 통계에서는 데이터 특징을 나타내는 것으로 중앙값이나 최빈값 등도 사용합니다.

 

3. 나눗셈의 두 가지 의미

 

여기 간단한 실험이 있습니다.

ㅇ ㅇ ㅇ ㅇ ㅇ ㅇ

 

6개의 동그라미(ㅇ)가 있습니다. 이것을 이용하여 6 / 3 = 2를 그림으로 그룹을 나누어보세요!!

 

(a) (ㅇㅇ)(ㅇㅇ)(ㅇㅇ)

(b) (ㅇㅇㅇ)(ㅇㅇㅇ)

 

어느 쪽 그림을 그리셨나요?

 

a를 그리셨을 수도 있고, b를 그리셨을 수도 있습니다.

어느 쪽도 틀린 것이 아니고 6/3=2를 정확하게 나타내고 있습니다.

 

1. 나눗셈의 의미 : 전체를 똑같이 나눈다

'만두가 6개 있다. 3명이 나누면 1인당 몇 개를 받을 수 있는가?'

6 / 3 = 2

1 명단 2개씩 받을 수 있다임을 알 수 있는데,

이 계산의 의미는 '6개의 물건을 3 등분하면 1명당 2개가 된다'입니다.

이렇게 전체를 똑같이 나누는 나눗셈을 약간 어려운 말로 등분제라고 합니다.

(1명당 양) x 3 = 6

 

2. 나눗셈의 의미 : 전체를 같은 수만큼씩 나눈다

만두가 6개 있다. 1팩에 3개씩의 세트를 몇 팩 만들 수 있는가?

6 / 3 = 2

위와 똑같이 2팩을 만들 수 있다는 것을 알 수 있다.

단 이때의 의미는 '6개인 것을 3개씩 나누면 2개가 된다'가 된다.

이처럼 전체를 똑같은 수만큼씩을 나누는 나눗셈을 포함 제라고 합니다.

앞서 본 것처럼 곱셈의 역으로 생각해보면

3 x (몇 개 분) = 6

어느 쪽이 더 맞는 느낌이신가요?

둘 다 올바른 나눗셈의 이해이고 나눗셈에는 저 위에 (a)(b) 2가지 의미가 있고

비율을 잘 파악하기 위해서는 이것을 확실하게 인식하는 게 중요하다고 합니다.

(일반화) 나눗셈의 2가지 의미

a / n = p

 

(a) a를 n 등분하면 1개당(1명당) p 개다(등분제)                         

(b) a를 n씩으로 나누면 p개가 되는 a는 n이 p개 분이다(포함제)

 

 

 

* 들어가는 말 내 문제 정답 :

1번 X , 평균은 중간값이 아니므로  X

2번 O , 평균 x 사람 수 = 합계 이므로  O

3번 X , 평균으로 데이터의 분포상태(도수분포)는 알 수 없음 X

 

반응형

댓글

Designed by JB FACTORY