편 찻값 : 데이터 분석을 위한 기본 수학 - 11 빅데이터 분석을 위한 기초수학 1. 편찻값 '편 찻값'이라는 말은 다 들어보았을 텐데요 학생 때 모의시험 결과에는 이 말이 쓰여있었는데, 이 '편 찻값'의 계산 방법이나 의미를 정확히 알고 있는 사람은 많지 않은 것 같습니다. 대다수는 ' 편 찻값 50은 평균, 편찻값 60은 상당히 우수, 편찻값 70은 대단히 우수. 반대로 편찻값 40이면 좀 위험하다..' 이런 이미지 정도만 가지고 있을 뿐이죠 지금까지 배워온 표준편차(나 분산)는 데이터의 흩어진 정도를 나타냈습니다. 표준편차가 작다는 것은 데이터가 평균 주위에 집중되어 있음을 나타냅니다. 한편 편 찻값은 데이터 전체 속에 있는 특정한 데이터가 얼마나 '특수'한 지를 측정하는 지표입니다. 편차 값은 ..
표준편차 : 데이터 분석을 위한 기본 수학 - 10 빅데이터 분석을 위한 수학력 안녕하세요 오늘도 데이터분석을 위한 기본 수학 10번째 시간으로, 분산에 이어 오늘은 표준편차에 대해서 알아보도록 할게요~!! 1. 표준편차 분산은 평균으로부터의 차가 확실하게 보이므로 평균 주위에 흩어진 정도를 나타내기에는 아주 적합하지만 2가지 문제가 있습니다. (1) 값이 너무 커진다. (2) 단위가 [본래 단위^2] 이 됩니다. 앞의 A반과 B반 데이터의 경우 A반의 분산 = 166.66....[점^2] B반의 분산 = 640 [점^2] 이었는데 이 값만 보면 '도대체 몇 점 만점인 시험이야?', '점^2은 뭐지..?'라는 생각이 드는 분들도 적지 않을 거예요 심지어 이렇게 A반과 B반의 분산을 나란히 쓰면 A반이 평..
분산 : 데이터 분석을 위한 기본 수학 - 9 빅데이터를 위한 수학력 안녕하세요 오늘도 데이터 분석에 필요한 기본 수학 아홉 번째 시간입니다. 오늘은 분산에 대해서 설명드리겠습니다~! 사실 제곱근, 분배법칙 , 곱셈 같은 기초적인 것까지 자세히 설명드렸습니다.. 오늘 배우는 분산(Vx)를 구하는 공식을 끌어내려면 곱셈 공식이 필요하고, 분산에서 표준편차를 구할 때도 루트 계산이 중요합니다. 1. 분산 여기서의 목표는 평균을 기준으로 해서 흩어진 정도를 조사하는 것입니다. 앞에서 배웠던 A반과 B반의 데이터를 사용해서 그 방법을 살펴보겠습니다. A반 : 50 60 40 30 70 50 B반 40 30 40 40 100 먼저 각 반의 평균(두 반 모두 50점)과의 차를 정리해봅니다 A반(평균 : 50점) 점..
분배 법칙 : 데이터 분석을 위한 기본 수학-8 빅데이터를 위한 수학력 안녕하세요 오늘도 데이터 분석에 필요한 기본 수학을 알아보겠습니다!! 오늘은 분배 법칙에 대해서 설명드릴게요 다들 아시겠지만... 간단한 내용이지만 어릴 때 배우는 내용이다 보니, 오랜만에 기억 환기시킬 겸 알아보겠습니다!! 1. 분배 법칙 다항식의 계산(전개와 인수분해)에서는 분배 법칙이라는 다음의 법칙을 기본으로 합니다. 분배법칙 (m+n) x = mx+nx 구체적인 숫자를 사용해 계산해볼게요! (2+3) x4 = 2x4 + 3x4 = 8 + 12 = 20 또한 A x B는 B x A와 같으므로 다음과 같이 할 수도 있습니다. 4x(2+3) = 4x2 + 4x3 = 8 + 12 = 20 분배 법칙을 암산에 응용 참고로 분배법칙을 ..
제곱근 : 데이터 분석을 위한 기본 수학 빅데이터를 위한 기본 수학 지난 시간에 이어 '제곱근의 계산'에 대해서 알아볼게요 루트를 벗길 수 없는 수는 유한한 소수나 분수로 나타낼 수 없으므로, 일반적으로 계산할 때 미지수(문자)처럼 취급합니다. (덧셈) 2 루트 3 + 3 루트 3 = 5 루트 3 (2a +3a = 5a) (뺄셈) 4 루트 7-루트 7 = 3 루트칠(4a-a=3a) 곱셈과 나눗셈을 그냥 할 수 있습니다. (곱셈) 루트 3 x 루트 5 = 루트 3x5 = 루트 15 (나눗셈) 루트 6 / 루트 2 = 루트 3 단 두 종류 이상의 제곱근이 들어간 덧셈이나 뺄셈은 주의해야 합니다. 루트 a + 루트 b = 루트(a+b) 루트a - 루트b = 루트(a-b) 이렇게는 안됩니다. 이유로는 루트 4 ..
제곱근, 데이터 분석을 위한 기본 수학 빅데이터를 위한 기본 수학 먼저 '제곱근'의 정의부터 알아보자. '제곱'이란 같은 수를 거듭 곱한 것을 말하며 '근'은 그 건의 근원이 되는 수다. ㅇ 정의 !! - 제곱하면 a가 되는 수를 a의 제곱근이라고 한다. 바꿔 말하면, x^2 = a의 해를 말한다. 예를 들어 a = 4인 경우, x^2 = 4이며, 2^2 = 4 (-2)^2 = 4 이므로, x = +- 2로 4의 제곱근은 2나 -2 임을 알 수 있다. 루트(근호) 4의 제곱근이 2와 -2인 것은 그렇다 해도, 예를 들어서 그럼 5는?? ' 5의 제곱근'은 제곱해서 5가 되는 수다. 2^2 = 4 3^2 = 9 이므로 5의 제곱근(중에서 양수인 것)은 2와 3 사이의 수일 것이다. 그러나 이것은 너무 대략..
데이터 정리를 위한 기본 수학 빅데이터 분석에 필요한 기본 수학 안녕하세요 오늘도 데이터를 활용하고 사용하는데 필요한 기초적인 기본 수학-3(세 번째)를 공유드리려 합니다. * 해당 내용은 '통계가 빨라지는 수학력(나가노 히로유키)'의 내용입니다 :) 1. 데이터와 변량 '데이터'와 '변량'의 정의를 확인해보자 예를 들어 A반의 수학 시험 점수가 아래와 같다면 50 60 40 30 70 50 (점) 이 6개의 값 전체를 '데이터(data)'라고 한다. 그리고 조사 대상이 되는 항목(이 경우는 수학시험 점수)이 변량(variate)이 된다 * 변량은 변수(variable)이라고도 한다. 통계에서는 엄밀히 따지면 다른 용어지만 비슷한 걸로 볼 수 있다. 질적 데이터 '질적 데이터'란 '카테고리 컬 데이터'라..
데이터 정리를 위한 기본 수학 빅데이터 분석에 필요한 기본 수학 안녕하세요 오늘도 데이터를 활용하고 사용하는데 필요한 기초적인 기본 수학-2(두 번째)를 공유드리려 합니다. * 해당 내용은 '통계가 빨라지는 수학력(나가노 히로유키)'의 내용입니다 :) 1. 비율 먼저 비율의 정의부터 살펴보고 문제를 풀자 비율의 정의 비율 = 비교하는 양 / 기준으로 삼은 양 (문제) 전체 50명인 학급이 있다. 이중 남자는 30명이다. 학급 전체에 대한 남자의 비율을 구하라 (해답) 이 경우 비교하는 양(남자)이 30명, 기준으로 삼은 양(학급전체)이 50명이므로, 30/50 = 0.6(60%) 이다. 이것은 단순히 비율 공식에 대입해 얻은 값일 뿐, 비율을 이해한 것은 아니다. 이 계산의 의미를 다시 생각해보자 1) ..
데이터 정리를 위한 기본 수학 빅데이터 분석에 필요한 기본 수학 안녕하세요 저희는 너무나도 다양하고 방대한 데이터 속에 살고 있는데, 그 데이터를 활용하고 사용하는데 필요한 기초적인 기본 수학을 공유드리려 합니다. 해당 내용은 '통계가 빨라지는 수학력(나가노 히로유키)'의 내용입니다 :) 목 차 들어가는 말 평균 나눗셈의 2가지 의미 1. 들어가는 말 통계란 수집한 데이터를 정리하고 분석하는 학문입니다. 데이터 정리에 필요한 평균과 비율, 그래프에 대해서 알아보려고 하는데 워낙 기본 수학이다 보니, "그걸 누가 몰라?"라고 생각하실 수 도 있어서 책에 예시로 나온 문제를 보여드립니다. (문제) 어느 중학교 3학년 학생 100명의 키를 측정해 평균을 계산했더니 163.5cm였다. 이 결과로부터 확실하게 옳..
채권투자를 해야 하는 이유 채권투자 이유 금리 인상, 화폐가치 하락으로 투자처를 찾기 힘든 시기에, 채권투자 책*에 좋은 내용이 있어 공유드려요! 오늘은 채권투자 기초로 투자를 해야 하는 이유에 대해서 알아볼까요?? * 채권투자 핵심노하우(마경환, 이레미디어) 목 차 1. 큰 위험없이 안전하게 수익을 얻을 수 있는 자산 2. 경기하락 시 매우 훌륭한 투자자산 1. 큰 위험없이 안전하게 수익을 얻을 수 있는 자산 왜 채권투자를 해야 할까요? 아래의 도표 1을 보시면, 과거 20년간 연도별 투자수익 중 18년간 플러스 수익을 기록한 걸 볼 수 있습니다. 단 두 번의 원금손실도 -0.8%('99), -2%('13)으로 매우 미미하게 발생했었죠! 그렇담 투자기간을 2년으로 늘릴 경우에는 어떨까요? 도표 1-2를..