[통계]

    [통계] 표준편차란?

    [통계] 표준편차란?

    1. 편차란? "각각의 개별 값에서 평균을 뺀 값"이며 +도 될 수 있고 -도 될 수 있습니다. 평균이 10이고 각 데이터의 값이 15, 14, 1이라 하면 편차는 15-10, 14-10, 1-10 --> 5,4, -9 이 됩니다. 2. 분산(variance) "편차의 제곱의 합" 위의 데이터를 기준으로는 5, 4, -9의 제곱인 25, 16, 81이 되고, 각 합은 25+16+81 = 122가 됩니다. 3. 표준편차 표준편차: 어떤 대상에서 벗어난 정도의 기준이 되는 것 다른 말로는 분산에 루트 씌운 값입니다. √122 = 11.04가 표준편차가 됩니다.

    [기초통계] 범주형 자료의 추세

    [기초통계] 범주형 자료의 추세

    요세미티 국립공원에 있는 암벽등반 명소에서 임의로 200명의 암벽등반가들을 뽑아 표본을 추출하고, 암벽등반 사고를 당한 적이 있는지와 암벽등반 관련 자격증이 있는지를 설문하였습니다. 결과는 다음과 같습니다. 요세미티 국립공원에서 등반 파트너를 찾고 있는데, 롭, 앤드류, 사라를 만났다고 합니다. 롭은 자유로운 영혼이라 생각하고 자격증 없이 등반을 합니다. 앤드류는 등반 사고가 없었던 전적을 계속 유지하고 싶어합니다. 사라에 대해서는 아무것도 모릅니다. 빈도표를 바탕으로 다음의 확률을 계산해 보세요. 백분율을 소수 셋째 자리에서 반올림하여 나타내세요. Q1. 롭이 사고를 당한 적이 있을 확률 = Q2. 앤드류에게 자격증이 있을 확률 = Q3. 사라에게 자격증이 있을 확률 = A1. 롭은 자격증이 없습니다...

    [기초통계] 이원 도수분포표

    [기초통계] 이원 도수분포표

    개념 이원 도수분포표: 성별(sex)와 같이 두 가지로 나눌 수 있는 표 Q. 두 대학에서 최근 졸업생의 소득에 대한 설문조사를 하였습니다. 다음 중 A대학에서 졸업한 학생은 총 몇명입니까? import pandas as pd col = ['소득', 'A대학', 'B대학'] df = pd.DataFrame([[ '20000미만', 35, 40], ['200000이상 399999미만', 90, 63], ['400000이상', 35, 37]], columns=col) A. 160 명 Q. 레나가 사탕이 18개 들어있는 상자에 대해서 알고 있는 정보는 다음과 같습니다. 레나가 다음 이원 도수분포표를 채울 수 있도록 도와주세요. 사탕 10개에는 초콜릿과 카라멜이 둘 다 있습니다. 사탕 3개에는 초콜릿과 카라멜 ..

    [기초통계] 중앙값, 중간범위, 평균, 최빈값, 범위

    기초 데이터 tmp = [ 75, 80, 100, 100, 100 ] 중앙값(median): 중앙에 있는 값, 데이터를 정렬한 뒤 중앙에 있는 값을 의미합니다. 기초 데이터는 정렬이 되어 있는 상태이니 중앙값은 100입니다. 중간범위(midrange): 가장 큰 값과 작은 값의 평균 기초 데이터에서 가장 큰 값은 100 가장 작은 값은 75이므로 100-75/2 가 중간범위가 됩니다. 평균: 모든 값을 더한 후 개수를 나눈 값 (75 + 80 + 100 + 100 + 100) / 5 가 평균이 됩니다. 91이네요 최빈값(mode): 가장 자주 나온 값 100이 3번으로 가장 많이 나왔습니다. 따라서 최빈값은 100입니다. 범위(range): 가장 높은 점수와 가장 낮은 점수의 차이 가장 높은 점수는 10..