(2022년 방송통신대 통계학개론 출석수업대체과제물)교재 p.137 예제 5-5의 데이터(어느 학교 학생 11명의 1년 동안 읽은 책 수)에 대한 히스토그램과 상자그림을 그리고,
해당 자료는 해피레포트에서 유료결제 후 열람이 가능합니다.
분량 : 9 페이지 /hwp 파일설명 :
과제물의 문제에 적합한 형식과 내용으로 정성을 다해 작성했습니다.
여러 참고자료를 바탕으로 주요내용을 최대한 이해하기 쉽고 알차게 정리했습니다.
리포트를 효율적으로 작성하시는 데 작은 도움이라도 되시기를 진심으로 바랍니다.^^
문단 모양(왼쪽 여백 0, 오른쪽 여백 0, 줄간격 160%)
글자 모양(맑은고딕, 장평 100%, 크기 11 pt, 자간 0%)
행복하세요, Now!
목차
1. 교재 p.137 예제 5-5의 데이터(어느 학교 학생 11명의 1년 동안 읽은 책 수)에 대한 히스토그램과 상자그림을 그리고, 다섯수치요약을 산출하시오. (5점)
1)히스트그램
①코드 ②출력 결과
2)상자그림
①코드 ②출력 결과
3)다섯수치요약
①코드 ②출력 결과
2. 교재 p.39 예제 2-11의 데이터(학생 10명이 1분당 할 수 있는 윗몸일으키기 개수)를 이용하여, 이 학생들이 대표하는 모집단의 윗몸일으키기 개수의 평균이 30과 같다고 할 수 있는지 유의수준 5%에서 검정하시오. (5점)
①코드 ②출력 결과 ③ 설명
3. 교재 p.223 연습문제 1번의 데이터를 이용하여, 근력강화 운동이 체중 감량 효과가 있는지 유의수준 5%에서 검정하시오. (5점)
①코드 ②출력 결과 ③ 설명
4. 다음은 세 가지 직업군에 속한 사람들의 월급 데이터이다. 직업군에 따라 월급의 평균이 다르다고 할 수 있는지 일원배치 분산분석으로 검정하시오. (유의수준 5%를 사용한다.) (5점
①코드 ②출력 결과 ③ 설명
5. 백신의 종류와 부작용의 관계를 알아보기 위해 A백신을 접종한 사람 30명, B백신을 접종한 사람 30명을 각각 조사하였다. A백신을 접종한 사람 30명 중에서 18명이 부작용을 경험했고, B백신을 접종한 사람 30명 중 15명이 부작용을 경험했다. 이 데이터를 가지고, 백신의 종류와 부작용 여부가 서로 독립이라고 할 수 있는지 유의수준 5%에서 검정하시오. (5점)
①코드 ②출력 결과 ③ 설명
6. 교재 p.180 예제 7-3의 데이터를 이용하여, 방과 후 학습 전 성취도 점수와, 방과 후 학습 후 성취도 점수의 산점도를 그리고, 상관계수를 계산하시오. 방과 후 학습 전 성취도 점수를 독립변수로, 방과 후 학습 후 성취도 점수를 종속변수로 하는 회귀직선을 구하시오. 이 회귀직선의 결정계수를 구하시오. (5점)
①코드 ②출력 결과 ③ 설명
7. 참고문헌
본문일부
1. 교재 p.137 예제 5-5의 데이터(어느 학교 학생 11명의 1년 동안 읽은 책 수)에 대한 히스토그램과 상자그림을 그리고, 다섯수치요약을 산출하시오. (5점)
1)히스트그램
①코드
# 데이터 입력
count <- c(8, 1, 10, 15, 15, 10, 5, 19, 20, 9, 10)
# 히스토그램 작성
hist(count, main=1년 동안 읽은 책 수\n(학생 11명), xlab=읽은 책 수, ylab=학생수)
②출력 결과
그림 생략
③ 설명
히스토그램 작성 코드에서 색깔은 col 매개변수를 사용하면 된다. 예를 들면 col=”red”로 하면 붉은색 막대가 그려진다.
2)상자그림
①코드
boxplot(count)
②출력 결과
그림 생략
③ 설명
다섯수치요약을 통해서도 알 수 있듯이, 상자그림에서 중앙값은 10, 1사분위수 8.5, 3사분위수는 15로 나타난다. 사분위범위(IQR)은 (3사분위수 – 1사분위수)이므로 6.5가 된다. 동일한 25%이지만 1사분위와 2사분위 사이가 2사분위와 3사분위 사이보다 좁으므로 1사분위와 2사분위 사이에서 데이터가 더 조밀하게 분포되어 있다는 것을 의미한다. 또한 모든 데이터가 안울타리(inner fence) 내에 존재하여 이상치(outlier)는 상자그림에 존재하지 않는다.
3)다섯수치요약
①코드
fivenum(count)
②출력 결과
그림 생략
③ 설명
다섯 수치요약(five-number summary)은 최솟값, 1사분위수, 중앙값(=2사분위수), 3사분위수, 최댓값을 의미한다. 즉, 최솟값 1, 1사분위수 8.5, 중앙값 10.0, 3사분위수, 15.0, 최대값 20.의 분포를 이루고 있다.
참고문헌
박서영, 이기재, 이긍희, 장영재(2022). 통계학개론. 출판문화원.
장영재, 최상범, 한승봉(2020). R컴퓨팅. 출판문화원.
출처 : 해피레포트 자료실