library(shiny) library(htmltools)
div(class = "preface", h4("들어가기"), "업로드한 데이터나 저장된 데이터를 집계하는 방법을 다룹니다.", br(), "수치형 변수와 범주형 변수의 특성별로 요약 집계와 시각화를 수행하는 방법을 설명합니다.")
집계표
메뉴에서는 수치형 변수의 통계표와 범주형 변수의 돗수분포표, 분할표를 작성하고 시각화합니다.
수치형 변수의 통계표를 작성하고 분포를 시각화합니다.
통계표 기능은 기술통계 > 집계표 > 수치형 변수 통계표의 메뉴 체계로 접근합니다.
전체
와 사용자 선택
에서 하나를 선택합니다.수치형 변수 목록(하나이상 선택):
리스트 박스가 나타납니다.대상변수 선택 방법:
에서 사용자 선택
을 지정했을 때만 나타납니다.결측치수
, 산술평균
, 표준편차
, 왜도
, 첨도
, 관측치수
, 표준오차
, 사분위수범위
에서 선택합니다.결측치수
, 산술평균
, 표준편차
, 왜도
, 첨도
가 기본 선택됩니다.최솟값
, 1/4분위
, 중위수
, 3/4분위
, 최댓값
, 1%분위
, 5%분위
, 10%분위
, 20%분위
, 30%분위
, 40%분위
, 60%분위
, 70%분위
, 80%분위
, 90%분위
, 95%분위
, 99%분위
에서 선택합니다.최솟값
, 1/4분위
, 중위수
, 3/4분위
, 최댓값
이 기본 선택됩니다.범주형 변수 목록:
이 나타납니다.밀도플롯(density plot)
을 함께 출력할지의 여부를 선택합니다.수치형 변수 통계표
에서 통계표를 출력하는 방법은 데이터셋:
리스트박스에서 diamonds
데이터를 선택을 전제로 소개합니다.
기술통계 > 집계표 > 수치형 변수 통계표의 기본 설정으로 실행
버튼을 클릭하면 오른쪽 결과 영역에 수치형 변수 집계 테이블이 출력됩니다.
이 기본 설정은 다음과 같습니다.
결측치수
, 산술평균
, 표준편차
, 왜도
, 첨도
최솟값
, 1/4분위
, 중위수
, 3/4분위
, 최댓값
전체 수치형 변수가 아닌, 사용자가 출력할 수치형 변수를 선택할 수 있습니다. 이 예제에서는 caret
, depth
, table
, price
변수를 선택합니다.
이제 집계 테이블을 위한 설정은 다음과 같이 정의되었습니다.
caret
, depth
, table
, price
결측치수
, 산술평균
, 표준편차
, 왜도
, 첨도
최솟값
, 1/4분위
, 중위수
, 3/4분위
, 최댓값
상기 조건으로 실행하면 다음과 같은 집계 테이블이 출력됩니다.
범주별 계산
체크 박스를 체크하면, 선택한 범주형 변수의 수준(levels)별로 수치형 변수의 통계표를 계산할 수 있습니다.
다음 그림처럼 범주별 계산
체크 박스를 체크하여 나타난 범주형 변수 목록:
에서 범주형 변수인 cut
을 선택합니다.
이제 집계 테이블을 위한 설정은 다음과 같이 정의되었습니다.
caret
, depth
, table
, price
결측치수
, 산술평균
, 표준편차
, 왜도
, 첨도
최솟값
, 1/4분위
, 중위수
, 3/4분위
, 최댓값
cut
상기 조건으로 실행하면 다음과 같은 집계 테이블이 출력됩니다.
집계 테이블은 여러 통계량으로 구성된 테이블이기 때문에, 해당 수치형 변수의 분포를 파악는 것은 쉽지 않습니다. 그런데 시각화와 함께 한다면 수치형 변수의 분포를 파악하기 수월해집니다.
시각화 여부
체크 박스를 체크하면, 수치형 변수의 분포를 파악할 수 있는 밀도플롯(density plot)
을 함께 출력할 수 있습니다.
다음은 시각화 여부
체크 박스를 체크한 경우의 결과입니다. 집계 테이블에 출력된 수치형 변수의 개수만큼의 플롯이 출력됩니다.
시각화 여부
체크 박스를 체크하고 범주별 변수를 선택한다면, 다음처럼 선택한 범주의 수준별로 수치형 변수의 밀도플롯이 개별 수치형 변수의 개수만큼 출력됩니다.
div(class = "bg-blue", h4(icon("lightbulb", style = "margin-right: 5px;"), "솔루션", style = "margin-bottom: 10px; margin-top: 0px;"), "하나의 단위 기능 화면에서 여러 조건의 정의에 따라서 다양한 관점의 결과가 출력되므로, 개별 입력 위젯의 사용법을 익히는 것이 필요합니다. 데이터의 건수가 적다면 기본 설정으로 최초 실행한 후 조건을 변경하면서 결과의 변화를 파악하는 것도 좋습니다.")
범주형 변수의 돗수분포표(frequency table)를 작성하고 분포를 시각화합니다.
범주형 변수 돗수분포표 기능은 기술통계 > 집계표 > 범주형 변수 돗수분포표의 메뉴 체계로 접근합니다.
전체
와 사용자 선택
에서 하나를 선택합니다.범주형 변수 목록(하나이상 선택):
리스트 박스가 나타납니다.대상변수 선택 방법:
에서 사용자 선택
을 지정했을 때만 나타납니다.막대그래프(bar plot)
을 함께 출력할지의 여부를 선택합니다.범주형 변수 돗수분포표
에서 돗수분포표를 출력하는 방법은 데이터셋:
리스트박스에서 diamonds
데이터를 선택을 전제로 소개합니다.
기술통계 > 집계표 > 범주형 변수 돗수분포표의 기본 설정으로 실행
버튼을 클릭하면 오른쪽 결과 영역에 범주형 변수의 돗수분포표가 출력됩니다.
이 기본 설정은 다음과 같습니다.
시각화 여부
체크 박스를 체크하면, 범주형 변수의 분포를 파악할 수 있는 막대그래프(bar plot)
을 함께 출력할 수 있습니다.
다음은 시각화 여부
체크 박스를 체크한 경우의 결과입니다. 돗수분포표로 범주형 변수의 분포를 파악할 수 있는 플롯이 출력됩니다.
두 범주형 변수의 분할표(contingency table)를 작성하고 분포를 시각화합니다.
통계표 기능은 기술통계 > 집계표 > 범주형 변수 분할표의 메뉴 체계로 접근합니다.
주변 합 종류:
리스트 박스가 출력됩니다.주변 합
, 행 백분율
, 열 백분율
, 전체 백분율
에서 하나를 선택합니다.주변 합
입니다.모자이크플롯(mosaic plot)
을 함께 출력할지의 여부를 선택합니다.기술통계 > 집계표 > 범주형 변수 분할표의 기본 설정으로 실행
버튼을 클릭하면 오른쪽 결과 영역에 두 범주형 변수의 분할표가 출력됩니다.
이 기본 설정은 다음과 같습니다.
cut
color
분할표에 개별 행/열의 집계를 위한 주변 합을 추가할 수 있습니다.
cut
color
주변 합
상기 조건으로 실행하면 다음과 같은 분할표가 출력됩니다.
시각화 여부
체크 박스를 체크하면, 두 범주형 변수의 분포를 파악할 수 있는 모자이크플롯(mosaic plot)
을 함께 출력할 수 있습니다.
다음은 시각화 여부
체크 박스를 체크한 경우의 결과입니다. 분할표로 출력된 두 범주형 변수의 분포를 파악할 수 있는 플롯이 출력됩니다.
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.