library(shiny)
library(htmltools)
div(class = "preface", 
    h4("들어가기"),
    "업로드한 데이터나 저장된 데이터를 집계하는 방법을 다룹니다.", br(),
    "수치형 변수와 범주형 변수의 특성별로 요약 집계와 시각화를 수행하는 방법을 설명합니다.")


집계표 기능

집계표 메뉴에서는 수치형 변수의 통계표와 범주형 변수의 돗수분포표, 분할표를 작성하고 시각화합니다.

수치형 변수 통계표

수치형 변수의 통계표를 작성하고 분포를 시각화합니다.

통계표 기능은 기술통계 > 집계표 > 수치형 변수 통계표의 메뉴 체계로 접근합니다.


집계를 위한 입력 위젯


기본 통계표 출력

수치형 변수 통계표에서 통계표를 출력하는 방법은 데이터셋: 리스트박스에서 diamonds 데이터를 선택을 전제로 소개합니다.

기술통계 > 집계표 > 수치형 변수 통계표의 기본 설정으로 실행 버튼을 클릭하면 오른쪽 결과 영역에 수치형 변수 집계 테이블이 출력됩니다.

이 기본 설정은 다음과 같습니다.

수치형 변수 집계 테이블


사용자 변수선택 통계표 출력

전체 수치형 변수가 아닌, 사용자가 출력할 수치형 변수를 선택할 수 있습니다. 이 예제에서는 caret, depth, table, price 변수를 선택합니다.

수치형 변수 목록 선택 위젯

이제 집계 테이블을 위한 설정은 다음과 같이 정의되었습니다.

상기 조건으로 실행하면 다음과 같은 집계 테이블이 출력됩니다.

변수를 선택한 수치형 변수 집계 테이블


범주별 수치형 변수 통계표 출력

범주별 계산 체크 박스를 체크하면, 선택한 범주형 변수의 수준(levels)별로 수치형 변수의 통계표를 계산할 수 있습니다.

다음 그림처럼 범주별 계산 체크 박스를 체크하여 나타난 범주형 변수 목록:에서 범주형 변수인 cut을 선택합니다.

범주형 변수 목록:


이제 집계 테이블을 위한 설정은 다음과 같이 정의되었습니다.

상기 조건으로 실행하면 다음과 같은 집계 테이블이 출력됩니다.

범주별 수치형 변수 집계 테이블


시각화와 함께 통계표 출력

집계 테이블은 여러 통계량으로 구성된 테이블이기 때문에, 해당 수치형 변수의 분포를 파악는 것은 쉽지 않습니다. 그런데 시각화와 함께 한다면 수치형 변수의 분포를 파악하기 수월해집니다.

시각화 여부 체크 박스를 체크하면, 수치형 변수의 분포를 파악할 수 있는 밀도플롯(density plot)을 함께 출력할 수 있습니다.

다음은 시각화 여부 체크 박스를 체크한 경우의 결과입니다. 집계 테이블에 출력된 수치형 변수의 개수만큼의 플롯이 출력됩니다.

수치형 변수의 시각화 포함 집계 테이블


시각화 여부 체크 박스를 체크하고 범주별 변수를 선택한다면, 다음처럼 선택한 범주의 수준별로 수치형 변수의 밀도플롯이 개별 수치형 변수의 개수만큼 출력됩니다.

범주별 수치형 변수의 밀도플롯 포함 집계 테이블


div(class = "bg-blue", 
    h4(icon("lightbulb", style = "margin-right: 5px;"), 
       "솔루션", style = "margin-bottom: 10px; margin-top: 0px;"), 
    "하나의 단위 기능 화면에서 여러 조건의 정의에 따라서 다양한 관점의 결과가 출력되므로, 개별 입력 위젯의 사용법을 익히는 것이 필요합니다. 데이터의 건수가 적다면 기본 설정으로 최초 실행한 후 조건을 변경하면서 결과의 변화를 파악하는 것도 좋습니다.")


범주형 변수 돗수분포표

범주형 변수의 돗수분포표(frequency table)를 작성하고 분포를 시각화합니다.

범주형 변수 돗수분포표 기능은 기술통계 > 집계표 > 범주형 변수 돗수분포표의 메뉴 체계로 접근합니다.


돗수분포표를 위한 입력 위젯


기본 돗수분포표 출력

범주형 변수 돗수분포표에서 돗수분포표를 출력하는 방법은 데이터셋: 리스트박스에서 diamonds 데이터를 선택을 전제로 소개합니다.

기술통계 > 집계표 > 범주형 변수 돗수분포표의 기본 설정으로 실행 버튼을 클릭하면 오른쪽 결과 영역에 범주형 변수의 돗수분포표가 출력됩니다.

이 기본 설정은 다음과 같습니다.

범주형 변수의 돗수분포표


시각화와 함께 돗수분포표 출력

시각화 여부 체크 박스를 체크하면, 범주형 변수의 분포를 파악할 수 있는 막대그래프(bar plot)을 함께 출력할 수 있습니다.

다음은 시각화 여부 체크 박스를 체크한 경우의 결과입니다. 돗수분포표로 범주형 변수의 분포를 파악할 수 있는 플롯이 출력됩니다.

시각화 포함 돗수분포표

범주형 변수 분할표

두 범주형 변수의 분할표(contingency table)를 작성하고 분포를 시각화합니다.

통계표 기능은 기술통계 > 집계표 > 범주형 변수 분할표의 메뉴 체계로 접근합니다.


분할표를 위한 입력 위젯


기본 분할표 출력

기술통계 > 집계표 > 범주형 변수 분할표의 기본 설정으로 실행 버튼을 클릭하면 오른쪽 결과 영역에 두 범주형 변수의 분할표가 출력됩니다.

이 기본 설정은 다음과 같습니다.

두 범주형 변수의 분할표


주변합 포함 분할표 출력

분할표에 개별 행/열의 집계를 위한 주변 합을 추가할 수 있습니다.

상기 조건으로 실행하면 다음과 같은 분할표가 출력됩니다.

주변합을 포함한 두 범주형 변수 분할표


시각화와 함께 분할표 출력

시각화 여부 체크 박스를 체크하면, 두 범주형 변수의 분포를 파악할 수 있는 모자이크플롯(mosaic plot)을 함께 출력할 수 있습니다.

다음은 시각화 여부 체크 박스를 체크한 경우의 결과입니다. 분할표로 출력된 두 범주형 변수의 분포를 파악할 수 있는 플롯이 출력됩니다.

시각화 포함 분할표



bit2r/BitStat documentation built on Nov. 8, 2022, 4:17 p.m.