knitr::opts_chunk$set(
  collapse = TRUE, warning = FALSE, message = FALSE, fig.align='center', fig.width=7, fig.height=5,
  comment = "#>"
)

Introduction

Plot komposisi digunakan untuk menunjukkan persentasi value dari masing-masing variabel kategori. Persentase sendiri di dapat dari value sebuah kategori dibagi total value seluruh kategori kali 100. Oleh karena itu, syarat pertama yang harus dipenuhi untuk membuat plot ini adalah memiliki data dengan minimal dua kolom, di mana masing-masing kolomnya merepresentasikan kategori dan jumlah.

Pie Chart

PIe chart merupakan plot klasik yang sering digunakan. Fungsi pie_plot() di sini mengambil dua variabel dari sebuah data frame yang berisi dua variabel (kategori dan numerik). Kami merepresentasikannya dalam plot sebagai persentase yang dihasilkan dari value masing-masing kategori dibagi total value kali 100. Oleh karena itu, untuk membuat pie chart dengan fungsi ini anda hanya perlu data seperti objek df yang dihasilkan dari skrip dibawah ini.

library(dataplot)
library(ggplot2)

df = data.frame("brand" = c("Samsung","Huawei","Apple","Xiaomi","OPPO"),
                "share" = c(10,30,20,35,5))

mycolor <- c("#55DDE0", "#33658A", "#2F4858", "#F6AE2D", "#F26419")

plot_pie(data = df, x = "brand", y = "share", color = mycolor,
         title = "Lorem Ipsum is simply dummy text",
         subtitle = "Contrary to popular belief, Lorem Ipsum is not simply random text",
         data_source = "Sumber: www.kedata.online")

Waffle Chart

Plot Waffle merupakan cara lain untuk menunjukkan komposisi kategorikal dari total populasi. Plot ini bisa menjadi alternatif dari pie jika plot tersebut dianggap terlalu umum. Di dalam ggplot2 plot waffle bisa dibuat dengan menggunakan fungsi geom_tile() . Berikut adalah contohnya.

library(dataplot)
library(ggplot2)

df <- structure(list(region = c("Africa", "Asia", "Latin America",
                                "Other", "US-born"),
                     ncases = c(36L, 34L, 56L, 2L, 44L)),
                .Names = c("region","ncases"),
                row.names = c(NA, -5L), class = "data.frame")

plot_waffle(data = df, x = "region", y = "ncases", ndeep = 10,
            title = "Lorem Ipsum is simply dummy text",
            subtitle = "Contrary to popular belief, Lorem Ipsum is not simply random text",
            data_source = "www.kedata.online")

Apa yang terjadi di dalam fungsi? sama dengan yang terjadi dan dipahami dalam membuat pie chart. Di mana isi dari plot merupakan persentase dari jumlah masing-masing variabel kategorik. Hanya saja, porsi dalam waffle chart di representasikan dalam bentuk potongan-potongan balok yang ditempatkan dalam x dan y yang sudah disesuaikan dengan porsi per kategori.

Treemap

Treemap merupakan salah satu jenis plot lain yang bisa digunakan untuk menunjukkan komposisi. dataplot memiliki fungsi plot_treemap() yang bisa digunakan baik untuk memvisualkan komposisi satu maupun dua variabel kategirik. Untuk memvisualisasika dua variabel kategorik, maka parameter subgroup perlu di isi. Sementara jika tidak maka fungsi akan memilih variabel dari parameter fill untuk mengisi text. Sementara area ditentuka oleh variabel numerik.

library(ggplot2)
library(dataplot)
library(treemapify)

df <- G20

plot_treemap(data = df,
             area = "gdp_mil_usd",
             fill = "region",
             subgroup = "country",
             title = "Lorem Ipsum is simply dummy text",
             subtitle = "Contrary to popular belief, Lorem Ipsum is not simply random text",
             data_source = "www.kedata.online"
             )

Stacked barchart

Barchart merupakan salah satu jenis plot yang bisa difungsikan baik untuk menunjukkan perbandingan maupun komposisi. Dalam konteks ini, stacked barchart bisa digunakan untuk menunjukkan kedua secara bersamaan. Di mana di satu bagian dia akan menunjukkan perbandingan antar variabel. Sementara di sisi lain, stacked barchart juga akan menunjukkan komposisi dalam masing-masing variabel.

library(ggplot2)
library(dataplot)
library(tidyr)
library(dplyr)

df1 <- mpg %>%
  count(manufacturer, class)

plot_stackedbar(data = df1,
                x = "manufacturer",
                y = "n",
                fill = "class",
                x_title = "col_x",
                y_title = "col_y",
                title = "Lorem Ipsum is simply dummy text",
                subtitle = "Contrary to popular belief, Lorem Ipsum is not simply random text",
                data_source = "www.kedata.online")


eppofahmi/dataplot documentation built on Jan. 22, 2025, 1:14 a.m.