Introduction to Data
Visualization
Dr. Donny Maha Putra, [Link]., [Link]
Lecturer in UPN Veteran Jakarta and Data Analytic Officer in
Ministry of Finance of Indonesia
Salsabila Ramadhina [Link] MSc
Lecturer in UPN Veteran Jakarta, Product Manager at Ultra
Voucher, and Scholarship Mentor at Kobi Education
[Link] febupnvj [Link] febupnvj@[Link]
Course Focus
1. The Role of Data Visualization in the Context of Big Data
Significance of Visualization in Big Data:
● Enhancing Understanding: How data visualization helps in
simplifying and facilitating the understanding of patterns, trends, and anomalies in large volumes of data.
● Better Decision Making: Visualization as a tool to support faster and more accurate data- driven decision
making.
● Effective Communication: Visualization allows complex information to be conveyed visually so that it is
easier to understand by various stakeholders.
Course Focus
● Basic Concepts of Data Visualization (Definition and Purpose of Data Visualization)
What is Data Visualization?:
● The definition of data visualization as a graphical representation of data that aims to communicate
information visually.
● Primary Function: How visualizations serve to analyze data, find correlations, and convey findings in an
easy-to-interpret way.
Key Elements in Visualization:
● Graphs, Charts, and Maps: Common types of visualizations and how to choose the appropriate
visualization format for the type of data.
● Principles of Good Design: The importance of layout, color, andreadability in creating
Session Objectives
● The Role of Data Visualization in the Context of Big Data
● Definition of Data Visualization
● Its Purpose
● Key Elements in Visualization
● Mini Quizzes
● Case Study
Is it a Good Visualization?
Is it a Good Visualization?
Is it a Good Visualization?
Is it a Good Visualization?
A B C
What is Data Visualization?
Data Visualizations
● a graphical representation of data that aims to communicate information visually.
● Primary Function: How visualizations serve to analyze data, find correlations, and
convey findings in an easy-to-interpret way.
Why Data Visualization Matters in Big
Data?
Raw data is often too complex to understand without visuals
Tips for Meaningful Visualization
Type of Chart
Type of Chart
Type Purpose Example
Bar/Column Compare quantities across Sales by product
categories category
Line Show trends over time Stock price over months
Pie/Donut Show parts of a whole Market share by brand
Scatter Show relationships Price vs. rating of
between variables products
Map Show geographic data Customers by country or
region
BAR CHART (Grafik Batang)
Grafik ini menggunakan batang horizontal atau vertikal
untuk merepresentasikan nilai. Setiap batang mewakili
kategori, dan panjangnya mencerminkan nilai
kuantitatif. Bar chart cocok untuk membandingkan jumlah
atau frekuensi antar kategori.
Example:
Membandingkan penjualan dari berbagai varian pizza dan waktu dengan penjualan
terbanyak.
LINE CHART (Grafik Garis)
Grafik ini menggunakan garis untuk menghubungkan
titik-titik data yang mewakili nilai pada interval waktu
tertentu. Line chart digunakan untuk menunjukkan tren
atau perubahan dalam data dari waktu ke waktu.
Example:
Melacak tren penjualan pizza harian selama 14 hari dalam sebulan untuk melihat fluktuasi.
PIE CHART (Grafik lingkaran)
Grafik ini membagi lingkaran menjadi irisan yang
merepresentasikan bagian dari keseluruhan. Setiap
irisan menunjukkan proporsi suatu kategori
dibandingkan keseluruhan data. Pie chart berguna
untuk menunjukkan proporsi atau persentase
antar kategori dalam satu kelompok data.
Example:
Mengilustrasikan distribusi penjualan berdasarkan kategori pizza, seperti Classic, Supreme,
Veggie, Chicken dalam kurun waktu tertentu.
HISTOGRAM
Mirip dengan bar chart, tetapi digunakan untuk
menampilkan distribusi frekuensi dari data
kontinu. Sumbu horizontal mewakili interval atau
rentang nilai, dan sumbu vertikal menunjukkan
frekuensi kemunculannya. Histogram berguna untuk
melihat distribusi data atau pola frekuensi, misalnya
untuk memahami berapa banyak pesanan terjadi
dalam rentang harga tertentu.
Example:
Melihat distribusi harga pizza yang paling sering dipesan oleh pelanggan.
HEATMAP
Heatmap menggunakan warna
untuk menunjukkan intensitas data
di tabel atau grid. Semakin gelap
atau terang warnanya, semakin
tinggi atau rendah nilainya. Cocok
untuk menunjukkan data yang
kompleks atau untuk melihat pola
dengan cepat, misalnya dalam
analisis frekuensi waktu.
Example:
Melihat kapan waktu pemesanan paling sibuk berdasarkan jam dan hari dalam seminggu.
STACKED BAR CHART
(Grafik Batang Bertumpuk)
Variasi dari bar chart di mana setiap
batang dibagi menjadi beberapa
segmen yang mewakili kategori
berbeda. Berguna untuk
menunjukkan kontribusi beberapa
kategori terhadap total keseluruhan
dalam grup data.
Example:
Menampilkan kontribusi dari berbagai kategori pizza (vegetarian, non-vegetarian) dalam
total penjualan per hari.
BOX PLOT
Grafik ini menggambarkan distribusi data
melalui kuartil, termasuk nilai median,
minimum, maksimum, dan outlier (data
ekstrem). Digunakan untuk menganalisis
penyebaran data dan mengidentifikasi
outliers.
Example:
Menganalisis variabilitas harga pizza untuk melihat apakah ada varian dengan harga yang
jauh lebih tinggi atau lebih rendah dari yang lain.
SCATTER PLOT
Grafik ini menampilkan titik-titik yang
tersebar di sumbu x dan y untuk
menunjukkan hubungan antara dua
variabel. Scatter plot digunakan untuk
mencari pola atau korelasi antara dua
variabel, misalnya untuk melihat apakah
ada hubungan antara harga produk dan
jumlah pesanan.
Example:
Menganalisis apakah pizza dengan harga lebih tinggi memiliki jumlah pesanan lebih rendah
atau sebaliknya.
What is the best chart for these scenarios?
1. You want to explore whether there’s a relationship between employee experience and
their salary
Scatter Plot
2. You want to track the average temperature over the last 12 months
Line Chart
3. You want to compare sales performance of five different products.
Bar Chart
Key Principles of Good Design
Key Principles of Good Design
Key Principles of Good Design
Key Principles of Good Design
Layout
● Use titles that clearly tell what the chart shows.
● Label axes with units.
● Keep it clean: avoid 3D effects, unnecessary gridlines, chartjunk.
● Order categories logically (e.g., descending bar height).
Color
● Use color with purpose, not decoration.
● Use contrasting colors to highlight key data.
● Avoid rainbow palettes—stick to 2-4 shades for clarity.
● Make sure it works in grayscale (especially for print or colorblind viewers).
3 Key Principles of Good Design
Readability
● Use large enough fonts.
● Don’t overcrowd the chart.
● Use tooltips, legends, or annotations only if needed—too many distract.
Homework (Ddl 2 May 23.59)
● Create visualizations from the dataset below (Tools BEBAS)
[Link]
sp=sharing
JAWABLAH PERTANYAAN INI
● Do you think it is the most appropriate visualizations for the data?
● Does your visualization already comply the data visualization principle? Why?
● What insight do you get from the chart?
Absen 1-5: BAR CHART
Absen 6-10: LINE CHART
Absen 11-15: HISTOGRAM
Absen 16-20: DONUT CHART
Absen 21-25: BOX PLOT
Absen 26-30: SCATTER PLOT
Absen 31-40: Combo Chart
Happy Learning!