SAS Visual Analytics

The document outlines essential steps for exploring and preparing data in SAS Viya before building a machine learning model. Key steps include data import and inspection, cleaning, transformation, exploratory data analysis, and preparation for modeling. Following these guidelines ensures the dataset is well-prepared and relevant for effective model training.

Uploaded by

mymachinelearning002

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

65 views2 pages

SAS Visual Analytics

Uploaded by

mymachinelearning002

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 2

SAS Visual Analytics –

Explore Data
Exploring and preparing our data in SAS Viya is a crucial
step before building a machine learning model.
Here’s a comprehensive list of steps we can follow to help
us explore and understand our dataset’s capabilities and
limitations:

1. Data Import and Initial Inspection

 Import Data: Load your dataset into SAS Viya.
 Inspect Data: Use procedures like PROC CONTENTS to understand the
structure, types, and summary statistics of your data.
2. Data Cleaning
 Handle Missing Values: Identify and address missing values using
techniques like imputation or removal.
 Remove Duplicates: Ensure there are no duplicate records in your dataset.
 Correct Errors: Look for and correct any data entry errors or inconsistencies.
3. Data Transformation
 Normalization/Standardization: Scale your data to ensure all features
contribute equally to the model.
 Encoding Categorical Variables: Convert categorical variables into
numerical formats using one-hot encoding or label encoding.
 Feature Engineering: Create new features that may be more predictive for
your model.
4. Exploratory Data Analysis (EDA)
 Summary Statistics: Use PROC MEANS or PROC FREQ to get descriptive
statistics.
 Data Visualization: Create visualizations like histograms, box plots, scatter
plots, and correlation matrices to understand relationships and distributions.
 Correlation Analysis: Identify relationships between variables using
correlation coefficients.
5. Data Reduction
 Feature Selection: Use techniques like correlation analysis, mutual
information, or feature importance from preliminary models to select relevant
features.
 Dimensionality Reduction: Apply methods like PCA (Principal Component
Analysis) to reduce the number of features while retaining most of the
variance.
6. Data Splitting
 Train-Test Split: Divide your data into training and testing sets to evaluate
your model’s performance.
 Cross-Validation: Use cross-validation techniques to ensure your model
generalizes well to unseen data.
7. Data Sampling
 Resampling Techniques: Apply techniques like bootstrapping or stratified
sampling to ensure your training data is representative of the overall dataset.
8. Data Exploration for Model Relevance
 Feature Importance: Use preliminary models to identify which features are
most important for predicting the target variable.
 Target Variable Analysis: Analyze the distribution and characteristics of
the target variable to understand its behavior.
9. Data Preparation for Modeling
 Create Pipelines: Set up data preprocessing pipelines to automate the
transformation and cleaning steps.
 Save Processed Data: Save the cleaned and transformed data for use in
model training.
10. Documentation and Reporting
 Document Steps: Keep detailed records of all data exploration and
preparation steps.
 Generate Reports: Create reports summarizing your findings and the steps
taken to prepare the data.

By following these steps, you’ll ensure that your data is well-

prepared and relevant for building a your first machine learning
model in SAS Viya

Day 03 Session 01-2
No ratings yet
Day 03 Session 01-2
18 pages
176 Final Paper PDF
No ratings yet
176 Final Paper PDF
23 pages
Exploring SAS Viya: Data Analysis & Modeling
No ratings yet
Exploring SAS Viya: Data Analysis & Modeling
5 pages
Statistics For Data Science
100% (3)
Statistics For Data Science
39 pages
What Is Data Visualization and Why Is It Important
No ratings yet
What Is Data Visualization and Why Is It Important
18 pages
Introduction to Statistical Analysis with SAS
No ratings yet
Introduction to Statistical Analysis with SAS
9 pages
Lecture No 2 Data Preparation
No ratings yet
Lecture No 2 Data Preparation
23 pages
Exam Structure: Theory & Practice Guide
No ratings yet
Exam Structure: Theory & Practice Guide
4 pages
Daily Report 03
No ratings yet
Daily Report 03
4 pages
Common Analytics Interview Questions
No ratings yet
Common Analytics Interview Questions
4 pages
Practical - 1 - Data Exploration and Data Preparation - DAL - Lab
100% (1)
Practical - 1 - Data Exploration and Data Preparation - DAL - Lab
8 pages
SAS Viya For Learners - CPML35
No ratings yet
SAS Viya For Learners - CPML35
7 pages
Data Preprocessing
No ratings yet
Data Preprocessing
4 pages
Statistics For Data Science - 1
100% (2)
Statistics For Data Science - 1
38 pages
7 Data Preprocessing Steps in Machine Learning
No ratings yet
7 Data Preprocessing Steps in Machine Learning
5 pages
Data Exploration and Preprocessing Guide
No ratings yet
Data Exploration and Preprocessing Guide
81 pages
SAS VA - Basics - Slides With Notes
No ratings yet
SAS VA - Basics - Slides With Notes
160 pages
FAI Notes - Unit 5
No ratings yet
FAI Notes - Unit 5
12 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
23 pages
Lecture 1
No ratings yet
Lecture 1
11 pages
ML Exp No 1
No ratings yet
ML Exp No 1
8 pages
Unit 3-BA
No ratings yet
Unit 3-BA
31 pages
DAV Practical 2
No ratings yet
DAV Practical 2
6 pages
Lecture 1
No ratings yet
Lecture 1
37 pages
Day 1 Article For Discussion
No ratings yet
Day 1 Article For Discussion
5 pages
Data Warriors: Master Machine Building
No ratings yet
Data Warriors: Master Machine Building
11 pages
UNIT-2 - Data Science (Partial)
No ratings yet
UNIT-2 - Data Science (Partial)
21 pages
Rohan More
No ratings yet
Rohan More
16 pages
SML Updated UNIT-2
No ratings yet
SML Updated UNIT-2
43 pages
SAS VA 7.3 Getting Started With Data Preparation
No ratings yet
SAS VA 7.3 Getting Started With Data Preparation
22 pages
Machine Learning Essentials Guide
No ratings yet
Machine Learning Essentials Guide
33 pages
Aiml Answers
No ratings yet
Aiml Answers
20 pages
Introduction To Data Analysis
No ratings yet
Introduction To Data Analysis
24 pages
Data Analysis Step by Step Guide
No ratings yet
Data Analysis Step by Step Guide
2 pages
Unit 2 - Data Science & Big Data - WWW - Rgpvnotes.in PDF
No ratings yet
Unit 2 - Data Science & Big Data - WWW - Rgpvnotes.in PDF
17 pages
Session1 DataCharacteristics
No ratings yet
Session1 DataCharacteristics
41 pages
Module 1 - Introduction To Data Analytics
No ratings yet
Module 1 - Introduction To Data Analytics
21 pages
ML 2
No ratings yet
ML 2
8 pages
Business Analytics
No ratings yet
Business Analytics
14 pages
Supervised Learning Research Paper With Images
No ratings yet
Supervised Learning Research Paper With Images
10 pages
B Unit 5 Data Literacy
No ratings yet
B Unit 5 Data Literacy
3 pages
Python EDA: Stats, Visualization, Correlation
No ratings yet
Python EDA: Stats, Visualization, Correlation
7 pages
DA Unit 2 Trio 1
No ratings yet
DA Unit 2 Trio 1
26 pages
Viya 4 Pricing Updates For Partners
No ratings yet
Viya 4 Pricing Updates For Partners
9 pages
Ads Imp Qna 2025 15 04 06 06 35
No ratings yet
Ads Imp Qna 2025 15 04 06 06 35
33 pages
Learneverythingai 1
No ratings yet
Learneverythingai 1
9 pages
Statistics With R Week 5
No ratings yet
Statistics With R Week 5
3 pages
VYOV42 Slides and Notes
No ratings yet
VYOV42 Slides and Notes
52 pages
Dev Core
No ratings yet
Dev Core
7 pages
Data Mining and Analysis Techniques
No ratings yet
Data Mining and Analysis Techniques
27 pages
EDA Techniques in SAS for Data Science
No ratings yet
EDA Techniques in SAS for Data Science
25 pages
Data Literacy
No ratings yet
Data Literacy
4 pages
ADS IA 1 Syllabus Prep
No ratings yet
ADS IA 1 Syllabus Prep
5 pages
EDA New
No ratings yet
EDA New
15 pages
Unit 4
No ratings yet
Unit 4
33 pages
Tools For Data Preparation
No ratings yet
Tools For Data Preparation
4 pages
Unit 2 ML
No ratings yet
Unit 2 ML
14 pages
PPS Data Types 32slides Preet Yadav
No ratings yet
PPS Data Types 32slides Preet Yadav
32 pages
Technical MCQs CTS
No ratings yet
Technical MCQs CTS
16 pages
Model Komunikasi Bencana "Table Top Exercise" Dalam Pengurangan Risiko Bencana
No ratings yet
Model Komunikasi Bencana "Table Top Exercise" Dalam Pengurangan Risiko Bencana
18 pages
Datasheet Battery Protect 48 V 100 A EN
No ratings yet
Datasheet Battery Protect 48 V 100 A EN
1 page
Ap DSC Recruitment - .
No ratings yet
Ap DSC Recruitment - .
2 pages
Huawei Firewall Technology Basis
No ratings yet
Huawei Firewall Technology Basis
15 pages
FT 3128
No ratings yet
FT 3128
33 pages
Interview Series ADF Part-1
No ratings yet
Interview Series ADF Part-1
17 pages
Notes of Java Unit 4
No ratings yet
Notes of Java Unit 4
54 pages
p612 Shamir
No ratings yet
p612 Shamir
2 pages
Item Recommendation Using Collaborative Filtering in Mobile Social Games A Case Study
No ratings yet
Item Recommendation Using Collaborative Filtering in Mobile Social Games A Case Study
5 pages
Starting Youtube From Zero: Resource Guide
No ratings yet
Starting Youtube From Zero: Resource Guide
7 pages
Tcexam Users Template Siswa 8
No ratings yet
Tcexam Users Template Siswa 8
15 pages
Unit 7 Introduction To ITS: Dr. Yonas Minalu
No ratings yet
Unit 7 Introduction To ITS: Dr. Yonas Minalu
32 pages
Department of Mechanical Engineering: Educational Background
No ratings yet
Department of Mechanical Engineering: Educational Background
1 page
Identifying Early Reviewers' Impact
No ratings yet
Identifying Early Reviewers' Impact
11 pages
Capstone Project: Group 5
No ratings yet
Capstone Project: Group 5
39 pages
Pso Loc Rwy 20 PDF
No ratings yet
Pso Loc Rwy 20 PDF
1 page
Control-M CV
No ratings yet
Control-M CV
2 pages
CRSP-3D User Manual for Rockfall Simulation
100% (1)
CRSP-3D User Manual for Rockfall Simulation
163 pages
Artifical Intelligence Class 10th
No ratings yet
Artifical Intelligence Class 10th
193 pages
Marketing Crossword Puzzle - WordMint New
100% (2)
Marketing Crossword Puzzle - WordMint New
2 pages
AC Practice
No ratings yet
AC Practice
2 pages
Exam 2008 March
No ratings yet
Exam 2008 March
3 pages
KDM - Simple Mechanism and Inversion
No ratings yet
KDM - Simple Mechanism and Inversion
29 pages
Pranav Mistry: Innovator and Leader
No ratings yet
Pranav Mistry: Innovator and Leader
8 pages
Voice Alarm System Service Guide
No ratings yet
Voice Alarm System Service Guide
200 pages
HD Audio IP Intercom System GDS3702
No ratings yet
HD Audio IP Intercom System GDS3702
2 pages
Barangay Assembly Insights
No ratings yet
Barangay Assembly Insights
1 page
EE 220: Signals and Systems: S Sirfanhussain @uet - Edu.pk Naveed@uet - Edu.pk
No ratings yet
EE 220: Signals and Systems: S Sirfanhussain @uet - Edu.pk Naveed@uet - Edu.pk
2 pages

SAS Visual Analytics

Uploaded by

SAS Visual Analytics

Uploaded by

SAS Visual Analytics –

1. Data Import and Initial Inspection

By following these steps, you’ll ensure that your data is well-

You might also like