0% found this document useful (0 votes)

121 views40 pages

Data Cleaning Principles in SAS

This document provides an overview of principles for cleaning dirty data using SAS. It discusses including and excluding cases based on criteria, visualizing data distributions to identify outliers, dealing with invalid or inconsistent character variables, and approaches for handling missing data. The presentation also reviews SAS procedures like PROC FREQ, MEANS, and UNIVARIATE that can be used to understand data distributions and identify issues requiring data cleaning.

Uploaded by

melu-34533

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

121 views40 pages

Data Cleaning Principles in SAS

Uploaded by

melu-34533

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 40

DIRTY DATA?

CLEAN IT USING SAS

AN INTRODUCTION TO DATA CLEANING PRINCIPLES

CYP-C Research Champion Webinar

August 11, 2017
Giancarlo Di Giuseppe, MPH
Pediatric Oncology Group of Ontario

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Outline
• SAS overview and procedures – revisited
• Fundamental principles to build a clean dataset
• Inclusion / exclusion criteria
• Visualizing data distributions
• Outliers
• Invalid or inconsistent character variables
• Dealing with missing data
• Creating data checkpoints
Healthcare innovation | Survivor care | Family assistance
Population data | Policy development | Education | Research
SAS Overview - Revisited
• For our purposes only two major things you can do in SAS
– DATA step - Manipulate the data in some way
• Reading in Data
• Creating and Redefining Variables
• Sub-Setting Data
• Working with Dates
• Working with Formats

– PROCedure step
• Analyze the data
• Produce frequency tables
• Estimate a regression model

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
SAS Procedures – Revisited
• SAS Procedures
– PROC FREQ
– PROC PRINT
– PROC MEANS
– PROC UNIVARIATE
– PROC SORT
– PROC CONTENTS

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
PRINCIPLES FOR CLEANLINESS

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Understanding Your Dirty Data Source
• No database is initially ever
“clean”

• Databases are not constructed

with our own specific research
questions in mind

• Researchers must be familiar with

the purpose, how variables are
captured and defined, and the http://3rdsectorlabs.com/wp-content/uploads/2014/06/TSL-data-

structure of the database shower.png

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Having an Analysis Plan
• Having clean data requires a sound analysis plan
– Envision what the analysis dataset will look like with all
variables and formats before performing data cleaning

• Determine what your study population denominator

is before you begin cleaning
– Is it patient population? Is it number of total diagnoses
(therefore, multiple dx’s per patient is possible)? Or is it
person-time? Etc.
– Based on the research question!

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Data Manipulation and Data Cleaning:
A Simultaneous Process
• Data manipulation and data cleaning are not
mutually exclusive, rather they go hand-in-hand!

• Both can (and should) be

performed within a single
DATA step
http://i.telegraph.co.uk/multimedia/archive/03219/handshake1_3219777k.jpg

• Ensures efficient and easy to follow SAS

programming

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
SUB-SETTING YOUR DATA

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Receiving Your Data Cut
• Typically data is requested with slightly more
information than needed
– Allows for wiggle room if hypothesis change slightly

• No data cut is ever perfect

– Data still needs to be cleaned

• Initial data cuts are never ready to be analyzed,

they must first be cleaned

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Cleaning Using Inclusion & Exclusion Criteria
PROC SORT DATA = T7 OUT=T7_SORT; BY CYPCID DX_DATE; RUN;

DATA T8; SET T7_SORT; BY CYPCID; First cancers

/* INTERESTED IN PRIMARY DIAGNOSIS ONLY */
IF FIRST.CYPCID;
IF ORDINAL_PRIMARY IN (1);

/* AGE INCLUSION CRITERIA – 0 TO 14 */

IF 0 <= DX_AGE < 15;
Children aged 0 to 14
IF 0 <= DX_AGE < 1 THEN DX_AGE_GR=1;
ELSE IF DX_AGE < 7 THEN DX_AGE_GR=2;
ELSE IF DX_AGE < 11 THEN DX_AGE_GR=3; Note: Data cleaning
ELSE DX_AGE_GR=4; and data manipulation
LABEL DX_AGE_GR = "AGE AT FIRST DIAGNOSIS - GROUPED";
FORMAT DX_AGE_GR DX_AGE_GR.; done simultaneously!
/* SELECTS THOSE WITH A DIAGNOSIS BETWEEN 2002 & 2012 */
IF 2002 <= YEAR(DX_DATE) <= 2012; Diagnosed between 2002-
DX1_YEAR = YEAR(DX_DATE);
2012
/* LEUKEMIA CASES */
IF ICCC_MAIN = 1010 OR ICDO_M_CODE IN (9826, 9835, 9836,
9837);
Only concerned with
leukemia cases
RUN; *N=2,492; Keep logs of sample size in your DATA steps!!

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
DATA DISTRIBUTION

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Recall From Last Session
• PROC FREQ produces frequency outputs
– Can be used for numeric or character variables
– Useful for counts and proportions

• PROC MEANS and UNIVARIATE produce outputs

describing the data distribution for numeric variables
– Checkpoint for data distributions and normality

• PROC FREQ and PROC MEANS/UNIVARIATE are

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Distribution of Continuous Data
ODS GRAPHICS ON;
PROC UNIVARIATE DATA = T8 NORMAL;
ID CYPCID;
VAR WBC_COUNT;
HISTOGRAM WBC_COUNT / NORMAL;
RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Distribution of Continuous Data II

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Distribution of Continuous Data III

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Normality of Continuous Data

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
OUTLIERS

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Dealing With Outliers
• If there are many outliers, these will introduce
bias in your study
• Many options to handle these skewed data:
– Median + IQR instead of mean
– Use a logical range of values and assign any
outlier the upper bound of the range
– Categorize your data based on the distribution or
clinically meaningful ranges
• Whichever approach used should be justified!

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Dealing With Outliers II
DATA T8; SET T8;
/* UPPER LIMIT TO OUTLIERS */
IF WBC_COUNT >= 500 THEN WBC_COUNT_CLEAN = 500;
ELSE WBC_COUNT_CLEAN = WBC_COUNT;

/* CREATING CLINICAL CATEGORIES */

IF WBC_COUNT ^= . THEN DO;
IF WBC_COUNT < 50 THEN WBC_GROUP = 1;
ELSE IF WBC_COUNT < 100 THEN WBC_GROUP = 2;
ELSE IF WBC_COUNT < 200 THEN WBC_GROUP = 3;
DO loop
ELSE IF WBC_COUNT < 300 THEN WBC_GROUP = 4;
ELSE IF WBC_COUNT < 400 THEN WBC_GROUP = 5;
ELSE WBC_GROUP = 6; END;
RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Dealing With Outliers III
/* MEAN VS MEDIAN + IQR */
PROC MEANS DATA=T8 MEAN MIN MAX Q1 MEDIAN Q3;
VAR WBC_COUNT_CLEAN;
RUN;

/* DATA CATEGORIZATION */
PROC FREQ DATA=T8;
TABLES WBC_GROUP /MISSING;
RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Dealing With Outliers III

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Dealing With Outliers III
/* MEAN VS MEDIAN + IQR */
PROC MEANS DATA=T8 MEAN MIN MAX Q1 MEDIAN Q3;
VAR WBC_COUNT_CLEAN;
RUN;

/* DATA CATEGORIZATION */
PROC FREQ DATA=T8;
TABLES WBC_GROUP /MISSING;
RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
CLEANING CHARACTER VARIABLES

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
CApITOLIzATioN Matters!
PROC FREQ DATA=T8;
TABLES PROTOCOL_NAME;
RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
CAPITOLIZATION Matters! Use UPCASE
DATA T8; SET T8;
PROTOCOL_NAME = UPCASE(PROTOCOL_NAME);
RUN;
PROC FREQ DATA=T8; TABLES PROTOCOL_NAME; RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
FINDing, Cleaning, and Manipulating
DATA T9; SET T8;
PROTOCOL_NAME = UPCASE(PROTOCOL_NAME);

IF FIND(PROTOCOL_NAME,"ALL PROTOCOL C") THEN DO;

PROTOCOL_NAME = "ALL PROTOCOL C";
DO loop
ALL_RISK = "HIGH RISK";
END;
RUN;
PROC FREQ DATA=T9; TABLES PROTOCOL_NAME; RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Use Caution When Searching Text
• When performing character search functions in SAS,
be wary of the phrase being used
• Can lead to errors in data cleaning
• Searched term should be unique enough to prevent
unwanted matches
• If “ALL PROTOCOL B” was searched using FIND(),
then the BFM-90 protocol would have been
misclassified as Protocol B

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
MISSING DATA

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Recall: Viewing Missing Data
PROC FREQ DATA = T8;
TABLES STAGE_CODE /MISSING;
RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Understanding Your Missing Data
PROC FREQ DATA = T8; • Staging not done for the
WHERE DX1_GRP = 2; leukemia’s which represent a high
TABLES STAGE_CODE /MISSING;
RUN; % of childhood cancers
• Staging important for lymphomas
• Know your data!

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
DATA CHECKPOINTS

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Date Checkpoints I
DATA FLAGS; SET T8 (KEEP=PATIENT_ID DOB DX_DATE1 DOD);
IF DOD < DX_DATE1 AND DOD ^=. THEN DEATH_FLAG = 1;
ELSE DEATH_FLAG=0;
IF DX_DATE1 < DOB THEN DX_FLAG = 1;
ELSE DX_FLAG = 0;
RUN;
PROC FREQ DATA=FLAGS; TABLES DEATH_FLAG DX_FLAG; RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Date Checkpoints II
PROC PRINT DATA=T8 NOOBS;
WHERE DOD < DX_DATE1 AND DOD ^=. ;
VAR PATIENT_ID DX_DATE1 DOD;
RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Treatment Checkpoints
DATA TX_FLAGS;
MERGE T8 (IN=MASTER) CHEMO (IN=A) SURG (IN=B)
BMT (IN=C) RAD (IN=D);

BY CYPCID;

IF A THEN CHEMO = 1; ELSE CHEMO = 0;

IF B THEN SURGERY = 1; ELSE SURGERY = 0;
IF C THEN BMT = 1; ELSE BMT = 0; Treatment flags
IF D THEN RAD = 1; ELSE RAD = 0;

NUM_TX_MODALITIES = SUM(CHEMO,SURGERY,BMT,RAD);

IF FIRST.CYPCID;
IF MASTER THEN OUTPUT;
RUN;
REMEMBER: All datasets involved in a merge must be sorted by the common identifier (ie.CYPCID)
Healthcare innovation | Survivor care | Family assistance
Population data | Policy development | Education | Research
Treatment Checkpoints II
PROC FREQ DATA=TX_FLAGS;
TABLES DX1_GRP * (CHEMO SURGERY BMT RAD);
TABLES DX1_GRP * NUM_TX_MODALITIES;
RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Treatment Checkpoints II
PROC FREQ DATA=TX_FLAGS;
TABLES DX1_GRP * (CHEMO SURGERY BMT RAD);
TABLES DX1_GRP * NUM_TX_MODALITIES;
RUN;

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
Topics Covered
• Key principles to build a clean dataset
• Using Inclusion / exclusion criteria
• Visualizing data distributions
• Handling data outliers
• Cleaning character variables
• Dealing with missing data
• Creating data checkpoints

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research
THANK YOU!

Healthcare innovation | Survivor care | Family assistance

Population data | Policy development | Education | Research

2024 Wk5 Explorative Data Analysis-1.Ko - en
No ratings yet
2024 Wk5 Explorative Data Analysis-1.Ko - en
51 pages
BC 2014 Session2
No ratings yet
BC 2014 Session2
45 pages
Pima Tutorial
No ratings yet
Pima Tutorial
8 pages
Biostatistics Course Overview
No ratings yet
Biostatistics Course Overview
18 pages
Chapter 2
No ratings yet
Chapter 2
37 pages
Lecture 03 DS Methodology
No ratings yet
Lecture 03 DS Methodology
77 pages
Data Prepration Lecture 9 Data Analysis - 1
No ratings yet
Data Prepration Lecture 9 Data Analysis - 1
32 pages
ET 610 - Data Preprocessing
No ratings yet
ET 610 - Data Preprocessing
41 pages
Excel Data Preparation for Research
No ratings yet
Excel Data Preparation for Research
9 pages
Chapter 2
No ratings yet
Chapter 2
46 pages
SAS Data Processing and Reporting Techniques
No ratings yet
SAS Data Processing and Reporting Techniques
17 pages
Notes For SAS Programming Fall2009
No ratings yet
Notes For SAS Programming Fall2009
88 pages
Data Processing and Analysis Techniques
No ratings yet
Data Processing and Analysis Techniques
48 pages
Data Management Considerations For Clinical Trials 2020
No ratings yet
Data Management Considerations For Clinical Trials 2020
66 pages
Filling Missing Values in BMI Data
No ratings yet
Filling Missing Values in BMI Data
110 pages
Seminar
No ratings yet
Seminar
32 pages
Data Cleaning: Detecting, Diagnosing, and Editing Data Abnormalities
No ratings yet
Data Cleaning: Detecting, Diagnosing, and Editing Data Abnormalities
5 pages
Clinical Data Analysis in Healthcare
100% (1)
Clinical Data Analysis in Healthcare
44 pages
BI Data Analyst Path Guide
No ratings yet
BI Data Analyst Path Guide
27 pages
Notes For SAS Programming Fall2009
No ratings yet
Notes For SAS Programming Fall2009
88 pages
Data Analysis
No ratings yet
Data Analysis
65 pages
Clinical Data Management Guide
No ratings yet
Clinical Data Management Guide
26 pages
1 - Introduction To Health Care Data Analytics (Bagian 2)
No ratings yet
1 - Introduction To Health Care Data Analytics (Bagian 2)
31 pages
Sas 101
No ratings yet
Sas 101
17 pages
Data Collection and Preparation
No ratings yet
Data Collection and Preparation
31 pages
What Is Data Analysis?: Making Figures Speak (The Truth!)
No ratings yet
What Is Data Analysis?: Making Figures Speak (The Truth!)
44 pages
Dofile - Quan Ly Va Lam Sach Du Lieu 2
No ratings yet
Dofile - Quan Ly Va Lam Sach Du Lieu 2
6 pages
DSV-S8 Data Cleaning
No ratings yet
DSV-S8 Data Cleaning
34 pages
Data Collection and Preparation
No ratings yet
Data Collection and Preparation
31 pages
KMBN IT01 LM Consolidated
No ratings yet
KMBN IT01 LM Consolidated
123 pages
Preparing Data For Analysis Using Microsoft Excel
No ratings yet
Preparing Data For Analysis Using Microsoft Excel
8 pages
Week 12 - Data Analysis
No ratings yet
Week 12 - Data Analysis
83 pages
Dealing With Health Care Data Using The SAS® System
No ratings yet
Dealing With Health Care Data Using The SAS® System
9 pages
CSCI322 - Lecture 2
No ratings yet
CSCI322 - Lecture 2
38 pages
Cognizant Data Analyst Interview Questions 1745235888
No ratings yet
Cognizant Data Analyst Interview Questions 1745235888
18 pages
Rsudio Problems
No ratings yet
Rsudio Problems
27 pages
Sas 101
No ratings yet
Sas 101
17 pages
Sas 201
No ratings yet
Sas 201
17 pages
SCA - Module 3
No ratings yet
SCA - Module 3
48 pages
Completetypes N Preloadfmt PDF
No ratings yet
Completetypes N Preloadfmt PDF
5 pages
Pandemic SBA
No ratings yet
Pandemic SBA
10 pages
Unit 2 - Data Visualization Techniques
No ratings yet
Unit 2 - Data Visualization Techniques
101 pages
The Common and Old Method: How To Do?
100% (1)
The Common and Old Method: How To Do?
43 pages
Data Science Methodology: Pertemuan Iv
No ratings yet
Data Science Methodology: Pertemuan Iv
80 pages
Pre Processing
No ratings yet
Pre Processing
68 pages
Data Analysis 2025
No ratings yet
Data Analysis 2025
17 pages
Data Cleaning and Management Guide
No ratings yet
Data Cleaning and Management Guide
6 pages
1 Statistical Computing & Data Management in Health Research
No ratings yet
1 Statistical Computing & Data Management in Health Research
9 pages
Sas 201
No ratings yet
Sas 201
18 pages
Data Quality23
No ratings yet
Data Quality23
10 pages
Session 2 Tidy - Data
No ratings yet
Session 2 Tidy - Data
37 pages
Working With Statistics Using Excel: K.V.S. Sarma Professor of Statistics Sri Venkateswara University Tirupati - 517 502
No ratings yet
Working With Statistics Using Excel: K.V.S. Sarma Professor of Statistics Sri Venkateswara University Tirupati - 517 502
50 pages
Data Preprocessing for Tech Students
No ratings yet
Data Preprocessing for Tech Students
59 pages
Health Data Classification III
No ratings yet
Health Data Classification III
102 pages
(602107) - Introduction To Data Analytics - Chapter 3
No ratings yet
(602107) - Introduction To Data Analytics - Chapter 3
28 pages
Periparturient Diseases of Cattle 1st Edition Multiformat Download
100% (12)
Periparturient Diseases of Cattle 1st Edition Multiformat Download
14 pages
Technical+Report+-+Quantitative+Risk Benefit+Analysis+for+Medical+Devices
No ratings yet
Technical+Report+-+Quantitative+Risk Benefit+Analysis+for+Medical+Devices
10 pages
Skogen's Interim Chancellor Contract
No ratings yet
Skogen's Interim Chancellor Contract
3 pages
Understanding Chronic Sports Injuries
No ratings yet
Understanding Chronic Sports Injuries
11 pages
ACLS Medications
No ratings yet
ACLS Medications
31 pages
COVID-19 RT-PCR Test Result: Negative
No ratings yet
COVID-19 RT-PCR Test Result: Negative
1 page
Business Communication
No ratings yet
Business Communication
12 pages
Underground Mining Techniques
No ratings yet
Underground Mining Techniques
1 page
I Sessional Examination B.Pharm Time Table
No ratings yet
I Sessional Examination B.Pharm Time Table
1 page
Job Families Booklet
No ratings yet
Job Families Booklet
19 pages
Young People Are Unhappy Nowadays
No ratings yet
Young People Are Unhappy Nowadays
1 page
A Fatty Heart Is Unhealthy Even If You're Lean
No ratings yet
A Fatty Heart Is Unhealthy Even If You're Lean
2 pages
PSM Compliance Guide for Hazardous Chemicals
No ratings yet
PSM Compliance Guide for Hazardous Chemicals
86 pages
List of E-Governance Projects in India
No ratings yet
List of E-Governance Projects in India
13 pages
Erevna 4.0 Brochure PR
No ratings yet
Erevna 4.0 Brochure PR
29 pages
Kerala SSLC English Answer Key 2023
No ratings yet
Kerala SSLC English Answer Key 2023
3 pages
Demographic Trends in India
100% (2)
Demographic Trends in India
5 pages
Bobath Concept
100% (1)
Bobath Concept
27 pages
Re Eme Nao Rate Card
No ratings yet
Re Eme Nao Rate Card
11 pages
John Doe: Bachelor of Science - Biomedical Engineering (Major GPA: 3.1)
No ratings yet
John Doe: Bachelor of Science - Biomedical Engineering (Major GPA: 3.1)
2 pages
Goldman Sachs Aptitude QuestionsAnswers With Explanation
No ratings yet
Goldman Sachs Aptitude QuestionsAnswers With Explanation
76 pages
St. Paul'S Hospital Royal University Hospital
No ratings yet
St. Paul'S Hospital Royal University Hospital
8 pages
Zarsona Medical vs. PHIC 191225 13 October 2014
No ratings yet
Zarsona Medical vs. PHIC 191225 13 October 2014
8 pages
2 Mycology Case Studies
No ratings yet
2 Mycology Case Studies
2 pages
Catalogo JUST INGLES Completo Baja
100% (3)
Catalogo JUST INGLES Completo Baja
48 pages
Military Veterans and The Use of Adventure Education Experiences in Natural Environments For Therapeutic Outcomes
No ratings yet
Military Veterans and The Use of Adventure Education Experiences in Natural Environments For Therapeutic Outcomes
10 pages
Affordable Housing Development Plan
No ratings yet
Affordable Housing Development Plan
26 pages
Bioreactor Oxygen Transfer Guide
No ratings yet
Bioreactor Oxygen Transfer Guide
2 pages
Ir Letter
No ratings yet
Ir Letter
4 pages
Effectiveness of Physical Activity Interventions For Improving Depression, Anxiety and Distress An Overview of Systematic Reviews
No ratings yet
Effectiveness of Physical Activity Interventions For Improving Depression, Anxiety and Distress An Overview of Systematic Reviews
10 pages

Data Cleaning Principles in SAS

Uploaded by

Data Cleaning Principles in SAS

Uploaded by

DIRTY DATA?

CLEAN IT USING SAS

CYP-C Research Champion Webinar

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

• Databases are not constructed

• Researchers must be familiar with

structure of the database shower.png

Healthcare innovation | Survivor care | Family assistance

• Determine what your study population denominator

Healthcare innovation | Survivor care | Family assistance

• Both can (and should) be

• Ensures efficient and easy to follow SAS

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

• No data cut is ever perfect

• Initial data cuts are never ready to be analyzed,

Healthcare innovation | Survivor care | Family assistance

DATA T8; SET T7_SORT; BY CYPCID; First cancers

/* AGE INCLUSION CRITERIA – 0 TO 14 */

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

• PROC MEANS and UNIVARIATE produce outputs

• PROC FREQ and PROC MEANS/UNIVARIATE are

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

/* CREATING CLINICAL CATEGORIES */

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

IF FIND(PROTOCOL_NAME,"ALL PROTOCOL C") THEN DO;

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

IF A THEN CHEMO = 1; ELSE CHEMO = 0;

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

Healthcare innovation | Survivor care | Family assistance

You might also like