R Cheatsheet ABCD

Uploaded by

perazajesus26

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

55 views3 pages

R Cheatsheet ABCD

Uploaded by

perazajesus26

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Advanced Statistics and Data Science (ABCD) CHEAT SHEET

Word Equations Summary Tables Simple Statistics

outcome = explanatory + other stuff # compute five-number summary mean(data_set$Y)
favstats(~ Y, data = data_set) var(data_set$Y)
Y = X + other stuff sd(data_set$Y)
# create frequency table
Basics tally(data_set$Y) cohensD(Y ~ X, data = data_set)
tally(~ Y, data = data_set) cor(Y ~ X, data = data_set)
print("Hello world!")
# tally by condition b1(Y ~ X, data = data_set)
# assign value to object tally(~ Y < 1900, data = data_set) b1(one_model)
my_number <- 5
# two-way frequency table pre(Y ~ X, data = data_set)
# combine values into vector tally(Y ~ X, data = data_set, margin = TRUE, f(Y ~ X, data = data_set)
my_vector <- c(1, 2, 3) format = “proportion”)
# sample F for X2
# first element in vector f(Y ~ X1 + X2,
my_vector[1] data = data_set, predictor = ~X2)

# orders values or cases

sort(my_vector) Data Frame
# arithmetic operations # structure of data frame # arrange rows by variable
sum(1, 2, 100), +, -, *, / str(data_set) arrange(data_set, Y)
sqrt(157)
abs(data_set$Y) # view first/last six rows # creates data frame from csv file
head(data_set) data_set <- read.csv("file_name", header = TRUE)
# logical operations tail(data_set)
>, <, >=, <=, ==, !=, |, & # convert quantitative variable
# select multiple variables # to categorical
# results in a new variable with values select(data_set, Y1, Y2) factor(data_set$Y)
# of TRUE or FALSE factor(data_set$Y,
data_set$C <- data_set$A > data_set$B # first six rows of selected variables levels = c(1,2),
head(select(data_set, Y1, Y2)) labels = c("A", "B"))

Probability Distribution # transform values

# select variable (a column) recode(data_set$Y, "0" = 0, "1" = 50, "2" = 100)
# calculate the probability area
xpnorm(65.1, data_set$mean, data_set$sd) data_set$Y
# creates two equal sized groups
# find rows that meet condition ntile(data_set$Y, 2)
zscore(data_set$Y)
data_set[data_set$Y > 40] # convert categorical variable
# returns t at this probability filter(data_set, Y > 300) # to quantitative
qt(.975, df = 999) as.numeric(data_set$Y)
# returns F at this probability # find rows that do not have NA
qf(.95, df1 = 1, df2 = 100) filter(data_set, is.na(Y) == FALSE)
filter(data_set, !is.na(Y))
# CI using t distribution
confint(empty_model)

# calculate p-value using F-distribution

xpf(sample_f, df1 = 2 , df2 = 10)

Page: 1 ▷ Updated: 2024-10 ▷ Learn more about CourseKata @ https://coursekata.org

Advanced Statistics and Data Science (ABCD) CHEAT SHEET
Simulation Fitting and Evaluating Models
# sample without replacement # randomize sampling distribution of b1s, # empty model
sample(data_set, 6) # centered on 0 empty_model <- lm(Y ~ NULL,
sdob1 <- do(1000) * data = data_set)
# sample with replacement b1(shuffle(Y) ~ X, data = data_set)
resample(data_set, 10) # use one explanatory variable
# bootstrap sampling distribution of b1s, one_model <- lm(Y ~ X, data = data_set)
do(3) * resample (data_set, 10) # centered on sample b1
sdob1_boot <- do(1000) * # use more than one explanatory variable
# mixes up values in a variable b1(Y ~ X, data = resample(data_set)) # multivariate model
shuffle(data_set$Y) multi_model <- lm(Y ~ X1 + X2, data = data_set)
# count the number of b1s at the upper
# simulate sampling 10000 Ys # and lower extreme # all the model comparisons that can be
# from normal distribution tally(sdob1$b1 > sample_b1 | # made in relation to the multivariate model
sim_Y <- rnorm(10000, Y_stats$mean, sdob1$b1 < -sample_b1) generate_models(multi_model)
Y_stats$sd)
# model predictions and residuals
# put simulated Ys into dataframe # return TRUE for middle 95% of distribution data_set$empty_predict <- predict(empty_model)
data_set<- data.frame(sim_Y) middle(sdob1$b1, .95) data_set$empty_resid <- resid(empty_model)
# randomize sampling distribution of PREs # produce ANOVA table
# simulate
sdopre <- do(1000) * pre(shuffle(Y) ~ X, anova(empty_model)
# sampling distribution of means data = data_set)
sdom_sim <- do(10000) * mean(rnorm(157, supernova(one_model)
Y_stats$mean, Y_stats$sd)) # randomize sampling distribution of Fs
sdof <- do(1000) * # t-test, using pooled variance
# bootstrap f(shuffle(Y) ~ X, data = data_set) t.test(Tip ~ Condition, data = data_set,
# sampling distribution of means var.equal=TRUE)
sdom_boot <- do(10000) * # counts extreme Fs
mean(resample(data_set$Y, 157)) sample_f <- f(shuffle(Y) ~ X, data = data_set) # pairwise comparison corrections:
tally(~f > sample_f, data = sdof) # "Tukey","Bonferroni","none"
pairwise(one_model, correction = "none")

Page: 2 ▷ Updated: 2024-10 ▷ Learn more about CourseKata @ https://coursekata.org

Advanced Statistics and Data Science (ABCD) CHEAT SHEET
Visualizations
gf_histogram(~ Y, data = data_set) %>% # sampling distribution of b1
gf_point(Y ~ X, data = data_set) # change labels gf_histogram(~b1, data = sdob1,
gf_labs(title = "Graph Title", fill = ~middle(b1, .95)) %>%
x = "Y_Name", y = "Frequency") # modify the limits on x- and y-axes
gf_lims(x = c(-12, 12), y = c(0, 70))

gf_jitter(Y ~ X, data = data_set)

# faceted grid of histograms
gf_histogram(~ Y, data = data_set) %>%
gf_facet_grid(X ~ .)

gf_point(Y ~ X, data = data_set) %>%

# add model predictions as red points
gf_point(Y ~ X , shape = 1, size = 3,
color = "firebrick") %>%
# add best fitting model as a red line
gf_boxplot(Y ~ X, data = data_set) gf_model(one_model, color = “red”)

gf_dhistogram(~ Y, data = data_set,

fill = "orange") %>%
gf_density()

gf_boxplot(Y ~ X, data = data_set, fill = pairwise(one_model, plot = TRUE)

"orange") %>%
gf_jitter(height = 0, alpha = .2, size = 3)
gf_bar( ~ Y, data = data_set)

Page: 3 ▷ Updated: 2024-10 ▷ Learn more about CourseKata @ https://coursekata.org

Advanced Stats & Data Science Guide
No ratings yet
Advanced Stats & Data Science Guide
3 pages
Statistics & Data Science Cheat Sheet
No ratings yet
Statistics & Data Science Cheat Sheet
3 pages
R Cheatsheet ABC
No ratings yet
R Cheatsheet ABC
3 pages
CourseKata R Cheatsheet ABC
No ratings yet
CourseKata R Cheatsheet ABC
5 pages
R Cheatsheet ABCD
No ratings yet
R Cheatsheet ABCD
4 pages
A Short List of Some Useful R Commands: Input and Display
No ratings yet
A Short List of Some Useful R Commands: Input and Display
2 pages
Essential R Commands Guide
No ratings yet
Essential R Commands Guide
11 pages
R Course
No ratings yet
R Course
7 pages
A Short List of The Most Useful R Commands
No ratings yet
A Short List of The Most Useful R Commands
8 pages
R Intro 2011
No ratings yet
R Intro 2011
115 pages
BAN5
No ratings yet
BAN5
2 pages
R Programming Practical Exercises
No ratings yet
R Programming Practical Exercises
13 pages
STAT-2450 Assignment 1: Name:, Student ID: B00
No ratings yet
STAT-2450 Assignment 1: Name:, Student ID: B00
9 pages
STTN 225 R Summary
No ratings yet
STTN 225 R Summary
18 pages
IBS Sample I
No ratings yet
IBS Sample I
10 pages
UL2
No ratings yet
UL2
2 pages
Data Science
No ratings yet
Data Science
20 pages
R Program Corrections
No ratings yet
R Program Corrections
20 pages
Workshop Activity: X Seq y Length
No ratings yet
Workshop Activity: X Seq y Length
3 pages
R Code
No ratings yet
R Code
9 pages
Basics: TH TH TH TH TH TH TH
No ratings yet
Basics: TH TH TH TH TH TH TH
3 pages
R File Code
No ratings yet
R File Code
16 pages
Final Cost Practical
No ratings yet
Final Cost Practical
29 pages
R Program
No ratings yet
R Program
22 pages
R Commands
No ratings yet
R Commands
5 pages
Ali
No ratings yet
Ali
31 pages
R Programming Exercises for Big Data
No ratings yet
R Programming Exercises for Big Data
18 pages
Session Set Working Directory Choose Directlry
No ratings yet
Session Set Working Directory Choose Directlry
17 pages
Chapter 5
No ratings yet
Chapter 5
22 pages
Essential R Studio Commands Guide
No ratings yet
Essential R Studio Commands Guide
5 pages
Introduction to R Programming Basics
No ratings yet
Introduction to R Programming Basics
32 pages
Python & R Statistics Guide
No ratings yet
Python & R Statistics Guide
12 pages
Huraira
No ratings yet
Huraira
26 pages
Statistic and R Programming Lab Exercise
No ratings yet
Statistic and R Programming Lab Exercise
8 pages
Summary Statistics and Data Analysis in R
No ratings yet
Summary Statistics and Data Analysis in R
11 pages
R Programming Cheat Sheet
No ratings yet
R Programming Cheat Sheet
7 pages
R Codes
No ratings yet
R Codes
5 pages
R Programming Cheat Sheet for Biometrics
100% (2)
R Programming Cheat Sheet for Biometrics
35 pages
R Programming Cheat Sheet for Biometrics
100% (1)
R Programming Cheat Sheet for Biometrics
4 pages
R Programming Cheat Sheet Guide
No ratings yet
R Programming Cheat Sheet Guide
4 pages
Essential R
No ratings yet
Essential R
261 pages
R for Applied Econometrics Tutorial
No ratings yet
R for Applied Econometrics Tutorial
21 pages
R Intro STAT5000
No ratings yet
R Intro STAT5000
17 pages
R Programming Exercises
No ratings yet
R Programming Exercises
38 pages
BCA V SEM Advanced R Programming Lab Manual Final-1
No ratings yet
BCA V SEM Advanced R Programming Lab Manual Final-1
5 pages
Formulas
No ratings yet
Formulas
2 pages
R语言学习笔记
No ratings yet
R语言学习笔记
78 pages
Ad3301 Set4
No ratings yet
Ad3301 Set4
4 pages
FM Statistics, Fall 2022, Homework 02
No ratings yet
FM Statistics, Fall 2022, Homework 02
8 pages
Analysis Using Statistical: Introduction & Data Exploration
No ratings yet
Analysis Using Statistical: Introduction & Data Exploration
23 pages
Lab File AD PDF
No ratings yet
Lab File AD PDF
25 pages
COST - JournalPracticals (1-7)
No ratings yet
COST - JournalPracticals (1-7)
22 pages
R Examples
No ratings yet
R Examples
56 pages
R Syntax Examples 1
No ratings yet
R Syntax Examples 1
6 pages
Merge
No ratings yet
Merge
28 pages
Day 2
No ratings yet
Day 2
5 pages
R Programing Bhagu
No ratings yet
R Programing Bhagu
40 pages
Econometrics 2019 PDF
No ratings yet
Econometrics 2019 PDF
143 pages
Module - 4 (R Training) - Basic Stats & Modeling
No ratings yet
Module - 4 (R Training) - Basic Stats & Modeling
15 pages
(BA ZG524/MBA ZG538/PDBA ZG538) Advanced Statistical Methods Lecture No: 11 (13-04-24)
No ratings yet
(BA ZG524/MBA ZG538/PDBA ZG538) Advanced Statistical Methods Lecture No: 11 (13-04-24)
43 pages
Time Series Analysis & ARMA Modeling
No ratings yet
Time Series Analysis & ARMA Modeling
56 pages
BEID AND BEIA 103 ASSIGNMENT 2 AUGUST TO DECEMBER 2025 To Post
No ratings yet
BEID AND BEIA 103 ASSIGNMENT 2 AUGUST TO DECEMBER 2025 To Post
2 pages
Ee265 KMS Lr3a
No ratings yet
Ee265 KMS Lr3a
134 pages
Optimal Instruments in Time Series: A Survey: Stanislav Anatolyev
No ratings yet
Optimal Instruments in Time Series: A Survey: Stanislav Anatolyev
35 pages
Statistics and Probability Theory Summary and Answer of Exercises
No ratings yet
Statistics and Probability Theory Summary and Answer of Exercises
120 pages
Statistics Module for MYP Students
No ratings yet
Statistics Module for MYP Students
41 pages
Cosm Paper 1
No ratings yet
Cosm Paper 1
3 pages
Steven M. Kay-Fundamentals of Statistical Signal Processing - Volume I - Estimation Theory-Prentice Hall (1993)
83% (12)
Steven M. Kay-Fundamentals of Statistical Signal Processing - Volume I - Estimation Theory-Prentice Hall (1993)
603 pages
HEC-SSP Examples-V9-20250411 - 055422
No ratings yet
HEC-SSP Examples-V9-20250411 - 055422
5 pages
Cancer Incidence Prediction Models
No ratings yet
Cancer Incidence Prediction Models
21 pages
AI60201 2024 Endsem Solutions
No ratings yet
AI60201 2024 Endsem Solutions
5 pages
Engineering Math: Curve Fitting & LPP
No ratings yet
Engineering Math: Curve Fitting & LPP
5 pages
Sampling Distribution of A Sample Means
No ratings yet
Sampling Distribution of A Sample Means
19 pages
One-Way ANOVA Student Guide
No ratings yet
One-Way ANOVA Student Guide
21 pages
Jaggia Chapter 7 2
No ratings yet
Jaggia Chapter 7 2
23 pages
ML PPT On Laptop Price Prediction
100% (1)
ML PPT On Laptop Price Prediction
17 pages
Confidence Interval
No ratings yet
Confidence Interval
19 pages
Understanding Quality Control Processes
No ratings yet
Understanding Quality Control Processes
2 pages
Bda Nov - 2024
No ratings yet
Bda Nov - 2024
2 pages
Data Analysis MCQ BANK - 250911 - 204204
No ratings yet
Data Analysis MCQ BANK - 250911 - 204204
4 pages
Step-By-Step Basic Statistics Using SAS - Student Guide PDF
50% (2)
Step-By-Step Basic Statistics Using SAS - Student Guide PDF
714 pages
Wilcoxon Signed Rank Test Guide
No ratings yet
Wilcoxon Signed Rank Test Guide
18 pages
Activity 4
No ratings yet
Activity 4
2 pages
Visualizing Categorical Data - Seaborn 0.13.2 Documentation
No ratings yet
Visualizing Categorical Data - Seaborn 0.13.2 Documentation
14 pages
STAT 231 Course Notes W16 Print
No ratings yet
STAT 231 Course Notes W16 Print
424 pages
The Anatomy of Factor Momentum Hanlin Yang Leippold Markus
No ratings yet
The Anatomy of Factor Momentum Hanlin Yang Leippold Markus
73 pages
Understanding P-Value and Confidence Intervals
No ratings yet
Understanding P-Value and Confidence Intervals
9 pages
Measures of Dispersion Explained
No ratings yet
Measures of Dispersion Explained
13 pages
أثر تطبيق معايير التقارير المالية الدولية ias ifrs على جودة المعلومات المالية (دراسة عينة من الأكاديميين والمهنيين)
100% (1)
أثر تطبيق معايير التقارير المالية الدولية ias ifrs على جودة المعلومات المالية (دراسة عينة من الأكاديميين والمهنيين)
17 pages

R Cheatsheet ABCD

Uploaded by

R Cheatsheet ABCD

Uploaded by

Advanced Statistics and Data Science (ABCD) CHEAT SHEET

Word Equations Summary Tables Simple Statistics

# orders values or cases

Probability Distribution # transform values

# calculate p-value using F-distribution

Page: 1 ▷ Updated: 2024-10 ▷ Learn more about CourseKata @ https://coursekata.org

Page: 2 ▷ Updated: 2024-10 ▷ Learn more about CourseKata @ https://coursekata.org

gf_jitter(Y ~ X, data = data_set)

gf_point(Y ~ X, data = data_set) %>%

gf_dhistogram(~ Y, data = data_set,

gf_boxplot(Y ~ X, data = data_set, fill = pairwise(one_model, plot = TRUE)

Page: 3 ▷ Updated: 2024-10 ▷ Learn more about CourseKata @ https://coursekata.org

You might also like