0% found this document useful (0 votes)

115 views59 pages

R-Programming For Data Science

The document discusses using R for data science projects. It provides examples of companies that use R for tasks like classifying customer support texts, analyzing tweets, and creating data visualizations. These include T-Mobile using R for text classification, Twitter analyzing tweets for text, and the Financial Times and BBC creating visualizations in R. The document also covers advantages of R like being open-source, having a large developer community, and powerful libraries for data science tasks.

Uploaded by

Assoc.Prof, CSE , Vel Tech, Chennai

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

115 views59 pages

R-Programming For Data Science

Uploaded by

Assoc.Prof, CSE , Vel Tech, Chennai

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

R-PROGRAMMING FOR

DATA SCIENCE

[Link]
ASSOCIATE PROFESSOR
DEPARTMENT OF COMPUTER SCIENCE AND ENGINEERING
P.S.R ENGINEERING COLLEGE, SIVAKASI

[Link] ASSOCIATE PROFESSOR , CSE

1
DATA SCIENCE PROJECTS THAT USE R
Several industries, such as banking, telecommunications, and media, use R for data science.
Following are some real-world examples of data visualization in r.
1.T-mobile employs R to classify customer support texts in order to connect clients to an agent
appropriately.
[Link] tweets can be analyzed for text using R. The twitterr package supports text analytics and
scraping of twitter data.
[Link] analytics can be combined with R to perform statistical data analysis and build
meaningful data visualizations. This can be achieved by installing the rgoogleanalytics package.
[Link] financial times used R to create data visualizations purely using r and ggplot2 package for
their featured articles such as "is russia-saudi arabia the worst world cup game ever?"
[Link] uses data visualization in R to generate appealing graphics for its publications. BBC has
developed an R package based on the bbplot package and an R cookbook to standardize their data
visualization graphic creation process.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 2

R FOR DATA SCIENCE

• R is open-source software.
• R can be used for suitable projects for machine learning and deep
learning model building.
• R has a huge capability as a statistical tool.
• R is probably the best visualization tool for depicting insights through
different graphs and charts.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 3

ADVANTAGES OF R
• R is an open-source software platform that helps create interactive graphs
and provides great visual alternatives, making it even more user-friendly.
• R has a big development community, various developer forums, and a very
friendly community of r enthusiasts.
• R offers the interface from github as well as an enormous catalog for use in data
analysis and data mining.
• There are many powerful r libraries for data science. For example, the R package
shiny allows developers to build interactive web applications directly using R.
• Rmarkdown allows r to support various dynamic and static output formats such as
html, ms word, and pdf.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 4

DISADVANTAGES OF R

• R has a steep learning curve as the R syntax is quite different and hence,
slightly challenging to learn compared to python.
• R does not offer basic security measures which are essential for production-
grade web applications.
• The performance of r is slower than python or matlab, and it does perform
memory management i.e., R requires a lot of memory.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 6

ADVANCED DATA HANDLING

• SENTIMENT ANALYSIS.
• UBER DATA ANALYSIS.
• MOVIE RECOMMENDATION SYSTEM.
• CREDIT CARD FRAUD DETECTION.
• WINE QUALITY PREDICTION.
• CUSTOMER SEGMENTATION.
• SPEECH EMOTION RECOGNITION.
• PRODUCT BUNDLE IDENTIFICATION.
[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 7
RESHAPING DATA

• R - SPLIT, MERGE AND RESHAPE THE DATA FRAME USING

VARIOUS FUNCTIONS.
• TRANSPOSE OF A MATRIX
• JOINING ROWS AND COLUMNS
• MERGING OF DATA FRAMES
• MELTING AND CASTING

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 8

TRANSPOSE OF A MATRIX

• T() FUNCTION
• TAKES A MATRIX OR DATA FRAME AS AN INPUT AND GIVES
THE TRANSPOSE OF THAT MATRIX OR DATA FRAME AS IT’S
OUTPUT.
• SYNTAX:
T(MATRIX/ DATA FRAME)

• [1] "ORIGINAL MATRIX"

[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
[3,] 7 8 9
[4,] 10 11 12

[1] "TRANSPOSE OF THE MATRIX"

[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 11

APPENDING FRAMES

• JOINING ROWS AND COLUMNS IN DATA FRAME

• IN R, WE CAN JOIN TWO VECTORS OR MERGE TWO DATA
FRAMES USING FUNCTIONS. THERE ARE BASICALLY TWO
FUNCTIONS THAT PERFORM THESE TASKS:
• CBIND():
• WE CAN COMBINE VECTORS, MATRIX OR DATA FRAMES BY
COLUMNS USING CBIND() FUNCTION.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 12

• SYNTAX: CBIND(X1, X2, X3)
• WHERE X1, X2 AND X3 CAN BE VECTORS OR MATRICES OR
DATA FRAMES.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 13

RBIND

RBIND():
• WE CAN COMBINE VECTORS, MATRIX OR DATA FRAMES BY
ROWS USING RBIND() FUNCTION.
• SYNTAX: RBIND(X1, X2, X3)
• WHERE X1, X2 AND X3 CAN BE VECTORS OR MATRICES OR
DATA FRAMES.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 14

# CBIND AND RBIND FUNCTION IN
R
NAME <- C("SHAONI", "ESHA", "SOUMITRA", "SOUMI")
AGE <- C(24, 53, 62, 29)
ADDRESS <- C("PUDUCHERRY", "KOLKATA", "DELHI", "BANGALORE")

# CBIND FUNCTION
INFO <- CBIND(NAME, AGE, ADDRESS)
PRINT("COMBINING VECTORS INTO DATA FRAME USING CBIND ")
PRINT(INFO)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 15

# CREATING NEW DATA FRAME

NEWD <- [Link](NAME=C("SOUNAK", "BHABANI"),

AGE=C("28", "87"),
ADDRESS=C("BANGALORE", "KOLKATA"))

# RBIND FUNCTION
[Link] <- RBIND(INFO, NEWD)
PRINT("COMBINING DATA FRAMES USING RBIND ")
PRINT([Link])
[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 16
OUTPUT
[1] "COMBINING VECTORS INTO DATA FRAME USING
CBIND "
NAME AGE ADDRESS
[1,] "SHAONI" "24" "PUDUCHERRY"
[2,] "ESHA" "53" "KOLKATA"
[3,] "SOUMITRA" "62" "DELHI"
[4,] "SOUMI" "29" "BANGALORE"

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 17

OUTPUT RBIND

• [1] "COMBINING DATA FRAMES USING RBIND "

• NAME AGE ADDRESS

1 SHAONI 24 PUDUCHERRY
2 ESHA 53 KOLKATA
3 SOUMITRA 62 DELHI
4 SOUMI 29 BANGALORE
5 SOUNAK 28 BANGALORE
6 BHABANI 87 KOLKATA
[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 18
MERGING TWO DATA FRAMES

• In R, we can merge two data frames using the merge() function

provided both the data frames should have the same column names. We
may merge the two data frames based on a key value.

• Syntax: merge(dfa, dfb, …)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 19

MERGING DATA FRAMES

# merging two data frames in r

d1 <- [Link](name=c("shaoni", "soumi", "arjun"),
id=c("111", "112", "113"))

d2 <- [Link](name=c("sounak", "esha"),

id=c("114", "115"))

total <- merge(d1, d2, all=true)

print(total)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 20

OUTPUT

NAME ID
1 ARJUN 113
2 SHAONI 111
3 SOUMI 112
4 ESHA 115
5 SOUNAK 114

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 21

RESHAPING DATA FRAMES

• DATA RESHAPING INVOLVES MANY STEPS IN ORDER TO

OBTAIN DESIRED OR REQUIRED FORMAT.
• ONE OF THE POPULAR METHODS IS MELTING THE DATA
WHICH CONVERTS EACH ROW INTO A UNIQUE ID-VARIABLE
COMBINATION AND THEN CASTING IT.
• THE TWO FUNCTIONS USED FOR THIS PROCESS:

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 22

MELTING

• MELT():
• IT IS USED TO CONVERT A DATA FRAME INTO A MOLTEN DATA FRAME.
• SYNTAX: MELT(DATA, …, [Link]=FALSE, [Link]=”VALUE”)
• WHERE,
• DATA: DATA TO BE MELTED
… : ARGUMENTS
[Link]: CONVERTS EXPLICIT MISSINGS INTO IMPLICIT MISSINGS
[Link]: STORING VALUES

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 23

CASTING

• DCAST():
• IT IS USED TO AGGREGATE THE MOLTEN DATA FRAME INTO A
NEW FORM.
• SYNTAX: MELT(DATA, FORMULA, [Link])
• WHERE,
• DATA: DATA TO BE MELTED
FORMULA: FORMULA THAT DEFINES HOW TO CAST
[Link]: USED IF THERE IS A DATA AGGREGATION
[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 24
# MELT AND CAST
library(mass)
library(reshape)
a <- [Link](id=c("1", "1", "2", "2"),points=c("1", "2", "1", "2"),
x1=c("5", "3", "6", "2"), x2=c("6", "5", "1", "4"))
print("melting")
m <- melt(a, id=c("id", "point"))
print(m)
print("casting")
idmn <- dcast(a, id~variable, mean)
print(idmn)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 25

MELTING

• MELTING
ID POINTS VARIABLE VALUE
1 1 X1 5
1 2 X1 3
2 1 X1 6
2 2 X1 2
3 1 X2 6
1 2 X2 5
2 1 X2 1
2 2 X2 4

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 26

CASTING

• CASTING
ID X1 X2
1 4 5.5
2 4 2.5

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 27

TABULAR DATA

• LOADING TABULAR DATA

• INSPECTING [Link] OBJECTS
• INDEXING AND SUBSETTING DATA FRAMES
• CATEGORICAL DATA: FACTORS
• CONVERTING FACTORS
• RENAMING FACTORS

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 28

R FUNCTION

• [Link]() to download the csv file that contains the traffic stop
data
[Link]("[Link]
"data/ms_trafficstops_bw.csv")
• [Link]() to load into memory the content of the csv file as an object of
class [Link].
trafficstops <- [Link]("data/ms_trafficstops_bw.csv")

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 29

DISPLAY THE FIRST 6 LINES

• check the top (the first 6 lines) of this data frame using the
function head():
head(trafficstops)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 30

INSPECTING [Link] OBJECT
S
• INSPECTING THE STRUCTURE OF A DATA FRAME WITH THE
FUNCTION STR():
STR(TRAFFICSTOPS)
THE FUNCTIONS HEAD() AND STR() CAN BE USEFUL TO CHECK
THE CONTENT AND THE STRUCTURE OF A DATA FRAME

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 31

NON--EXHAUSTIVE LIST OF FUNCTIONS TO
GET A SENSE OF THE CONTENT/STRUCTURE
OF THE DATA.

• size:
• dim(trafficstops) - returns a vector with the number of rows in the first element,
and the number of columns as the second element (the dimensions of the
object)
• nrow(trafficstops) - returns the number of rows
• ncol(trafficstops) - returns the number of columns
• length(trafficstops) - returns number of columns

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 32

• content:
• head(trafficstops) - shows the first 6 rows
• tail(trafficstops) - shows the last 6 rows

• names:
• names(trafficstops) - returns the column names (synonym
of colnames() for [Link] objects)
• rownames(trafficstops) - returns the row names

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 33

• summary:
• str(trafficstops) - structure of the object and information about the class,
length and content of each column
• summary(trafficstops) - summary statistics for each column

• most of functions are generic

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 34

SPECIFYING THESE COORDINATES
LEAD TO RESULTS WITH
DIFFERENT CLASSES
• trafficstops[1, 1] # first element in the first column of the data frame (as
a vector)
• trafficstops[1, 6] # first element in the 6th column (as a vector)
• trafficstops[, 1] # first column in the data frame (as a vector)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 35

• trafficstops[1] # first column in the data frame (as a [Link])
• trafficstops[1:3, 7] # first three elements in the 7th column (as a vector)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 36

• trafficstops[3, ] # the 3rd row (as a [Link])
• trafficstops[1:6, ] # the 1st to 6th rows, equivalent to head(trafficstops)
• trafficstops[, -1] # the whole data frame, excluding the first column
• trafficstops[-c(7:211211),] # equivalent to head(trafficstops)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 37

[Link] (OR MATRIX),
COLUMNS CAN BE CALLED BY
• NAME
TRAFFICSTOPS["VIOLATION_RAW"] # RESULT IS A [Link]
• TRAFFICSTOPS[, "VIOLATION_RAW"] # RESULT IS A VECTOR
• TRAFFICSTOPS[["VIOLATION_RAW"]] # RESULT IS A VECTOR
• TRAFFICSTOPS$VIOLATION_RAW # RESULT IS A VECTOR

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 38

CONDITIONAL SUBSETTING

• to extract a subset of a data frame based on certain conditions.

• # the condition: # returns a logical vector of the length of the column
• trafficstops$county_name == "webster county" # use this vector to extract
rows and all columns # note the comma: we want *all* columns
• trafficstops[trafficstops$county_name == "webster county", ] # assign
extract to a new data frame
• webster_trafficstops <- trafficstops[trafficstops$county_name == "webster
county", ]
[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 39
CATEGORICAL DATA: FACTORS

• FACTORS ARE USED TO REPRESENT CATEGORICAL DATA.

FACTORS CAN BE ORDERED OR UNORDERED, AND
UNDERSTANDING THEM IS NECESSARY FOR STATISTICAL
ANALYSIS AND FOR PLOTTING.
• FACTORS ARE STORED AS INTEGERS, AND HAVE LABELS
(TEXT) ASSOCIATED WITH THESE UNIQUE INTEGERS.
• WHILE FACTORS LOOK (AND OFTEN BEHAVE) LIKE
CHARACTER VECTORS

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 40

• once created, factors can only contain a pre-defined set of values,
known as levels. by default, r always sorts levels in alphabetical order.
for instance, if you have a factor with 2 levels:
• party <- factor(c("republican", "democrat", "democrat", "republican"))

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 41

R will assign 1 to the level "democrat" and
2 to the level "republican"
(because d comes before r, even though the first element in this
vector is "republican").

check this by using the function levels(), and check the number of

levels using nlevels():
levels(party)
nlevels(party)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 42

CONVERTING FACTORS

convert a factor to a character vector, you use [Link](x)

• [Link](party)
• [Link](party)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 43

RENAMING FACTORS

• When your data is stored as a factor, you can use the plot() function to

get a quick glance at the number of observations represented by each
factor level. let’s look at the number of blacks and whites in the dataset:

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 44

• # coerce the column "driver_race" into a factor
• trafficstops$driver_race <- factor(trafficstops$driver_race) # bar plot
of the number of black and white drivers stopped:
• trafficstops$driver_race <- [Link](trafficstops$driver_race)
plot(trafficstops$driver_race)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 45

WORKING WITH DATES

• THE [Link]() FUNCTION

• THIS FUNCTION ALLOWS US TO CREATE A DATE VALUE
(WITHOUT TIME) IN R PROGRAMMING. IT ALLOWS THE
VARIOUS INPUT FORMATS OF THE DATE VALUE AS WELL
THROUGH THE FORMAT = ARGUMENT.

• STANDARD DATE FORMAT AS “YYYY-MM-DD”

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 46

[Link]() FUNCTION

• date value as an argument.

• to give a date value as an input

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 47

EXAMPLE 2 : [Link]() FUNCTION

• INPUT IS NOT IN PROPER FORMAT

1. TO ARRANGE THE DATE VALUES IN A STANDARD FORM AND
PRESENT IT .
• %D - MEANS A DAY OF THE MONTH IN NUMBER FORMAT
• %M - STANDS FOR THE MONTH IN NUMBER FORMAT
• %Y - STANDS FOR THE YEAR IN THE “YYYY” FORMAT. YEAR
VALUE IN TWO DIGITS
• “%Y” INSTEAD OF “%Y.”
[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 48
• month name instead of month number under the input value, we can
use the %b operator under the format = argument while using the
[Link]() function.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 49

USING THE [Link](), [Link]()
FUNCTION
IN R PROGRAMMING
1. [Link]() FUNCTION, IT WILL GIVE YOU THE SYSTEM DATE.
YOU DON’T NEED TO ADD AN ARGUMENT INSIDE THE
PARENTHESES TO THIS FUNCTION.
2. [Link]() THAT ALLOWS US TO GET THE TIMEZONE
BASED ON THE LOCATION AT WHICH THE USER IS RUNNING
THE CODE ON THE SYSTEM.
3. [Link]() FUNCTION. WHICH, IF USED, WILL RETURN THE
CURRENT DATE AS WELL AS THE TIME OF THE SYSTEM WITH
THE TIMEZONE DETAILS.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 50

USING THE LUBRIDATE
PACKAGE
• now() that can give us the current date, current time, and the current
timezone details in a single call
• install the package “lubridate.”
• [Link](“lubridate”)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 51

EXTRACTION AND MANIPULATION
OF THE PARTS OF THE DATE

• THE “LUBRIDATE” PACKAGE WORK, IT BECOMES EASIER TO USE

IT FOR EXTRACTION AND MANIPULATION OF SOME PARTS OF
THE DATE VALUE.
• THERE ARE VARIOUS FUNCTIONS UNDER THE PACKAGE THAT
ALLOW US TO EITHER EXTRACT THE YEAR, MONTH, WEEK, ETC.
FROM THE DATE.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 52

EXAMPLE CODE FOR EXTRACTION
OF DIFFERENT DATE COMPONENTS

• Create a date variable named “x,” which contains three different date values.
• The year() function allows us to extract the year values for each element of
the vector.
• The month() function takes a single date value or a vector that contains dates
as element and extracts the month from those as numbers.
• What if we wanted the abbreviated names for each month from dates? we
have to add the “label = true” argument under the month() function and
could see the month names in abbreviated form.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 53

• if we use the “abbr = false” argument under the month function along
with the “label = true,” we will get the full month names.
• to extract the days from the given date values, you can use
the mday() function. you will get the days as numbers.
• the wday() function allows us to get the weekdays in numbers by
default. however, when we use the “label = true” and “abbr =
false” as additional arguments under the function, we will come to
know which day of the given date has which weekday value.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 54

EXAMPLE CODE WITH OUTPUT
FOR DATES MANIPULATION IN R
• we are using ymd() function on the given vector. this function converts
the date values from the vector into a format that is suitable for the
manipulation.
• we can add or subtract the year values from each element of the vector.
it is similar to adding or subtracting components from a numeric vector.
the function we have used here is years().

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 55

• in the same way, we can use months() to add or subtract the month
values to each vector element.
• we can use the mday() function to update the days for each date from
the given vector.
• the update() function is a combination of these all. this function allows
you to add, years, months, and even days to each element of the given
vector.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 56

REFERENCES

• HTTPS://[Link]/TARAGONMD/PHDS/WORKING-WI
[Link]

• R PROGRMMING FOR DATA SCIENCE BY ROGER D.

PENG

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 57

MOVIE RECOMMENDATION
SYSTEM

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 58

MOVIE RECOMMENDATION
SYSTEM

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 59

2 Undefined
No ratings yet
2 Undefined
86 pages
R and R Studio Introduction
No ratings yet
R and R Studio Introduction
24 pages
R and R Studio Introduction
100% (1)
R and R Studio Introduction
23 pages
DR - Pierpaolo-Delser - Introduction R
No ratings yet
DR - Pierpaolo-Delser - Introduction R
83 pages
Data Reshaping Techniques in R
No ratings yet
Data Reshaping Techniques in R
13 pages
Introduction To R
No ratings yet
Introduction To R
20 pages
Basics of R
No ratings yet
Basics of R
12 pages
Lecture 1
No ratings yet
Lecture 1
35 pages
Introduction To Analytics and R File
No ratings yet
Introduction To Analytics and R File
29 pages
Introduction to R Programming Basics
No ratings yet
Introduction to R Programming Basics
39 pages
Introduction to R for Statistics
No ratings yet
Introduction to R for Statistics
56 pages
R Vectors
No ratings yet
R Vectors
22 pages
R Programming Notes
No ratings yet
R Programming Notes
23 pages
R Programming
No ratings yet
R Programming
22 pages
Unit 4
No ratings yet
Unit 4
27 pages
Data - Analysis - With - R - 24
No ratings yet
Data - Analysis - With - R - 24
47 pages
Unit 1 Big Data Analytics - An Introduction (Final)
No ratings yet
Unit 1 Big Data Analytics - An Introduction (Final)
65 pages
Lecture 1
No ratings yet
Lecture 1
42 pages
A Brief Introduction To R
No ratings yet
A Brief Introduction To R
17 pages
R Programming Basics and Functions
No ratings yet
R Programming Basics and Functions
13 pages
R Most Important Question
No ratings yet
R Most Important Question
12 pages
18mit22c U4
No ratings yet
18mit22c U4
35 pages
Advantages of R Programming and Plotly
No ratings yet
Advantages of R Programming and Plotly
34 pages
Unit I R Data Structures
No ratings yet
Unit I R Data Structures
30 pages
2 Manipulating Processing Data
No ratings yet
2 Manipulating Processing Data
81 pages
Lab1 411 Eman Yahya 7773225
No ratings yet
Lab1 411 Eman Yahya 7773225
16 pages
R Programming Basics Guide
No ratings yet
R Programming Basics Guide
19 pages
Importing The Files
No ratings yet
Importing The Files
14 pages
STATS LAB Basics of R PDF
No ratings yet
STATS LAB Basics of R PDF
77 pages
R Introduction II
No ratings yet
R Introduction II
45 pages
Introduction to R Programming
No ratings yet
Introduction to R Programming
34 pages
R Programming Basics Guide
No ratings yet
R Programming Basics Guide
34 pages
Introduction To R
No ratings yet
Introduction To R
34 pages
R Programming
No ratings yet
R Programming
30 pages
Presentation 3 - Data Structures
No ratings yet
Presentation 3 - Data Structures
45 pages
R Programming Basics for Beginners
No ratings yet
R Programming Basics for Beginners
14 pages
R Programming
No ratings yet
R Programming
22 pages
R Lab File Deepak
No ratings yet
R Lab File Deepak
27 pages
Introduction to R Programming
No ratings yet
Introduction to R Programming
59 pages
Da Session 4
No ratings yet
Da Session 4
75 pages
Introduction To R
No ratings yet
Introduction To R
52 pages
QB Samplealllllll Hemu
No ratings yet
QB Samplealllllll Hemu
19 pages
R Reference Card
No ratings yet
R Reference Card
6 pages
R Reference Guide for Programmers
No ratings yet
R Reference Guide for Programmers
6 pages
CH 03
No ratings yet
CH 03
42 pages
R Programming Essentials
No ratings yet
R Programming Essentials
27 pages
Teaching R
No ratings yet
Teaching R
15 pages
R Programming: Data Analysis Guide
No ratings yet
R Programming: Data Analysis Guide
61 pages
Basic R Dplyr Session 4 Demonstration
No ratings yet
Basic R Dplyr Session 4 Demonstration
18 pages
Module 3 R Data Science
No ratings yet
Module 3 R Data Science
158 pages
R Programming Slides
No ratings yet
R Programming Slides
73 pages
R for NGS Data Analysis Beginners
No ratings yet
R for NGS Data Analysis Beginners
5 pages
Tutorial 1
No ratings yet
Tutorial 1
29 pages
Data Science Using R - Lab Manual-Complete Ver 2.0 - Nov 2024
No ratings yet
Data Science Using R - Lab Manual-Complete Ver 2.0 - Nov 2024
36 pages
R Vectors: Storing Data Elements
No ratings yet
R Vectors: Storing Data Elements
35 pages
R Programming for Data Analysis
No ratings yet
R Programming for Data Analysis
11 pages
Practical Projects
100% (32)
Practical Projects
478 pages
Python Programming. A Step-by-Step Guide For Absolute Beginners
91% (46)
Python Programming. A Step-by-Step Guide For Absolute Beginners
181 pages
101 Best Microsoft Excel Tips & Tricks Ebook v1.3 - LM
97% (31)
101 Best Microsoft Excel Tips & Tricks Ebook v1.3 - LM
616 pages
The Python Bible
97% (33)
The Python Bible
506 pages
Learn Excel Data Analysis
100% (18)
Learn Excel Data Analysis
721 pages
EBOOK - Python Crash Course For Data Analysis
100% (12)
EBOOK - Python Crash Course For Data Analysis
168 pages
Artificial Intelligence With Python (Machine Learning Foundations, Methodologies, and Applications) (Teik Toe Teoh, Zheng Rong)
94% (18)
Artificial Intelligence With Python (Machine Learning Foundations, Methodologies, and Applications) (Teik Toe Teoh, Zheng Rong)
334 pages
DATA ANALYTICS - A Comprehensive Beginner's Guide To Learn About The Realms of Data Analytics From A-Z
89% (18)
DATA ANALYTICS - A Comprehensive Beginner's Guide To Learn About The Realms of Data Analytics From A-Z
102 pages
Microsoft Power BI Cookbook by Greg Deckler
100% (20)
Microsoft Power BI Cookbook by Greg Deckler
655 pages
Generative Ai Fundamentals v1
100% (19)
Generative Ai Fundamentals v1
80 pages
Full Course of Machine Learning
100% (17)
Full Course of Machine Learning
660 pages
Applied Generative AI For Beginners Practical Knowledge 1703207445
94% (18)
Applied Generative AI For Beginners Practical Knowledge 1703207445
221 pages
Data Structure and Algorithms With Python
100% (16)
Data Structure and Algorithms With Python
369 pages
Hands On Machine Learning With Python Concepts and Applications For Beginners - John Anderson 2018
91% (11)
Hands On Machine Learning With Python Concepts and Applications For Beginners - John Anderson 2018
166 pages
Applied Microsoft Power BI Bring Your Data To Life
100% (14)
Applied Microsoft Power BI Bring Your Data To Life
592 pages
Python Machine Learning For Beginners Ebook Final
100% (11)
Python Machine Learning For Beginners Ebook Final
305 pages
2019 Book DataScienceAndBigDataAnalytics
100% (15)
2019 Book DataScienceAndBigDataAnalytics
418 pages
(Hunt, J.) A Beginners Guide To Python 3 Programming
96% (47)
(Hunt, J.) A Beginners Guide To Python 3 Programming
440 pages
Python Programming for Beginners_ From Basics to AI Integrations. 5-Minute Illustrated Tutorials, Coding Hacks, Hands-On Exercises & Case Studies to Master Python in 7 Days and Get Paid More by Prince
100% (15)
Python Programming for Beginners_ From Basics to AI Integrations. 5-Minute Illustrated Tutorials, Coding Hacks, Hands-On Exercises & Case Studies to Master Python in 7 Days and Get Paid More by Prince
244 pages
Data Analytics Using Python
100% (7)
Data Analytics Using Python
982 pages
Top 100 Applications of Generative AI 1683282083
96% (23)
Top 100 Applications of Generative AI 1683282083
119 pages
PYTHON Learn Python Programming in 90 Minutes or Less Python Learning Python Python Programming Python Tutorial Python Programming For Beginners Python For Dummies Book 1 PDF
92% (13)
PYTHON Learn Python Programming in 90 Minutes or Less Python Learning Python Python Programming Python Tutorial Python Programming For Beginners Python For Dummies Book 1 PDF
161 pages
Learn Excel Dashboard
100% (18)
Learn Excel Dashboard
233 pages
Advanced Excel Tutorial
98% (49)
Advanced Excel Tutorial
232 pages
Python in Excel (2024)
100% (14)
Python in Excel (2024)
607 pages
Understanding Machine Learning
100% (73)
Understanding Machine Learning
416 pages
Python Programming
100% (7)
Python Programming
185 pages
The Python Manual
94% (33)
The Python Manual
196 pages
Machine Learning Projects in Python
100% (17)
Machine Learning Projects in Python
135 pages
Learn Python in A Day
93% (15)
Learn Python in A Day
141 pages
State Space Search Techniques Explained
No ratings yet
State Space Search Techniques Explained
18 pages
Tor
No ratings yet
Tor
2 pages
Introduction To Authentication For Applications Ubisecure White Paper 7.18
No ratings yet
Introduction To Authentication For Applications Ubisecure White Paper 7.18
16 pages
Object-Oriented Software Engineering Guide
No ratings yet
Object-Oriented Software Engineering Guide
131 pages
ZXONM E300 Product Description
No ratings yet
ZXONM E300 Product Description
39 pages
Pranjal Prasad: Data Analytics Profile
No ratings yet
Pranjal Prasad: Data Analytics Profile
2 pages
Agile Flash Cards
No ratings yet
Agile Flash Cards
24 pages
Java Programming and Computer Concepts
No ratings yet
Java Programming and Computer Concepts
2 pages
1 PDF
No ratings yet
1 PDF
69 pages
Really Final
No ratings yet
Really Final
48 pages
Proud Boys' Leadership Group (MOSD) Chat Messages December 27, 2020, Part 1 of 2
100% (1)
Proud Boys' Leadership Group (MOSD) Chat Messages December 27, 2020, Part 1 of 2
356 pages
Transaction Codes For Payroll Accounting
No ratings yet
Transaction Codes For Payroll Accounting
3 pages
PD CLC TR 50501-1
No ratings yet
PD CLC TR 50501-1
50 pages
CSCE614 2011c HW1
0% (1)
CSCE614 2011c HW1
4 pages
IOT Unit 4
No ratings yet
IOT Unit 4
35 pages
06 Api Design
No ratings yet
06 Api Design
24 pages
Java Lab Manual r23 Updated
No ratings yet
Java Lab Manual r23 Updated
77 pages
FusionServer Tools V2R2 InfoCollect User Guide 22
No ratings yet
FusionServer Tools V2R2 InfoCollect User Guide 22
75 pages
eBUS SDK C++ API Quick Start Guide PDF
No ratings yet
eBUS SDK C++ API Quick Start Guide PDF
39 pages
Unit-5 Iot Privacy
No ratings yet
Unit-5 Iot Privacy
9 pages
cs20 Java Module2
No ratings yet
cs20 Java Module2
16 pages
Simplified Short-Circuit Calculations
No ratings yet
Simplified Short-Circuit Calculations
2 pages
001 - General Sales Tax
No ratings yet
001 - General Sales Tax
7 pages
h19109 Dell Powerscale Smartsync WP
No ratings yet
h19109 Dell Powerscale Smartsync WP
25 pages
WLS ZeroDowntime Patching
No ratings yet
WLS ZeroDowntime Patching
23 pages
Arena NX
No ratings yet
Arena NX
9 pages
Auto Cad New
No ratings yet
Auto Cad New
646 pages
Tiga-Lima Shell Script Source Code
No ratings yet
Tiga-Lima Shell Script Source Code
3 pages
Introduction To Opengl Tutorial
No ratings yet
Introduction To Opengl Tutorial
76 pages
Aparna SAP ABAP Fresher Resume
No ratings yet
Aparna SAP ABAP Fresher Resume
2 pages

R-Programming For Data Science

Uploaded by

R-Programming For Data Science

Uploaded by

R-PROGRAMMING FOR

[Link] ASSOCIATE PROFESSOR , CSE

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 2

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 3

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 4

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 5

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 6

• R - SPLIT, MERGE AND RESHAPE THE DATA FRAME USING

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 8

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 9

• [1] "ORIGINAL MATRIX"

[1] "TRANSPOSE OF THE MATRIX"

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 11

• JOINING ROWS AND COLUMNS IN DATA FRAME

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 12

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 13

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 14

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 15

NEWD <- [Link](NAME=C("SOUNAK", "BHABANI"),

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 17

• [1] "COMBINING DATA FRAMES USING RBIND "

• In R, we can merge two data frames using the merge() function

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 19

# merging two data frames in r

d2 <- [Link](name=c("sounak", "esha"),

total <- merge(d1, d2, all=true)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 20

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 21

• DATA RESHAPING INVOLVES MANY STEPS IN ORDER TO

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 22

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 23

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 25

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 26

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 27

• LOADING TABULAR DATA

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 28

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 29

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 30

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 31

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 32

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 33

• most of functions are generic

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 34

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 35

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 36

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 37

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 38

• to extract a subset of a data frame based on certain conditions.

• FACTORS ARE USED TO REPRESENT CATEGORICAL DATA.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 40

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 41

check this by using the function levels(), and check the number of

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 42

convert a factor to a character vector, you use [Link](x)

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 43

• When your data is stored as a factor, you can use the plot() function to

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 44

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 45

• THE [Link]() FUNCTION

• STANDARD DATE FORMAT AS “YYYY-MM-DD”

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 46

• date value as an argument.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 47

• INPUT IS NOT IN PROPER FORMAT

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 49

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 50

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 51

• THE “LUBRIDATE” PACKAGE WORK, IT BECOMES EASIER TO USE

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 52

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 53

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 54

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 55

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 56

• R PROGRMMING FOR DATA SCIENCE BY ROGER D.

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 57

[Link] ASSOCIATE PROFESSOR , CSE DEPT,PSREC 58