Datatyper i R med exempel

Vilka รคr datatyperna i R?

Fรถljande รคr datatyperna eller datastrukturerna i R-programmering:

  • Skalรคrer
  • Vektorer (numeriska, tecken, logiska)
  • matriser
  • Dataramar
  • listor

Grundlรคggande typer

  • 4.5 รคr ett decimalvรคrde som kallas numeriken.
  • 4 รคr ett naturvรคrde som kallas heltal. Heltal รคr ocksรฅ numeriska.
  • TRUE eller FALSE รคr ett booleskt vรคrde som kallas logisk binรคra operatorer i R.
  • Vรคrdet inuti โ€ โ€ eller ' ' รคr text (strรคng). De kallas tecken.

Vi kan kontrollera typen av en variabel med klassfunktionen

Exempelvis 1

# Declare variables of different types
# Numeric
x <- 28
class(x)

Produktion:

## [1] "numeric"

Exempelvis 2

# String
y <- "R is Fantastic"
class(y)

Produktion:

## [1] "character"

Exempelvis 3

# Boolean
z <- TRUE
class(z)

Produktion:

## [1] "logical"

variabler

Variabler รคr en av de grundlรคggande datatyperna i R som lagrar vรคrden och รคr en viktig komponent i R-programmering, speciellt fรถr en datavetare. En variabel i R-datatyper kan lagra ett tal, ett objekt, ett statistiskt resultat, vektor, datauppsรคttning, en modellfรถrutsรคgelse i princip vad som helst som R matar ut. Vi kan anvรคnda den variabeln senare genom att helt enkelt anropa variabelns namn.

Fรถr att deklarera variabeldatastrukturer i R mรฅste vi tilldela ett variabelnamn. Namnet ska inte ha mellanslag. Vi kan anvรคnda _ fรถr att koppla till ord.

Fรถr att lรคgga till ett vรคrde till variabeln i datatyper i R-programmering, anvรคnd <- eller =.

Hรคr รคr syntaxen:

# First way to declare a variable:  use the `<-`
name_of_variable <- value
# Second way to declare a variable:  use the `=`
name_of_variable = value

Pรฅ kommandoraden kan vi skriva fรถljande koder fรถr att se vad som hรคnder:

Exempelvis 1

# Print variable x
x <- 42
x

Produktion:

## [1] 42

Exempelvis 2

y  <- 10
y

Produktion:

## [1] 10

Exempelvis 3

# We call x and y and apply a subtraction
x-y

Produktion:

## [1] 32

vektorer

En vektor รคr en endimensionell array. Vi kan skapa en vektor med alla grundlรคggande R-datatyper vi lรคrt oss tidigare. Det enklaste sรคttet att bygga vektordatastrukturer i R รคr att anvรคnda kommandot c.

Exempelvis 1

# Numerical
vec_num <- c(1, 10, 49)
vec_num

Produktion:

## [1]  1 10 49

Exempelvis 2

# Character 
vec_chr <- c("a", "b", "c")
vec_chr

Produktion:

## [1] "a" "b" "c"

Exempelvis 3

# Boolean 
vec_bool <-  c(TRUE, FALSE, TRUE)
vec_bool

Produktion:

##[1] TRUE FALSE TRUE

Vi kan gรถra aritmetiska berรคkningar pรฅ binรคra vektoroperatorer i R.

Exempelvis 4

# Create the vectors
vect_1 <- c(1, 3, 5)
vect_2 <- c(2, 4, 6)
# Take the sum of A_vector and B_vector
sum_vect <- vect_1 + vect_2
# Print out total_vector
sum_vect

Produktion:

[1]  3  7 11

Exempelvis 5

I R รคr det mรถjligt att dela en vektor. Vid vissa tillfรคllen รคr vi bara intresserade av de fรถrsta fem raderna i en vektor. Vi kan anvรคnda kommandot [1:5] fรถr att extrahera vรคrdet 1 till 5.

# Slice the first five rows of the vector
slice_vector <- c(1,2,3,4,5,6,7,8,9,10)
slice_vector[1:5]

Produktion:

## [1] 1 2 3 4 5

Exempelvis 6

Det kortaste sรคttet att skapa ett vรคrdeintervall รคr att anvรคnda: mellan tvรฅ siffror. Till exempel, frรฅn exemplet ovan kan vi skriva c(1:10) fรถr att skapa en vektor med vรคrde frรฅn ett till tio.

# Faster way to create adjacent values
c(1:10)

Produktion:

## [1]  1  2  3  4  5  6  7  8  9 10

R Aritmetik Operatorer

Vi kommer fรถrst att se de grundlรคggande aritmetiska operatorerna i R-datatyper. Fรถljande รคr de aritmetiska och booleska operatorerna i R-programmering som stรฅr fรถr:

Operator BESKRIVNING
+ Dessutom
- Subtraktion
* Multiplikation
/ division
^ eller ** exponentiering

Exempelvis 1

# An addition
3 + 4

Produktion:

## [1] 7

Du kan enkelt kopiera och klistra in ovanstรฅende R-kod i Rstudio Console. De produktion visas efter tecknet #. Till exempel, vi skriver koden print('Guru99') utdata kommer att vara ##[1] Guru99.

## betyder att vi skriver ut utdata och siffran inom hakparentesen ([1]) รคr displayens nummer

Meningarna som bรถrjar med # anteckning. Vi kan anvรคnda # i ett R-skript fรถr att lรคgga till vilken kommentar vi vill. R kommer inte att lรคsa den under kรถrtiden.

Exempelvis 2

# A multiplication
3*5

Produktion:

## [1] 15

Exempelvis 3

# A division
(5+5)/2

Produktion:

## [1] 5

Exempelvis 4

# Exponentiation
2^5

Produktion:

Exempelvis 5

## [1] 32
# Modulo
28%%6

Produktion:

## [1] 4

R Logisk Operatorer

Med logiska operatorer vill vi returnera vรคrden inuti vektorn baserat pรฅ logiska fรถrhรฅllanden. Fรถljande รคr en detaljerad lista รถver logiska operatorer fรถr datatyper i R-programmering

logisk Operators i R
logisk Operators i R

De logiska pรฅstรฅendena i R รคr inlindade i []. Vi kan lรคgga till sรฅ mรฅnga villkorliga uttalanden som vi vill men vi mรฅste inkludera dem inom en parentes. Vi kan fรถlja denna struktur fรถr att skapa ett villkorligt uttalande:

variable_name[(conditional_statement)]

Med variabelnamn som refererar till variabeln vill vi anvรคnda fรถr uttalandet. Vi skapar den logiska satsen dvs variabelnamn > 0. Slutligen anvรคnder vi hakparentesen fรถr att slutfรถra den logiska satsen. Nedan ett exempel pรฅ ett logiskt pรฅstรฅende.

Exempelvis 1

# Create a vector from 1 to 10
logical_vector <- c(1:10)
logical_vector>5

Produktion:

## [1]FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE  TRUE

I utgรฅngen ovan lรคser R varje vรคrde och jรคmfรถr det med satsen logical_vector>5. Om vรคrdet รคr strikt รถverlรคgset fem รคr villkoret TRUE, annars FALSE. R returnerar en vektor av TRUE och FALSE.

Exempelvis 2

I exemplet nedan vill vi extrahera de vรคrden som endast uppfyller villkoret 'รคr strikt รถverlรคgsen fem'. Fรถr det kan vi linda villkoret inom en hakparentes som fรถregรฅs av vektorn som innehรฅller vรคrdena.

# Print value strictly above 5
logical_vector[(logical_vector>5)]

Produktion:

## [1]  6  7  8  9 10

Exempelvis 3

# Print 5 and 6
logical_vector <- c(1:10)
logical_vector[(logical_vector>4) & (logical_vector<7)]

Produktion:

## [1] 5 6

Sammanfatta detta inlรคgg med: