R Sorter en dataramme ved hjelp av Order()


I dataanalyse kan du Sorter dataene dine i henhold til en bestemt variabel i datasettet. I R kan vi bruke hjelp av funksjonen order(). I R kan vi enkelt sortere en vektor av kontinuerlig variabel eller faktorvariabel. Ordne dataene kan være av stigende or synkende bestille.

Syntaks:

sort(x, decreasing = FALSE, na.last = TRUE):

Argument:

  • x: En vektor som inneholder kontinuerlig eller faktorvariabel
  • avtagende: Kontroll for rekkefølgen på sorteringsmetoden. Som standard er reduksjon satt til "FALSE".
  • siste: Indikerer om `NA`-verdien skal settes sist eller ikke

Eksempel 1

For eksempel kan vi lage en tibble-dataramme og sortere en eller flere variabler. En tibble dataramme er en ny tilnærming til dataramme. Det forbedrer syntaksen til dataramme og unngår frustrerende datatypeformatering, spesielt for tegn til faktor. Det er også en praktisk måte å lage en dataramme for hånd, som er formålet vårt her. For å lære mer om tibble, se vignetten: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html

library(dplyr)
set.seed(1234)
data_frame <- tibble(  
	c1 = rnorm(50, 5, 1.5),   
	c2 = rnorm(50, 5, 1.5),  
	c3 = rnorm(50, 5, 1.5),
	c4 = rnorm(50, 5, 1.5), 	
	c5 = rnorm(50, 5, 1.5)
)
# Sort by c1
df <-data_frame[order(data_frame$c1),]
head(df)

Utgang:

# A tibble: 6 x 5
##       c1       c2       c3       c4       c5
##     <dbl>    <dbl>    <dbl>    <dbl>    <dbl>
## 1 1.481453 3.477557 4.246283 3.686611 6.0511003
## 2 1.729941 5.824996 4.525823 6.753663 0.1502718
## 3 2.556360 6.275348 2.524849 6.368483 5.4787404
## 4 2.827693 4.769902 5.120089 3.743626 4.0103449
## 5 2.988510 4.395902 2.077631 4.236894 4.6176880
## 6 3.122021 6.317305 5.413840 3.551145 5.6067027

Eksempel 2

# Sort by c3 and c4
df <-data_frame[order(data_frame$c3, data_frame$c4),]
head(df)

Utgang:

# A tibble: 6 x 5
##        c1       c2       c3       c4       c5
##    <dbl>    <dbl>    <dbl>    <dbl>    <dbl>
## 1 2.988510 4.395902 2.077631 4.236894 4.617688
## 2 2.556360 6.275348 2.524849 6.368483 5.478740
## 3 3.464516 3.914627 2.730068 9.565649 6.016123
## 4 4.233486 3.292088 3.133568 7.517309 4.772395
## 5 3.935840 2.941547 3.242078 6.464048 3.599745
## 6 3.835619 4.947859 3.335349 4.378370 7.240240

Eksempel 3

# Sort by c3(descending) and c4(acending)
df <-data_frame[order(-data_frame$c3, data_frame$c4),]
head(df)

Utgang:

# A tibble: 6 x 5
##         c1       c2       c3        c4       c5
##      <dbl>    <dbl>    <dbl>     <dbl>    <dbl>
## 1 4.339178 4.450214 8.087243 4.5010140 8.410225
## 2 3.959420 8.105406 7.736312 7.1168936 5.431565
## 3 3.339023 3.298088 7.494285 5.9303153 7.035912
## 4 3.397036 5.382794 7.092722 0.7163620 5.620098
## 5 6.653446 4.733315 6.520536 0.9016707 4.513410
## 6 4.558559 4.712609 6.380086 6.0562703 5.044277

Oppsummer dette innlegget med: