SAS-veiledning for nybegynnere: Hva er og programmeringseksempel

Hva er SAS?

SAS er en kommandodrevet statistisk programvarepakke som er mye brukt for statistisk dataanalyse og visualisering. SAS full form er Statistical Analysis Software. Den lar deg bruke kvalitative teknikker og prosesser som hjelper deg med รฅ forbedre ansattes produktivitet og forretningsfortjeneste. SAS brukes ogsรฅ til avanserte analyser som business intelligence, kriminalitetsetterforskning og prediktiv analyse. SAS uttales som "SaaS."

I SAS trekkes og kategoriseres data som hjelper deg med รฅ identifisere og analysere datamรธnstre. Det er en programvarepakke som lar deg utfรธre avansert analyse, Business Intelligence, Predictive Analysis, dataadministrasjon for รฅ fungere effektivt i konkurransedyktige og skiftende forretningsforhold. Dessuten er SAS plattformuavhengig, noe som betyr at du kan kjรธre SAS pรฅ alle operativsystemer, enten Linux eller Windows.

Sammenlignet med andre BI -verktรธy, gir SAS omfattende stรธtte for รฅ programmatisk transformere og analysere data, bortsett fra รฅ bruke dra-og-slipp-grensesnittet. Dette gir svรฆrt detaljert kontroll over datamanipulering og analyser som er dens USP.

Hvorfor trenger vi SAS?

La oss forstรฅ behovet for SAS med et enkelt eksempel:

Vurder et e-handelsselskap som รธnsker รฅ vite kjรธpsmรธnstrene til kundene sine basert pรฅ historiske data. Selskapet mรฅ vurdere tusenvis av registreringer av flere kunder for รฅ fรฅ generalisert innsikt.

Selskapet har kanskje ikke alle disse dataene som kreves for analysen. For eksempel, hvis en kunde ikke kjรธpte en jakke, hva er faktorene som stoppet dem fra รฅ kjรธpe jakken? Disse manglende dataene kan skape feil i analysen din. Hvordan kan du bli kvitt disse problemene? Hvordan kan vi hรฅndtere denne typen data?

Hvis den gjรธres manuelt, vil denne oppgaven kreve hundrevis av analytikere og tusenvis av arbeidstimer. Ved รฅ bruke SAS analyseverktรธy kan du gjรธre den samme analysen i lรธpet av fรฅ timer med en enkelt analytiker. SAS-verktรธyet lar deg eliminere unรธdvendige data og optimalisere relevant informasjon. Det vil gjรธre deg i stand til รฅ forutsi et utfall selv med manglende data. SAS gjรธr det mulig for deg รฅ ta bedre beslutninger.

Alternative SAS-verktรธy

Alternative SAS-verktรธy

R: Det er รฅpen kildekode-programvare. Det er lett รฅ lรฆre R da det er godt dokumentert. Det tilbyr sterke statistiske muligheter.

Python er et annet populรฆrt skriptsprรฅk med รฅpen kildekode. Den stรธtter biblioteker som Numpy, Scipy og MatPlotLib. Du kan utfรธre hvilken som helst statistisk operasjon, eller du kan bygge hvilken som helst modell ved รฅ bruke disse bibliotekene.

SAS: Det er det mye brukte analytiske verktรธyet i det kommersielle analysemarkedet. Med en mengde statistiske funksjoner og god GUI.

I denne SAS-programmeringsveiledningen vil vi diskutere om Statistical Analytical Systems, og hvordan det kan brukes til รฅ lรธse problemene vรฅre.

SAS historie

  • SAS ble utviklet av Jim Goodnight og John Shall i 1970 ved NC University
  • Opprinnelig ble den utviklet for landbruksforskning.
  • Later, utvidet det til en rekke verktรธy for รฅ inkludere Predictive Analytics, Data Management, BI blant andre.
  • I dag bruker 98 av verdens beste selskaper i Fortune 400 SAS dataanalyseverktรธy for Dataanalyse.

Neste i denne SAS-sprรฅkopplรฆringen vil vi lรฆre om funksjonene til SAS.

SAS-funksjoner

Hovedtrekkene til SAS er:

  • Fรฅ enkel tilgang til rรฅdatafiler og data fra en ekstern database. Les og skriv nesten alle dataformater!
  • Administrer data ved รฅ bruke verktรธy for dataregistrering, redigeringshenting, formatering og konvertering
  • Analyser data ved รฅ bruke beskrivende, statistikk, multivariate teknikker, prognoser, modellering, lineรฆr programmering
  • Avansert analyse hjelper deg med รฅ gjรธre endringer og forbedringer i forretningspraksis.
  • Rapportformasjon med perfekte grafer
  • Operaforskning og prosjektledelse
  • Dataoppdatering og modifikasjon
  • Kraftig datahรฅndteringssprรฅk
  • Utmerkede datarensefunksjoner
  • Samhandle med flere vertssystemer

Neste i denne veiledningen for SAS for nybegynnere vil vi lรฆre om SAS Product Suite.

SAS Product Suite

Det er mange SAS-produkter tilgjengelig pรฅ markedet. Fรธlgende er en liste over de mest populรฆre.

Navn Tekniske beskrivelser
Base SAS Base SAS-programvare tilbyr maskinvare smidighet og integreres i alle slags datamiljรธer.
SAS/GRAPH Dette verktรธyet hjelper deg med รฅ representere strukturerte data i grafer.
SAS/STAT Dette verktรธyet hjelper deg med รฅ utfรธre ulike typer regresjon, statistisk analysevarians, regresjon og psykometrisk analyse.
SAS/ETS Den brukes til prognoser. Hjelper deg med รฅ utfรธre tidsserieanalysen.
SAS/IML Interaktivt matrikksprรฅk er kjent som IML. Dette verktรธyet hjelper deg med รฅ oversette matematiske formler til et innovativt program.
SAS EBI Et verktรธy for Business Intelligence-applikasjoner
SAS nettsjef Det er en kjernekomponent som tilbyr databehandlingsanlegg og et programmeringssprรฅk for dataanalyse
SAS/OR Verktรธy for Operasjonsforskning
SAS/QC Brukes til kvalitetskontroll
SAS/Enterprise Miner Datautvinning
SAS/PH Klinisk prรธveanalyse
SAS/AF Det tilbyr applikasjonsmuligheter
Enterprise Guide Det er en GUI-basert koderedigerer og prosjektleder

Neste i denne SAS-veiledningen vil vi lรฆre om SAS-arkitektur.

SAS Architecture

SAS Architecture
Architecture av SAS

SAS-arkitektur er hovedsakelig delt inn i tre deler:

  • Klientnivรฅ
  • Midttrinn
  • Bakre lag

Klientnivรฅ

Klientnivรฅ er der applikasjonen er installert pรฅ en maskin, hvor brukeren sitter. Den bestรฅr av komponentene som brukes til รฅ se portalen og dens innhold. Den inkluderer ogsรฅ en standard nettleser som brukes til รฅ samhandle med portalen over standard HTTP- eller HTTPS-protokoller. Det hjelper deg ogsรฅ รฅ gjรธre SAS-nettapplikasjonens brannmurvennlig.

Mellomlag

Mellomlaget tilbyr et sentralisert tilgangspunkt for bedriftsinformasjon. All tilgang til innhold behandles av komponenter som opererer pรฅ dette nivรฅet. Separasjonen av forretningslogikken med visningslogikken hjelper deg รฅ utnytte logikken til mellomlaget. I tillegg gjรธr sentraliserte tilgangspunkter det enklere รฅ hรฅndheve sikkerhetsregler, administrere portalen og administrere kodeendringer.

Mellomnivรฅet har fรธlgende funksjoner:

Webapplikasjon for SAS informasjonsleveringsportal: Det er samlingen av JSP, Java servlets, JavaBรธnner og andre klasser og ressurser. Disse komponentene hjelper deg med รฅ fรฅ tilgang til informasjon som er lagret i bedriftskatalogen for รฅ lage et tilpassbart grensesnitt for brukeren.

Servlet-motor: Servletmotoren kalles ogsรฅ en servletbeholder. Det er ansvarlig for รฅ administrere SAS Information Delivery Portal Web Application. Servlet-motoren tilbyr et driftstidsmiljรธ. Det gir samtidighet, distribusjon, livssyklusadministrasjon, etc.

Nettserver: Webserver tilbyr tjenester for servletmotoren som kan brukes til รฅ vรฆre vert for nettstedet. Dette bรธr nรฅs via portalen.

Bakre lag

Back tier er et omrรฅde hvor data- og beregningsservere kjรธrer som kan inneholde forretningsobjekter. Det er en bedriftskatalogserver. Bedriftskatalogserveren opprettholder metadata om innhold som er plassert i hele bedriften.

Hvordan laste ned og installere SAS

Lokal nedlasting pรฅ maskinen din

Trinn 1) Last ned SAS fra gitt link

Gรฅ til denne lenken https://www.sas.com/en_in/software/university-edition.html og klikk pรฅ Get Free Software.

Last ned og installer SAS

Trinn 2) Velg din Operating System

Velg operativsystem i henhold til ditt system.

Last ned og installer SAS

Trinn 3) Last ned og installer virtualiseringsprogramvare

SAS krever virtualiseringsprogramvare som VirtualBox skal installeres fรธr den kan installeres. Her er de detaljerte trinnene

Last ned og installer SAS

Fรธlg trinnene nevnt pรฅ skjermen for รฅ installere SAS. ร… ha VirtualBox og lokal installasjon kan noen ganger vรฆre vanskelig. Vi anbefaler AWS installasjon-

AWS installasjon

Du kan distribuere SAS i AWS. Det er kvalifisert for gratis nivรฅ.

Trinn 1) Gรฅ til https://aws.amazon.com/marketplace/pp/B00WH10IKW. Klikk "Fortsett รฅ abonnere"

Last ned og installer SAS

Trinn 2) I denne neste skjermen, Godta vilkรฅrene.

Last ned og installer SAS

Trinn 3) Det tar opptil 10 minutter รฅ godkjenne abonnementet. Du vil se fรธlgende skjermbilde.

Last ned og installer SAS

Trinn 4) Oppdater siden, og du vil bekrefte abonnementet. Klikk pรฅ Fortsett til konfigurasjon

Last ned og installer SAS

Trinn 5) Behold standardinnstillingene og klikk pรฅ Fortsett til start.

Last ned og installer SAS

Trinn 6) Revse konfigurasjonssiden. Skriv inn et nรธkkelverdi-par. Hvileinnstillinger skal vรฆre standard. Klikk pรฅ Start

Last ned og installer SAS

Trinn 7) Gรฅ til https://aws.amazon.com/marketplace/library/ og klikk pรฅ Vis forekomster.

Last ned og installer SAS

Trinn 8) I popup

  1. Legg merke til forekomst-ID. Dette er passordet ditt
  2. Klikk pรฅ Tilgang til programvare

Last ned og installer SAS

Trinn 9) I popup-vinduet vises det etter at du har klikket i trinn 8

  1. Skriv inn brukerlegitimasjon. ID: sasdemo-passord: forekomst-ID notert i trinn 8
  2. Klikk pรฅ Logg pรฅ

Last ned og installer SAS

Trinn 10) Du vil se velkomstskjermen.

Last ned og installer SAS

Feilsรธking

Hvis du ikke kan koble til, gรฅ til https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId og inngรฅende/utgรฅende regler for alle

Hvordan bruke SAS?

For รฅ bruke SAS-programvare effektivt mรฅ du fรธlge fire trinn som er: Fรฅ tilgang til data, administrasjonsdata, Analyse, Presenter

Slik bruker du SAS
Slik bruker du SAS

Tilgangsdata:

SAS lar deg fรฅ tilgang til data i hvilket som helst รธnsket format du รธnsker.

Du kan fรฅ tilgang til data som er lagret hvor som helst, enten det er i en fil pรฅ systemet ditt eller data som er lagret i et annet databasesystem. Det kan vรฆre oracle-fil, SAS-databasefil, Raw Database-fil eller en enkel XLS /CSV-fil. Det vil hjelpe deg รฅ fรฅ tilgang til disse dataene med letthet.

Administrer data:

SAS tilbyr gode databehandlingsmuligheter. Du kan undersette/skjรฆre data basert pรฅ visse forhold, lage variable, rense og validere data. Det finnes andre verktรธy som lar deg utfรธre den samme oppgaven. SAS hjelper deg imidlertid med รฅ utfรธre denne jobben med letthet.

SAS har veldefinerte biblioteker og prosesser som gjรธr programmeringsprosessen enkel. Dessuten er รฅ lage variable eller delsettdata bare ett trinn. Dette sparer deg for รฅ skrive komplekse algoritmer med bare en enkelt kodelinje.

Analysere:

Du kan gjรธre ulike typer analyser ved hjelp av SAS:

  • Den kontrollerer beregningen av gjennomsnittlig frekvens
  • Regresjon og prognoser
  • Beslutningstre

Alle disse analysene kan enkelt hรฅndteres av SAS. Det er det beste verktรธyet for nรธyaktige prognoser.

Present:

Hvis du visualiserer data riktig, er det enkelt for publikum รฅ forholde seg til det. Det er viktig at verktรธyet ditt presenterer dataene pรฅ en passende mรฅte. Det er det SAS gjรธr for deg. Den har utmerkede presentasjonsevner.

Du kan:

1. Liste rapporter

2. Sammendragsrapporter

3. Grafrapporter

4. Skriv ut rapporter

Eksempel pรฅ SAS-program

SAS-programmet bestรฅr av tre nรธdvendige trinn:

  • Datatrinn
  • Proc Step
  • Utgangstrinn

DATA trinn

Datatrinn laster det nรธdvendige datasettet inn i SAS-minnet og finner de riktige variablene for datasettet. Den fanger ogsรฅ opp postene. Vi kan bruke datatrinn til รฅ:

  • Legg inn data i SAS-datasett
  • Beregn verdier
  • Kontroller eller korriger data
  • Lag nye datasett

Syntaksen for DATA-setningen er:

syntax

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Eksempel:

Fรธlgende eksempel viser hvordan du definerer en variabel, navngir datasettet, oppretter nye variabler og legger inn dataene. I dette eksemplet kan du se at strengvariabelen har en $ pรฅ slutten, og numeriske verdier er uten.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Merk: For รฅ utfรธre SAS Statement mรฅ du spesifisere RUN-kommandoen.

PROC trinn

Den utfรธrer spesifikke analyser eller funksjoner for รฅ produsere resultater og rapporter.

syntax

PROC procedure_name options; #The name of the proc.
RUN;

Eksempel

Det gitte eksemplet bruker MIDLER prosedyre for รฅ skrive ut gjennomsnittsverdiene til de numeriske variablene i datasettet.

PROC MEANS;
RUN;

OUTPUT-trinnet

Du kan vise dataene fra dataene med betingede utdatasetninger.

syntax

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Hvert SAS-program mรฅ fรธlge alle trinnene ovenfor for รฅ lese inndataene, analysere dataene og gi resultatet av analysen. De Lร˜PE uttalelse pรฅ slutten av hvert trinn fullfรธrer utfรธrelsen av det trinnet.

Det komplette SAS-programmet

Nedenfor er den komplette koden for hvert av trinnene ovenfor.

Det komplette SAS-programmet

Utgang:

Det komplette SAS-programmet

Det komplette SAS-programmet

Det komplette SAS-programmet

Hvor brukes SAS?

Nedenfor er noen viktige SAS-applikasjoner:

Industri bruk
Pharmaceutical Statistisk analyse, rapportering
Telecom ETL, rapportering, datautvinning, prognoser
Finans ETL, Rapportering, Data Mining, Finansiell forskning
Forutsigende modellering DBMarketing, aktivitetsbasert ledelse
Helsevesen ETL, rapportering, Data Mining

SAS vs. R

SAS R
SAS er kommersiell programvare, sรฅ det krever en รธkonomisk investering. R er รฅpen kildekode programvare. Derfor kan hvem som helst bruke den.
SAS er det enkleste analytiske verktรธyet รฅ lรฆre. Selv personer med begrenset kunnskap om SQL kan lรฆre det raskt. R krever at du skriver kompliserte og lange koder.
SAS er et svรฆrt foretrukket valg av store selskaper og er ganske teknisk avansert og brukervennlig. R er raskt utviklende programvare; men du mรฅ fortsette รฅ oppgradere den.
SAS har god grafisk stรธtte, men tilbyr ingen tilpasning. Grafisk stรธtte for R-verktรธyet er svรฆrt dรฅrlig.

Fordeler med SAS

  • SAS har en enkel syntaks som kan lรฆres uten noen form for programmeringskunnskap
  • Evne til รฅ hรฅndtere en stor database med letthet
  • SAS er et veldig forstรฅelig sprรฅk som enkelt kan feilsรธkes
  • "Logg"-vinduet viser tydelig feilen som hjelper deg รฅ feilsรธke koden din enkelt
  • SAS hjelper deg med รฅ teste og analysere algoritmen grundig
  • SAS er fullstendig sikret slik at du ikke kan trekke ut uten lisens pรฅ kontoret
  • Gjรธr statistisk databehandling enklere for ikke-programmerende brukere
  • Hรฅndterer store databaser effektivt.

Ulemper med SAS

  • Kostnadene er hรธye fordi enkeltpersoner eller organisasjoner ikke kan bruke alle applikasjoner uten en riktig lisens
  • SAS er ikke รฅpen kildekode, sรฅ algoritmer som brukes i SAS er ikke tilgjengelige for vanlig bruk
  • Tekstutvinning er en svรฆrt plagsom og vanskelig prosess i SAS.

Sammendrag

  • SAS-programvare betyr Statistical Analysis Software som brukes til dataanalyse
  • R og Python er to mye brukte alternative verktรธy av SAS.
  • SAS ble utviklet av Jim Goodnight og John Shall i 1970 ved NC University
  • SAS lar deg fรฅ tilgang til rรฅdatafiler og data i en ekstern database av noe slag
  • SAS-arkitektur er hovedsakelig delt i tre deler 1) Klientnivรฅ 2) Mellomnivรฅ 3) Bakre nivรฅ
  • For รฅ bruke SAS-programvare mรฅ du fรธlge fire trinn som er: 1) Fรฅ tilgang til data, 2) Administrasjon 3) Analyser data, 4) Presentasjon
  • SAS-programmet bestรฅr av tre grunnleggende trinn: Data Step, Proc Step og Output Step
  • SAS dataanalyseverktรธy er mye brukt i sektorer som farmasรธytisk, telekom, finans, prediktiv modellering og helsevesen
  • SAS er kommersiell programvare mens R er รฅpen kildekode
  • Den stรธrste fordelen med SAS programmererverktรธy er at det har en enkel syntaks som kan lรฆres uten noen form for programmeringskunnskap.
  • En av ulempene med SAS-modellen er at den ikke er et รฅpen kildekodeverktรธy. Sรฅ algoritmer som brukes i SAS-prosedyrer er ikke tilgjengelige for vanlig bruk.

Oppsummer dette innlegget med: