SAS Tutorial for begyndere: Hvad er og programmeringseksempel

Hvad er SAS?

SAS er en kommandodrevet statistisk softwarepakke, der er meget udbredt til statistisk dataanalyse og visualisering. SAS fuld form er Statistical Analysis Software. Det giver dig mulighed for at bruge kvalitative teknikker og processer, som hjรฆlper dig med at forbedre medarbejdernes produktivitet og fortjeneste. SAS bruges ogsรฅ til avanceret analyse som business intelligence, kriminalitetsefterforskning og prรฆdiktiv analyse. SAS udtales som "SaaS".

I SAS udtrรฆkkes og kategoriseres data, hvilket hjรฆlper dig med at identificere og analysere datamรธnstre. Det er en softwarepakke, som giver dig mulighed for at udfรธre avanceret analyse, Business Intelligence, Predictive Analysis, datastyring for at fungere effektivt under de konkurrencedygtige og skiftende forretningsforhold. Desuden er SAS platformuafhรฆngig, hvilket betyder, at du kan kรธre SAS pรฅ ethvert operativsystem, enten Linux eller Windows.

Sammenlignet med andre BI vรฆrktรธjer, SAS giver omfattende support til programmatisk transformation og analyse af data, bortset fra at bruge trรฆk og slip-grรฆnsefladen. Dette giver meget granulรฆr kontrol over datamanipulation og analyser, som er dens USP.

Hvorfor har vi brug for SAS?

Lad os forstรฅ behovet for SAS med et simpelt eksempel:

Overvej en e-handelsvirksomhed, der รธnsker at kende sine kunders kรธbsmรธnstre baseret pรฅ historiske data. Virksomheden bliver nรธdt til at overveje tusindvis af registreringer af flere kunder for at fรฅ generaliseringsindsigten.

Virksomheden har muligvis ikke alle disse data, der krรฆves til analysen. For eksempel, hvis en kunde ikke kรธbte en jakke, hvad er sรฅ de faktorer, der forhindrede dem i at kรธbe jakken? Disse manglende data kan skabe fejl i din analyse. Hvordan kan du slippe af med disse problemer? Hvordan kan vi hรฅndtere denne type data?

Hvis den udfรธres manuelt, vil denne opgave krรฆve hundredvis af analytikere og tusindvis af mandetimer. Ved at bruge SAS analysevรฆrktรธj kan du lave den samme analyse pรฅ fรฅ timer med en enkelt analytiker. SAS-vรฆrktรธjet giver dig mulighed for at eliminere unรธdvendige data og optimere den relevante information. Det vil gรธre dig i stand til at forudsige et resultat, selv med manglende data. SAS giver dig mulighed for at trรฆffe bedre beslutninger.

Alternative SAS-vรฆrktรธjer

Alternative SAS-vรฆrktรธjer

R: Det er open source software. Det er nemt at lรฆre R, da det er veldokumenteret. Det giver stรฆrke statistiske muligheder.

Python er et andet populรฆrt open source-scriptsprog. Det understรธtter biblioteker som Numpy, Scipy og MatPlotLib. Du kan udfรธre enhver statistisk operation, eller du kan bygge enhver model ved hjรฆlp af disse biblioteker.

SAS: Det er det meget brugte analytiske vรฆrktรธj pรฅ det kommercielle analysemarked. Med et vรฆld af statistiske funktioner og god GUI.

I denne SAS-programmeringsvejledning vil vi diskutere om statistiske analysesystemer, og hvordan det kan bruges til at lรธse vores problemer.

SAS historie

  • SAS blev udviklet af Jim Goodnight og John Shall i 1970 ved NC University
  • Oprindeligt blev det udviklet til landbrugsforskning.
  • Later, udvidede det til en rรฆkke vรฆrktรธjer til blandt andet at omfatte forudsigelig analyse, datastyring, BI.
  • I dag bruger 98 af verdens fรธrende virksomheder i Fortune 400 SAS dataanalysevรฆrktรธj til Dataanalyse.

Nรฆste i denne SAS-sprogtutorial lรฆrer vi om funktionerne i SAS.

SAS funktioner

Nรธgletrรฆk ved SAS er:

  • Fรฅ nemt adgang til rรฅdatafiler og data fra en ekstern database. Lรฆs og skriv nรฆsten alle dataformater!
  • Administrer data ved hjรฆlp af vรฆrktรธjer til dataindtastning, redigeringssรธgning, formatering og konvertering
  • Analyser data ved hjรฆlp af beskrivende, statistik, multivariate teknikker, prognose, modellering, lineรฆr programmering
  • Avanceret analyse hjรฆlper dig med at foretage รฆndringer og forbedringer i forretningspraksis.
  • Rapportdannelse med perfekte grafer
  • Operaforsknings- og projektledelse
  • Opdatering og รฆndring af data
  • Kraftfuldt datahรฅndteringssprog
  • Fremragende datarensningsfunktioner
  • Interagere med flere vรฆrtssystemer

Nรฆste i denne SAS for begyndere tutorial, vil vi lรฆre om SAS Product Suite.

SAS Product Suite

Der er mange SAS-produkter tilgรฆngelige pรฅ markedet. Fรธlgende er en liste over de mere populรฆre.

Navn Beskrivelse
Base SAS Base SAS-software tilbyder hardware agilitet og integreres i alle slags computermiljรธer.
SAS/GRAF Dette vรฆrktรธj hjรฆlper dig med at reprรฆsentere strukturerede data i grafer.
SAS/STAT Dette vรฆrktรธj hjรฆlper dig med at udfรธre forskellige typer regression, statistisk analysevarians, regression og psykometrisk analyse.
SAS/ETS Det bruges til prognoser. Hjรฆlper dig med at udfรธre tidsserieanalysen.
SAS/IML Interaktivt matric-sprog er kendt som IML. Dette vรฆrktรธj hjรฆlper dig med at oversรฆtte matematiske formler til et innovativt program.
SAS EBI Et vรฆrktรธj til Business Intelligence-applikationer
SAS Grid Manager Det er en kernekomponent, som tilbyder datastyringsfacilitet og et programmeringssprog til dataanalyse
SAS/OR Vรฆrktรธj til Operation forskning
SAS/QC Bruges til kvalitetskontrol
SAS/Enterprise Miner Data mining
SAS/PH Analyse af kliniske forsรธg
SAS/AF Det tilbyder applikationsfaciliteter
Enterprise Guide Det er en GUI-baseret kodeeditor og projektleder

Nรฆste i denne SAS tutorials guide vil vi lรฆre om SAS arkitektur.

SAS Architecture

SAS Architecture
Architecture af SAS

SAS arkitektur er hovedsageligt opdelt i tre dele:

  • Klientniveau
  • Middle Tier
  • Bagerste niveau

Kundeniveau

Client tier er det sted, hvor applikationen er installeret pรฅ en maskine, hvor brugeren sidder. Den bestรฅr af de komponenter, der bruges til at se portalen og dens indhold. Den inkluderer ogsรฅ en standard webbrowser, der bruges til at interagere med portalen over standard HTTP- eller HTTPS-protokol. Det hjรฆlper dig ogsรฅ med at gรธre SAS-webapplikationens firewall venlig.

mellemtrin

Mellemlaget tilbyder et centraliseret adgangspunkt til virksomhedsinformation. Al adgang til indhold behandles af komponenter, der fungerer pรฅ dette niveau. Adskillelsen af โ€‹โ€‹forretningslogikken med displaylogikken hjรฆlper dig med at udnytte logikken i mellemlaget. Desuden gรธr centraliserede adgangspunkter det nemmere at hรฅndhรฆve sikkerhedsregler, administrere portalen og administrere kodeรฆndringer.

Mellemlaget er vรฆrt for fรธlgende funktioner:

SAS Information Delivery Portal Webapplikation: Det er samlingen af โ€‹โ€‹JSP, Java servlets, JavaBรธnner og andre klasser og ressourcer. Disse komponenter hjรฆlper dig med at fรฅ adgang til oplysninger, der er gemt i virksomhedens bibliotek, for at skabe en brugerdefinerbar grรฆnseflade til brugeren.

Servlet motor: Servlet-motoren kaldes ogsรฅ en servlet-beholder. Det er ansvarligt for at administrere SAS Information Delivery Portal Web Application. Servlet-motoren tilbyder et driftstidsmiljรธ. Det giver samtidighed, implementering, livscyklusstyring osv.

Webserver: Webserver tilbyder service til servlet-motoren, som kan bruges til at vรฆre vรฆrt for webstedet. Dette skal tilgรฅs via portalen.

Bagerste niveau

Back tier er et omrรฅde, hvor data- og beregningsserverne kรธrer, som kan indeholde forretningsobjekter. Det er en virksomhedskatalogserver. Virksomhedskatalogserveren vedligeholder metadata om indhold, som er placeret i hele virksomheden.

Sรฅdan downloader og installerer du SAS

Lokal download pรฅ din maskine

Trin 1) Download SAS fra givet link

Gรฅ til dette link https://www.sas.com/en_in/software/university-edition.html og klik pรฅ Hent gratis software.

Download og installer SAS

Trin 2) Vรฆlg din Operating System

Vรฆlg operativsystemet i henhold til dit system.

Download og installer SAS

Trin 3) Download og installer virtualiseringssoftware

SAS krรฆver virtualiseringssoftware som f.eks VirtualBox skal installeres, fรธr det kan installeres. Her er de detaljerede trin

Download og installer SAS

Fรธlg trinene nรฆvnt pรฅ skรฆrmen for at installere SAS. At have VirtualBox og lokal installation kan nogle gange vรฆre vanskelig. Vi anbefaler AWS installation-

AWS installation

Du kan implementere SAS i AWS. Det er kvalificeret til gratis niveau.

Trin 1) Gรฅ til https://aws.amazon.com/marketplace/pp/B00WH10IKW. Klik pรฅ "Fortsรฆt med at abonnere"

Download og installer SAS

Trin 2) I denne nรฆste skรฆrm, Accepter vilkรฅr.

Download og installer SAS

Trin 3) Abonnementet afventer tager op til 10 minutter at godkende. Du vil se fรธlgende skรฆrm.

Download og installer SAS

Trin 4) Opdater siden, og du vil bekrรฆfte abonnementet. Klik pรฅ Fortsรฆt til konfiguration

Download og installer SAS

Trin 5) Behold standardindstillingerne, og klik pรฅ Fortsรฆt til start.

Download og installer SAS

Trin 6) Revse konfigurationssiden. Indtast et nรธglevรฆrdi-par. Hvileindstillinger skal vรฆre standard. Klik pรฅ Start

Download og installer SAS

Trin 7) Gรฅ til https://aws.amazon.com/marketplace/library/ og klik pรฅ Vis forekomster.

Download og installer SAS

Trin 8) I popup

  1. Bemรฆrk instans-id'et. Dette er din adgangskode
  2. Klik pรฅ Adgang til software

Download og installer SAS

Trin 9) I pop op-vinduet, der vises, efter du har klikket i trin 8

  1. Indtast brugerlegitimationsoplysninger. Id: sasdemo-adgangskode: instans-id noteret i trin 8
  2. Klik pรฅ Log ind

Download og installer SAS

Trin 10) Du vil se velkomstskรฆrmen.

Download og installer SAS

Fejlfinding

Hvis du ikke kan oprette forbindelse, skal du gรฅ til https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId og indgรฅende/udgรฅende regler for alle

Hvordan bruger man SAS?

For effektivt at bruge SAS-software skal du fรธlge fire trin, som er: Adgang til data, ledelsesdata, analyse, prรฆsentere

Sรฅdan bruger du SAS
Sรฅdan bruger du SAS

Adgangsdata:

SAS giver dig adgang til data i ethvert รธnsket format, du รธnsker.

Du kan tilgรฅ data, der er gemt hvor som helst, uanset om det er i en fil pรฅ dit system eller data, der er gemt i et andet databasesystem. Det kan vรฆre oracle-fil, SAS-databasefil, Raw-databasefil eller en simpel XLS /CSV-fil. Det vil hjรฆlpe dig med at fรฅ adgang til disse data med lethed.

Administrer data:

SAS tilbyder fantastiske datahรฅndteringsmuligheder. Du kan undersรฆtte/opdele data baseret pรฅ visse betingelser, oprette variable, rense og validere data. Der er andre vรฆrktรธjer, som giver dig mulighed for at udfรธre den samme opgave. SAS hjรฆlper dig dog med at udfรธre dette job med lethed.

SAS har veldefinerede biblioteker og processer, som gรธr programmeringsprocessen let. Desuden er oprettelse af variable eller delmรฆngdedata kun et trins proces. Dette sparer dig for at skrive komplekse algoritmer med kun en enkelt linje kode.

Analysere:

Du kan lave forskellige former for analyser ved hjรฆlp af SAS:

  • Den kontrollerer beregning af gennemsnitsfrekvens
  • Regression og prognose
  • Beslutningstrรฆ

Alle disse analyser kan SAS nemt hรฅndtere. Det er det bedste vรฆrktรธj til nรธjagtige prognoser.

Present:

Hvis du visualiserer data korrekt, er det ubesvรฆret for publikum at forholde sig til det. Det er vigtigt, at dit vรฆrktรธj prรฆsenterer dataene pรฅ en passende mรฅde. Det er, hvad SAS gรธr for dig. Det har fremragende prรฆsentationsmuligheder.

Du kan:

1. Liste rapporter

2. Sammenfattende rapporter

3. Grafrapporter

4. Udskriv rapporter

Eksempel pรฅ SAS-program

SAS-programmet bestรฅr af tre nรธdvendige trin:

  • Datatrin
  • Proc Trin
  • Output trin

DATA Trin

Datatrin indlรฆser det nรธdvendige datasรฆt i SAS-hukommelsen og finder de korrekte variabler for datasรฆttet. Det fanger ogsรฅ optegnelserne. Vi kan bruge datatrin til at:

  • Indtast data i SAS-datasรฆt
  • Beregn vรฆrdier
  • Kontroller eller ret data
  • Fremstil nye datasรฆt

Syntaksen for DATA-sรฆtning er:

Syntaks

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Eksempel:

Fรธlgende eksempel viser, hvordan man definerer en variabel, navngiver datasรฆttet, opretter nye variabler og indtaster dataene. I dette eksempel kan du se, at strengvariabelen har en $ i slutningen, og numeriske vรฆrdier er uden den.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Bemรฆrk: For at udfรธre SAS Statement skal du angive RUN-kommandoen.

PROC Trin

Det udfรธrer specifikke analyser eller funktioner for at producere resultater og rapporter.

Syntaks

PROC procedure_name options; #The name of the proc.
RUN;

Eksempel

Det givne eksempel bruger MIDLER procedure for at udskrive middelvรฆrdierne af de numeriske variable i datasรฆttet.

PROC MEANS;
RUN;

OUTPUT-trinnet

Du kan vise dataene fra dataene med betingede output-sรฆtninger.

Syntaks

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Hvert SAS-program skal fรธlge alle ovennรฆvnte trin for at lรฆse inputdataene, analysere dataene og give output fra analysen. Det Lร˜B sรฆtning i slutningen af โ€‹โ€‹hvert trin afslutter udfรธrelsen af โ€‹โ€‹dette trin.

Det komplette SAS-program

Nedenfor er den komplette kode for hvert af ovenstรฅende trin.

Det komplette SAS-program

Output:

Det komplette SAS-program

Det komplette SAS-program

Det komplette SAS-program

Hvor bruges SAS?

Nedenfor er givet nogle vigtige SAS-applikationer:

Industri Brug
Pharmaceutical Statistisk Analyse, Rapportering
Telecom ETL, Rapportering, Data Mining, Forecasting
Finans ETL, Rapportering, Data Mining, Finansiel research
Forudsigelig modellering DBMarketing, aktivitetsbaseret ledelse
Medicinal ETL, rapportering, Data Mining

SAS vs. R

SAS R
SAS er kommerciel software, sรฅ det krรฆver en รธkonomisk investering. R er open source software. Derfor kan alle bruge det.
SAS er det nemmeste analytiske vรฆrktรธj at lรฆre. Selv folk med begrรฆnset viden om SQL kan lรฆre det hurtigt. R krรฆver, at du skriver komplicerede og lange koder.
SAS er et meget foretrukket valg af store virksomheder og er ret teknisk avanceret og brugervenligt. R er hurtigt udviklende software; du skal dog blive ved med at opgradere den.
SAS har god grafisk support, men tilbyder ikke nogen tilpasning. Den grafiske understรธttelse af R-vรฆrktรธjet er meget dรฅrlig.

Fordele ved SAS

  • SAS har en nem syntaks, som kan lรฆres uden nogen form for programmeringsviden
  • Evne til at hรฅndtere en stor database med lethed
  • SAS er et meget forstรฅeligt sprog, som nemt kan fejlsรธges
  • Dens "log"-vindue angiver tydeligt fejlen, som hjรฆlper dig med at fejlsรธge din kode nemt
  • SAS hjรฆlper dig med at teste og analysere algoritmen grundigt
  • SAS er fuldstรฆndig sikret, sรฅ du ikke kan udtrรฆkke uden licens pรฅ kontoret
  • Gรธr statistisk databehandling lettere for ikke-programmerende brugere
  • Hรฅndterer store databaser effektivt.

Ulemper ved SAS

  • Omkostningerne er hรธje, fordi individ eller organisation ikke kan bruge alle applikationer uden en ordentlig licens
  • SAS er ikke open source, sรฅ algoritmer, der bruges i SAS, er ikke tilgรฆngelige til almindelig brug
  • Tekstmining er en meget besvรฆrlig og vanskelig proces i SAS.

Resumรฉ

  • SAS-software, der betyder statistisk analysesoftware, som bruges til dataanalyse
  • R og Python er to udbredte alternative vรฆrktรธjer fra SAS.
  • SAS blev udviklet af Jim Goodnight og John Shall i 1970 ved NC University
  • SAS giver dig adgang til rรฅdatafiler og data i en ekstern database af enhver art
  • SAS-arkitekturen er hovedsageligt opdelt i tre dele 1) Klientniveau 2) Mellemniveau 3) Bagerste niveau
  • For at bruge SAS-software skal du fรธlge fire trin, som er: 1) Adgang til data, 2) Ledelse 3) Analyser data, 4) Prรฆsentation
  • SAS-programmet bestรฅr af tre grundlรฆggende trin: Data Step, Proc Step og Output Step
  • SAS dataanalysevรฆrktรธj er meget udbredt i sektorer som farmaceutisk, telekommunikation, finans, prรฆdiktiv modellering og sundhedspleje
  • SAS er kommerciel software, mens R er open source-software
  • Den stรธrste fordel ved SAS programmรธrvรฆrktรธj er, at det har en nem syntaks, der kan lรฆres uden nogen form for programmeringsviden.
  • En af ulemperne ved SAS-modellen er, at det ikke er et open source-vรฆrktรธj. Sรฅ algoritmer, der bruges i SAS-procedurer, er ikke tilgรฆngelige til almindelig brug.

Opsummer dette indlรฆg med: