Po wprowadzeniu danych możemy przystąpić do analiz. Typowe procedury analizy danych wyprowadzają rezultatu do okna output i komunikaty o wykonywanych obliczenia są podawane w oknie log. Część procedur może również tworzyć nowe zbiory w formacie SAS. Poniższe przykłady pokazują typowy przebieg sesji wraz z rezultatami i komunikatami w oknie log.
Wprowadźmy jeszcze raz dane dotyczące sprzedaży komputerów, ale stosując inną metodę. Tutaj dane są podane jako część programu po poleceniu cards.
Wprowadzamy dane programem
data sales;
input salesrep $ sales region $ machine $;
cards;
Stafer 9664 east SM
Young 22969 east SM
Stride 27253 east SM
Topin 86432 east C
Spark 99210 east C
Vetter 38928 west C
Curci 21531 west SM
Marco 79345 west C
Greco 18523 west SM
Ryan 32915 west SM
Tomas 42109 west SM
Thalman 94320 south C
Moore 25718 south SM
Allen 64700 south C
Stelam 27634 south SM
Farlow 32719 north SM
Smith 38712 north SM
Wilson 97214 north C
;
run;
którego wykonanie nie daje żadnego rezultatu w oknie output i następującą informację w log:
NOTE: Copyright(c) 1985,86,87 SAS Institute Inc., Cary, NC 27512-8000, U.S.A.
NOTE: SAS (r) Proprietary Software Release 6.04
Licensed to INSTYTUT MATEMATYCZNY POLITECHNIKA WROCLAWSKA, Site
81643001.
NOTE: AUTOEXEC processing completed.
1 data sales;
2 input salesrep $ sales region $ machine $;
3 cards;
4 run;
NOTE: The data set WORK.SALES has 18 observations and 4 variables.
NOTE: The DATA statement used 4.00 seconds.
Sprawdzamy co zostało wprowadzone
proc print;
run;
W oknie output otrzymujemy
SAS 14:03 Saturday, December 4, 1993 1
OBS SALESREP SALES REGION MACHINE
1 Stafer 9664 east SM
2 Young 22969 east SM
3 Stride 27253 east SM
4 Topin 86432 east C
5 Spark 99210 east C
6 Vetter 38928 west C
7 Curci 21531 west SM
8 Marco 79345 west C
9 Greco 18523 west SM
10 Ryan 32915 west SM
11 Tomas 42109 west SM
12 Thalman 94320 south C
13 Moore 25718 south SM
14 Allen 64700 south C
15 Stelam 27634 south SM
16 Farlow 32719 north SM
17 Smith 38712 north SM
18 Wilson 97214 north C
a w log
5 proc print; 6 run; NOTE: The PROCEDURE PRINT used 3.00 seconds.
Tabelę częstości obserwacji wg zmiennych region i machine
oblicza procedura freq
proc freq;
tables region*machine;
run;
z rezultatem
SAS 14:03 Saturday, December 4, 1993 2
TABLE OF REGION BY MACHINE
REGION MACHINE
Frequency|
Percent |
Row Pct |
Col Pct |C |SM | Total
---------+--------+--------+
east | 2 | 3 | 5
| 11.11 | 16.67 | 27.78
| 40.00 | 60.00 |
| 28.57 | 27.27 |
---------+--------+--------+
north | 1 | 2 | 3
| 5.56 | 11.11 | 16.67
| 33.33 | 66.67 |
| 14.29 | 18.18 |
---------+--------+--------+
south | 2 | 2 | 4
| 11.11 | 11.11 | 22.22
| 50.00 | 50.00 |
| 28.57 | 18.18 |
---------+--------+--------+
west | 2 | 4 | 6
| 11.11 | 22.22 | 33.33
| 33.33 | 66.67 |
| 28.57 | 36.36 |
---------+--------+--------+
Total 7 11 18
38.89 61.11 100.00
i log
7 proc freq; 8 tables region*machine; 9 run; NOTE: The PROCEDURE FREQ used 6.00 seconds.Przed policzeniem średnich zmiennej sales w klasach względem zmiennej machine wykonamy sortowanie danych względem zmiennej machine i wypiszemy posortowane dane.
proc sort out=sales1;
by machine;
proc print;
run;
Otrzymujemy
SAS 14:40 Saturday, December 4, 1993 3
OBS SALESREP SALES REGION MACHINE
1 Topin 86432 east C
2 Spark 99210 east C
3 Vetter 38928 west C
4 Marco 79345 west C
5 Thalman 94320 south C
6 Allen 64700 south C
7 Wilson 97214 north C
8 Stafer 9664 east SM
9 Young 22969 east SM
10 Stride 27253 east SM
11 Curci 21531 west SM
12 Greco 18523 west SM
13 Ryan 32915 west SM
14 Tomas 42109 west SM
15 Moore 25718 south SM
16 Stelam 27634 south SM
17 Farlow 32719 north SM
18 Smith 38712 north SM
i log
10 proc sort out=sales1; 11 by machine; 12 proc print; NOTE: The data set WORK.SALES1 has 18 observations and 4 variables. NOTE: The PROCEDURE SORT used 3.00 seconds. 13 run;Na zakończenie policzymy średnie obroty dla poszczególnych klas maszyn.
proc means data=sales1;
by machine;
run;
Oto wyniki
SAS 14:40 Saturday, December 4, 1993 4
Analysis Variable : SALES
---------------------------------- MACHINE=C ----------------------------------
N Obs N Minimum Maximum Mean Std Dev
-----------------------------------------------------------------
7 7 38928.00 99210.00 80021.29 21730.18
-----------------------------------------------------------------
---------------------------------- MACHINE=SM ---------------------------------
N Obs N Minimum Maximum Mean Std Dev
-----------------------------------------------------------------
11 11 9664.00 42109.00 27249.73 9236.48
-----------------------------------------------------------------
i log
NOTE: The PROCEDURE PRINT used 4.00 seconds. 14 proc means data=sales1; 15 by machine; 16 run; NOTE: The PROCEDURE MEANS used 4.00 seconds.
Podane przykłady ilustrują możliwość wprowadzania programu i jego wykonywanie w trybie interakcyjnym. Pomocą przy konstrukcji programu do konkretnej analiz może być system menu uruchamiany poleceniem menu w linii komend. Zaprojektowany i przetestowany program można zapisać w pliku poleceniem file 'nazwa.pgm' i wykonywać w trybie pracy wsadowej. Wyniki wówczas są zapisywane do pliku nazwa.lst a komunikaty do pliku nazwa.log. Więcej informacji na temat obsługi programu SAS podano Dodatku A.