next up previous contents
Next: Rachunek prawdopodobieństwa Up: Ogólne uwagi o programie Previous: Uruchomienie systemu

Pierwsze analizy

Po wprowadzeniu danych możemy przystąpić do analiz. Typowe procedury analizy danych wyprowadzają rezultatu do okna output i komunikaty o wykonywanych obliczenia są podawane w oknie log. Część procedur może również tworzyć nowe zbiory w formacie SAS. Poniższe przykłady pokazują typowy przebieg sesji wraz z rezultatami i komunikatami w oknie log.

Wprowadźmy jeszcze raz dane dotyczące sprzedaży komputerów, ale stosując inną metodę. Tutaj dane są podane jako część programu po poleceniu cards.

Wprowadzamy dane programem

    data sales;
      input salesrep $ sales region $ machine $;
      cards;
	     Stafer       9664    east        SM
        Young       22969    east        SM
        Stride      27253    east        SM
        Topin       86432    east        C
        Spark       99210    east        C
        Vetter      38928    west        C
        Curci       21531    west        SM
        Marco       79345    west        C
        Greco       18523    west        SM
        Ryan        32915    west        SM
        Tomas       42109    west        SM
        Thalman     94320    south       C
        Moore       25718    south       SM
        Allen       64700    south       C
        Stelam      27634    south       SM
        Farlow      32719    north       SM
        Smith       38712    north       SM
        Wilson      97214    north       C
		  ;
   run;
którego wykonanie nie daje żadnego rezultatu w oknie output i następującą informację w log:

NOTE: Copyright(c) 1985,86,87 SAS Institute Inc., Cary, NC 27512-8000, U.S.A.
NOTE: SAS (r) Proprietary Software Release 6.04
      Licensed to INSTYTUT MATEMATYCZNY POLITECHNIKA WROCLAWSKA, Site
      81643001.


NOTE: AUTOEXEC processing completed.

   1    data sales;
   2        input salesrep $ sales region $ machine $;
   3          cards;
   4           run;
NOTE: The data set WORK.SALES has 18 observations and 4 variables.
NOTE: The DATA statement used 4.00 seconds.

Sprawdzamy co zostało wprowadzone

	
       proc print;
       run;
W oknie output otrzymujemy
                                     SAS     14:03 Saturday, December 4, 1993   1

                 OBS    SALESREP    SALES    REGION    MACHINE

                   1    Stafer       9664    east        SM
                   2    Young       22969    east        SM
                   3    Stride      27253    east        SM
                   4    Topin       86432    east        C
                   5    Spark       99210    east        C
                   6    Vetter      38928    west        C
                   7    Curci       21531    west        SM
                   8    Marco       79345    west        C
                   9    Greco       18523    west        SM
                  10    Ryan        32915    west        SM
                  11    Tomas       42109    west        SM
                  12    Thalman     94320    south       C
                  13    Moore       25718    south       SM
                  14    Allen       64700    south       C
                  15    Stelam      27634    south       SM
                  16    Farlow      32719    north       SM
                  17    Smith       38712    north       SM
                  18    Wilson      97214    north       C
a w log
   5           proc print;
   6           run;
NOTE: The PROCEDURE PRINT used 3.00 seconds.

Tabelę częstości obserwacji wg zmiennych region i machine oblicza procedura freq

       proc freq;
         tables region*machine;
       run;
z rezultatem
                                   SAS     14:03 Saturday, December 4, 1993   2

                           TABLE OF REGION BY MACHINE

                      REGION     MACHINE

                      Frequency|
                      Percent  |
                      Row Pct  |
                      Col Pct  |C       |SM      |  Total
                      ---------+--------+--------+
                      east     |      2 |      3 |      5
                               |  11.11 |  16.67 |  27.78
                               |  40.00 |  60.00 |
                               |  28.57 |  27.27 |
                      ---------+--------+--------+
                      north    |      1 |      2 |      3
                               |   5.56 |  11.11 |  16.67
                               |  33.33 |  66.67 |
                               |  14.29 |  18.18 |
                      ---------+--------+--------+
                      south    |      2 |      2 |      4
                               |  11.11 |  11.11 |  22.22
                               |  50.00 |  50.00 |
                               |  28.57 |  18.18 |
                      ---------+--------+--------+
                      west     |      2 |      4 |      6
                               |  11.11 |  22.22 |  33.33
                               |  33.33 |  66.67 |
                               |  28.57 |  36.36 |
                      ---------+--------+--------+
                      Total           7       11       18
                                  38.89    61.11   100.00
i log
   7           proc freq;
   8             tables region*machine;
   9           run;
NOTE: The PROCEDURE FREQ used 6.00 seconds.
Przed policzeniem średnich zmiennej sales w klasach względem zmiennej machine wykonamy sortowanie danych względem zmiennej machine i wypiszemy posortowane dane.
       proc sort out=sales1;
          by machine;
	    proc print;
       run;
Otrzymujemy
                                   SAS     14:40 Saturday, December 4, 1993  3

                 OBS    SALESREP    SALES    REGION    MACHINE

                   1    Topin       86432    east        C
                   2    Spark       99210    east        C
                   3    Vetter      38928    west        C
                   4    Marco       79345    west        C
                   5    Thalman     94320    south       C
                   6    Allen       64700    south       C
                   7    Wilson      97214    north       C
                   8    Stafer       9664    east        SM
                   9    Young       22969    east        SM
                  10    Stride      27253    east        SM
                  11    Curci       21531    west        SM
                  12    Greco       18523    west        SM
                  13    Ryan        32915    west        SM
                  14    Tomas       42109    west        SM
                  15    Moore       25718    south       SM
                  16    Stelam      27634    south       SM
                  17    Farlow      32719    north       SM
                  18    Smith       38712    north       SM
i log
   10           proc sort out=sales1;
   11              by machine;
   12           proc print;
NOTE: The data set WORK.SALES1 has 18 observations and 4 variables.
NOTE: The PROCEDURE SORT used 3.00 seconds.
   13           run;
Na zakończenie policzymy średnie obroty dla poszczególnych klas maszyn.
		 
       proc means data=sales1;
         by machine;
       run;
Oto wyniki
                                   SAS     14:40 Saturday, December 4, 1993  4

       Analysis Variable : SALES


---------------------------------- MACHINE=C ----------------------------------


       N Obs   N       Minimum       Maximum          Mean       Std Dev
       -----------------------------------------------------------------
           7   7      38928.00      99210.00      80021.29      21730.18
       -----------------------------------------------------------------

---------------------------------- MACHINE=SM ---------------------------------


       N Obs   N       Minimum       Maximum          Mean       Std Dev
       -----------------------------------------------------------------
          11  11       9664.00      42109.00      27249.73       9236.48
       -----------------------------------------------------------------
i log
NOTE: The PROCEDURE PRINT used 4.00 seconds.
   14           proc means data=sales1;
   15             by machine;
   16           run;
NOTE: The PROCEDURE MEANS used 4.00 seconds.

Podane przykłady ilustrują możliwość wprowadzania programu i jego wykonywanie w trybie interakcyjnym. Pomocą przy konstrukcji programu do konkretnej analiz może być system menu uruchamiany poleceniem menu w linii komend. Zaprojektowany i przetestowany program można zapisać w pliku poleceniem file 'nazwa.pgm' i wykonywać w trybie pracy wsadowej. Wyniki wówczas są zapisywane do pliku nazwa.lst a komunikaty do pliku nazwa.log. Więcej informacji na temat obsługi programu SAS podano Dodatku A.


next up previous contents
Next: Rachunek prawdopodobieństwa Up: Ogólne uwagi o programie Previous: Uruchomienie systemu
K.Szajowski
2000-04-05