niedziela, 13 stycznia 2013

2.3.5 Graficzne przedstawienie próbki: prawdopodobieństwo skumulowane, wykres ramkowy



Zakładamy, że prawdopodobieństwo uzyskani każdego elementu próbki n elementowej jest równe 1/n. Uporządkujmy próbkę według wartości rosnących. Prawdopodobieństwem skumulowanym (dystrybuantą empiryczną) p(x) dla danego x nazywamy prawdopodobieństwo otrzymania wartości mniejszej lub równej x: p(x)=p(xi£x) w próbce uporządkowanej.

Jednym z wielu sposobów graficznej prezentacji próbki jest wykres ramkowy, potocznie nazywany  ‘pudełkiem z wąsami’ (ang. box-and-whisker plot), zaproponowany w 1977 roku przez J.Tukey’a. Rysujemy najpierw prostokąt, którego dolny bok jest kwartylem dolnym, a górny bok kwartylem górnym. Pozioma linia dzieląca prostokąt to mediana. Wąsy powstają z połączenia powstałego pudełka z krótkimi liniami poziomymi, narysowanymi dla kwantyla q=0.95 (górny wąs) i kwantyla 0.05 (wąs dolny). Na rysunku zaznaczyć można także inne wartości kwantyli (np. 0.01 i 0.99), jak i inne statystyki próbki, np. wartość średnią, ekstremalne wartości w próbce, itp.



PRZYKŁAD: Próbka 40. elementowa – utworzona za pomocą  generatora liczb losowych, z rozkładu lognormalnego LND(4, 0.4)  (Program MATHEMATICA) 


48.4478  69.2368  21.6994  29.3819  65.3572
45.7823  55.4199  42.1859  47.8664  55.7535
87.1514  49.3306  37.5616  56.4771  26.8422
74.2661  51.3336  77.8302  40.1117  41.5877
55.8195  35.9834  67.6347  82.9544  42.1217
61.1744  35.7469  43.1695  48.9212  52.3768
63.7887  39.5142  153.613  98.6516  86.1010
30.4353  34.3459  39.4973  21.1369  91.6702

n=40, xmin=21.1369, xmax=153.613, R=132.476
Rys. 1. Histogram próbki. Zaznaczono granice klas (na osi x) i ilość elementów w klasie (na osi y)

 

Statystyki lokacji rozkładu:

średnia arytmetyczna                         =55.2071
średnia geometryczna                        =50.5966
średnia harmoniczna                          =46.5614
mediana                                             me=49.1259
moda                                                  brak
Statystyki rozproszenia:
wariancja                                            s2=615.69
odchylenie standardowe                    s=24.8131
odchylenie przeciętne od               d1=18.2191
odchylenie przeciętne od me              d2=12.5955
Statystyki kształtu:
            moment centralny l=3                                    M3=25213
            moment centralny l=4                                    M4=2.67679×106
                współczynnik asymetrii                     g1=1.65037
            kurtoza                                               K=7.06139
            eksces                                                 g2=4.06139
            współczynnik zmienności                  n=44.94 %                                                    
            współczynnik nierównomierności      H=33.00 %
  
 Rys. 2. Wykres skumulowanego prawdopodobieństwa pi (xi) [wyrażonego w %] tego, że znajdziemy w próbce wartość £xi
             
Kwantyle:
kwantyl rzędu 0.01                21.1369
            kwantyl rzędu 0.05                21.6994
            kwantyl rzędu 0.25                39.4973
            kwantyl rzędu 0.50                48.9213
            kwantyl rzędu 0.75                65.3572
            kwantyl rzędu 0.95                91.6703                     
            kwantyl rzędu 0.99                153.614
Rys. 3. Wykres ramkowy: wartość średnia (kółko z poziomą kreską), wartości ekstremalne (poziome kreski),  kwartyle (pudełko), kwantyle 0.05 i 0.95 (wąsy), kwantyle 0.01 i 0.99 (krzyżyki)
 

Brak komentarzy:

Prześlij komentarz