Lab7.pdf

(472 KB) Pobierz
Laboratorium 7
Wymagania teoretyczne
Teoria testowania hipotez statystycznych
Analiza wariancji (W5 i W6)
Odpowiedź na ostatnie pytanie z poprzedniego laboratorium brzmi:
testy post-hoc.
1. Test Tukeya
Pamiętamy, że pokazuje on które średnie rzeczywiście różnią się od siebie istotnie.
W programie R realizuje go funkcja
TukeyHSD(x = licz)
# nazwa obiektu licz nawiązuje do poprzedniego laboratorium
Po wartościach p (wylistowane w ostatniej kolumnie) poznajemy które różnice między
średnimi są istotne.
Dodatkowo można by policzyć średnie w grupach
1
:
mean(G1)
# zob. czym było G1 na ostatnim laboratorium
2. Analiza wariancji – wersja nieparametryczna
W przypadku gdy któreś z założeń nie jest spełnione możemy wykonać nieparametryczną
analizę wariancji testem Kruskala-Walisa. Instrukcja programu R
kruskal.test(x = ZMIENNA.ZALEŻNA, g = CZYNNIK)
Zatem w naszym przykładzie
kruskal.test(x = dane[,1], g = dane[,2])
lub
Ponownie należy zinterpretować rezultat wg wartości p (p-value). W przypadku odrzucenia
hipotezy zerowej przeprowadzamy test post-hoc, np.:
posthoc.kruskal.nemenyi.test(x = ZMIENNA.ZALEŻNA, g = CZYNNIK)
2
Otrzymamy jako wyjście tabelę z wartościami p, po których poznamy które grupy różnią się
istotnie ze względu na średnią (zob. na poniższym skanie ekranu).
1
2
Traktujemy to jako ćwiczenie domowe.
UWAGA: powyższy test znajduje się w pakiecie o nazwie PMCMR, który należałoby najpierw zainstalować i
załadować do pamięci operacyjnej.
str. 1
Kontynuując nasz przykład stwierdzamy, że grupa LOG nie różni się istotnie średnią z grupą
WF. Natomiast różnice w średnich między grupami INF-LOG oraz INF-WF są istotne.
Zadanie domowe
Pozostałe ćwiczenia z ZESTAWU 3.
Pomocne mogą być:
Rozdział 4 z książki Statystyczna analiza danych z wykorzystaniem programu R (zob.
sylabus)
str. 2
Zgłoś jeśli naruszono regulamin