Weryfikacja hipotez statystycznych
Hipoteza badawcza - najbardziej prawdopodobne (na gruncie wiedzy badającego) rozwiązanie postawionego problemu badawczego.
Hipoteza statystyczna - sformułowanie przypuszczenia dotyczącego rozkładu populacji
Hipoteza zerowa - hipoteza poddawana weryfikacji. Hipoteza zerowa zakłada, że różnica między parametrami lub rozkładami wynosi 0.
Hipoteza alternatywna - hipoteza, którą skłonni jesteśmy przyjąć, gdy odrzucamy hipotezę zerową.
Test statystyczny
Prawdziwość hipotezy będziemy weryfikować na podstawie wyników próby losowej.
Jako hipotezę zerową przyjmujemy tę której prawdziwość poddajemy w wątpliwość i którą chętniej jesteśmy skłonni odrzucić, jeśli tylko znajdziemy mocne uzasadnienie.
Ważniejsza jest dla nas hipoteza alternatywna, ponieważ celem większości analiz i badań jest odrzucenie hipotezy zerowej na korzyść przyjęcia alternatywnej.
Na tym etapie procedury weryfikacyjnej przyjmujemy maksymalne dopuszczalne prawdopodobieństwo odrzucenia hipotezy zerowej wtedy, gdy jest ona prawdziwa (tzw. błąd I rodzaju).
Prawdopodobieństwo to jest oznaczane symbolem \(\alpha\) i nazywane poziomem istotności.
Na ogół przyjmujemy prawdopodobieństwo bliskie zeru, ponieważ chcemy, aby ryzyko popełnienia błędu było jak najmniejsze.
Najczęściej zakładamy poziom istotności \(\alpha=0.05\), czasem przyjmujemy także \(\alpha=0.01\) lub \(\alpha=0.1\)
Poziom istotności a p-value
p-value (poziom prawdopodobieństwa p) - jest to wyliczany w pakietach komputerowych najmniejszy poziom istotności, przy której wyliczona wartość testującej statystyki doprowadza do odrzucenia hipotezy zerowej.
poziom istotności - liczba, ustalona z góry przed przeprowadzeniem testu; najczęściej przyjmowane wartości: 0.05, 0.01, 0.001.
Wynik statystycznie istotny oznacza, że różnica uzyskana w eksperymencie jest większa od tej, która może wynikać jedynie z przypadku
Co oznacza poziom istotności 0,01, a co poziom istotności 0,001?
Obszar krytyczny a hipoteza alternatywna
Hipoteza alternatywna | Obszar krytyczny | Interpretacja |
---|---|---|
\(\mu \neq A\) | dwustronny | obszar krytyczny obejmuje wartości testu “dużo” większe i “dużo” mniejsze od A. |
\(\mu < A\) | lewostronny | obszar krytyczny obejmuje wartości testu “dużo” mniejsze od A. |
\(\mu > A\) | prawostronny | obszar krytyczny obejmuje wartości testu “dużo” większe od A. |
Wyznaczoną na podstawie próby wartość statystyki (P-wartość) porównujemy z wartością krytyczną testu.
Jeśli obliczona na podstawie próby wartość statystyki należy do obszaru krytycznego, to hipotezę zerową należy odrzucić jako nieprawdziwą. Stąd wniosek, że prawdziwa jest hipoteza alternatywna.
Jeśli obliczona na podstawie próby wartość statystyki nie należy do obszaru krytycznego, to stwierdzamy, że nie mamy podstaw do odrzucenia hipotezy zerowej. Nie odrzucenie hipotezy zerowej nie dowodzi jej prawdziwości. Stąd wniosek, że hipoteza zerowa może, ale nie musi, być prawdziwa, a postępowanie nie dało żadnych dodatkowych informacji uprawniających do podjęcia decyzji o przyjęciu lub odrzuceniu hipotezy zerowej.
Dane zawierają pomiary temperatur dla wybranego obszaru. Naszym zadaniem jest sprawdzenie, czy średnia temperatura będzie równa 8C, przy założeniu poziomu istotności 0,01. Sformułuj hipotezę zerową oraz hipotezy alternatywne (dwustronne, lewostronną i prawostronną). Co oznacza, poziom istotności 0,01?
<- read.csv("dane/Storkowo_2007_2009.csv") storkowo2007_2009
t.test(storkowo2007_2009$TwP, mu = 9, alternative = "two.sided", conf.level = 0.95)
##
## One Sample t-test
##
## data: storkowo2007_2009$TwP
## t = -5.7511, df = 1095, p-value = 1.149e-08
## alternative hypothesis: true mean is not equal to 9
## 95 percent confidence interval:
## 7.961849 8.490030
## sample estimates:
## mean of x
## 8.22594
P-wartość: 1.149e-08 (czyli 0.00000001149). Odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej.
Przy założeniu przedziału ufności na poziomie 0,95 sprawdź jakie jest prawdopodobieństwo, że średnia jest równa 8,2. Co oznacza wynik testu? Czy na podstawie wyników testu możemy odrzucić hipotezę zerową?
t.test(storkowo2007_2009$TwP, mu = 9, alternative = "less", conf.level = 0.95)
##
## One Sample t-test
##
## data: storkowo2007_2009$TwP
## t = -5.7511, df = 1095, p-value = 5.747e-09
## alternative hypothesis: true mean is less than 9
## 95 percent confidence interval:
## -Inf 8.447514
## sample estimates:
## mean of x
## 8.22594
Przy założeniu przedziału ufności na poziomie 0,99 sprawdź jakie jest prawdopodobieństwo, że średnia jest mniejsza od 8. Co oznacza wynik testu?
t.test(storkowo2007_2009$TwP, mu = 9, alternative = "greater", conf.level = 0.95)
##
## One Sample t-test
##
## data: storkowo2007_2009$TwP
## t = -5.7511, df = 1095, p-value = 1
## alternative hypothesis: true mean is greater than 9
## 95 percent confidence interval:
## 8.004365 Inf
## sample estimates:
## mean of x
## 8.22594
Przy założeniu przedziału ufności na poziomie 0,99 sprawdź jakie jest prawdopodobieństwo, że średnia jest większa od 8. Co oznacza wynik testu?