Test rozkładu dwumianowego
#1
Napisano 24.01.2011 - 13:14
(Liczba sukcesów; Liczba Obserwacji) = (0; 3), (1;16), (2;36), (3;32), (4;11), (5;2)
Na poziomie istotności alfa = 0,05 zweryfikować hipotezę, że rozkładem generowanym przez komputer jest istotnie rozkład dwumianowy.
Jak się za to w ogóle zabrać? :/ Mógłby ktoś wytłumaczyć krok po kroku?
To będzie liczone z testu Pearsona?
Napisano 25.09.2011 - 17:55
#2
Napisano 24.01.2011 - 17:32
Tak to będzie liczone z testu zgodności - Charlesa Pearsona.Korzystając z generatora rozkładu dwumianowego, w którym prawdopodobieństwo sukcesu w pojedynczej probie wynosi p=0,5 wylosowano 100 elementową próbę. Wyniki przedstawiono w tabeli:
(Liczba sukcesów; Liczba Obserwacji) = (0; 3), (1;16), (2;36), (3;32), (4;11), (5;2)
Na poziomie istotności alfa = 0,05 zweryfikować hipotezę, że rozkładem generowanym przez komputer jest istotnie rozkład dwumianowy.
Jak się za to w ogóle zabrać? :/ Mógłby ktoś wytłumaczyć krok po kroku?
To będzie liczone z testu Pearsona?
Dane:
Musimy obliczyć wartość statystyki
która przy prawdziwości hipotezy zerowej ma asymptotyczny rozkład o stopniach swobody, gdzie jest liczbą klas - wartości zmiennej, oznacza liczbę parametrów rozkładu, które zostały oszacowane na podstawie rozkładu empirycznego metodą największej wiarygodności.
W naszym przypadku wartość parametru została określona od razu w hipotezie zerowej, to wartość krytyczną należy wyznaczyć dla stopni swobody.
Do obliczeń wygodnie posłużyć się tabelą, w której liczności obserwacji zero sukcesów i sześciu sukcesów są mniejsze od pięciu, więc połączymy je z licznością obserwacji pięciu sukcesów:
Tabela:
Wartość statystyki
Z tablic rozkładu
odczytujemy
Statystyka znajduje się w obszarze krytycznym testu, mamy więc podstawy do odrzucenia hipotezy zerowej, że rozkład generowany przez komputer jest istotnie rozkładem dwumianowym.
#3
Napisano 24.01.2011 - 23:53
Mam tylko pytanie czemu połączyłeś 0 sukcesów i 5 sukcesów z 4 sukcesami? Jest jakaś ogólnie przyjęta zasada, że jeśli liczba wystąpień sukcesu jest mniejsza od liczby stopni swobody do dodajemy to do największej liczby sukcesów, czy coś w ten deseń?
#4
Napisano 25.01.2011 - 10:51
Wielkie dzięki! Po Twoim wytłumaczeniu wydaje się to teraz banalnie proste.
Mam tylko pytanie czemu połączyłeś 0 sukcesów i 5 sukcesów z 4 sukcesami? Jest jakaś ogólnie przyjęta zasada, że jeśli liczba wystąpień sukcesu jest mniejsza od liczby stopni swobody do dodajemy to do największej liczby sukcesów, czy coś w ten deseń?
Zasada jest taka, że liczba pojedyńczej obserwacji powinna być większa od pięciu. Jeśli jest mniejsza lub równa pięć, to łączymy ją z najmniejszą grupą obserwacji większą od pięciu. W tym przypadku grupy obserwacji dwa i trzy połączyliśmy z grupą jedenastu obsrwacji. Liczbę stopni swobody liczymy od stanu początkowego.
#5
Napisano 26.01.2011 - 13:16
Poza tym suma nie powinna być równa 1?
Pytam się, bo akurat tej części rozwiązania do końca nie rozumiem, a muszę być wszystkiego pewny
#6
Napisano 26.01.2011 - 20:02
Suma wartości średniej - nie musi być równa zero.A czemu pod każde przyjąłeś 0,5? 0,5 to chyba tylko prawdopodobieństwo pojedynczego sukcesu, a każde dotyczy innej liczby sukcesów.
Poza tym suma nie powinna być równa 1?
Pytam się, bo akurat tej części rozwiązania do końca nie rozumiem, a muszę być wszystkiego pewny
Możesz liczyć wartość średnią dla każdej liczby sukcesów i połączyć w tabeli obserwacje liczby sukcesów cztery i pięć. Wartość empirycznej statystyki Pearsona (sprawdź)
Nie zmieni to decyzji o odrzuceniu hipotezy zerowej
#7
Napisano 26.01.2011 - 21:08
Chodzi mi tylko o to, czemu jako prawdopodobieństwo w każdej grupie (1 sukces, 2 sukcesy, 3 sukcesy) bierzemy p=0,5, które jest parametrem rozkładu dwumianowego.
Mi na logikę wydawało się, że pi dla np. jednego sukcesu to powinno być prawdopodobienstwo liczone z funkcji rozkładu dwumianowego dla x=1 ;P
I czemu tak np. nie jest? Bo p podane w zadaniu to prawdopodobieństwo pojedynczego sukcesu, a w kolejnych zdarzeniach mamy różną liczbę sukcesów, a przecież sukces jednokrotny i sukces dwukrotny nie muszą być tak samo prawdopodobne.
Czy może po prostu lepiej się w to nie wgłębiac i przyjąć, że każde pi to zawsze parametr p rozkładu dwumianowego?
#8
Napisano 26.01.2011 - 23:27
Jak policzysz z funkcji rozkładu dwumianowego skoro nie masz liczby porażek dla obserwacji 0, 1 sukcesu, 2 sukcesów, 3 sukcesów. Masz tylko ogólną liczbę 100 sukcesów. Dlatego przyjmujemy jakoChyba Cię nie rozumiem teraz ;(
Chodzi mi tylko o to, czemu jako prawdopodobieństwo w każdej grupie (1 sukces, 2 sukcesy, 3 sukcesy) bierzemy p=0,5, które jest parametrem rozkładu dwumianowego.
Mi na logikę wydawało się, że pi dla np. jednego sukcesu to powinno być prawdopodobienstwo liczone z funkcji rozkładu dwumianowego dla x=1 ;P
I czemu tak np. nie jest? Bo p podane w zadaniu to prawdopodobieństwo pojedynczego sukcesu, a w kolejnych zdarzeniach mamy różną liczbę sukcesów, a przecież sukces jednokrotny i sukces dwukrotny nie muszą być tak samo prawdopodobne.
Czy może po prostu lepiej się w to nie wgłębiac i przyjąć, że każde pi to zawsze parametr p rozkładu dwumianowego?
#9
Napisano 16.01.2013 - 16:54