Skocz do zawartości

  •  
  • Mini kompendium
  • MimeTeX
  • Regulamin

Zdjęcie

Test rozkładu dwumianowego


  • Nie możesz napisać tematu
  • Zaloguj się aby odpowiedzieć
8 odpowiedzi w tym temacie

#1 chuck

chuck

    Ułamek

  • Użytkownik
  • 12 postów
1
Neutralny
  • Płeć:Mężczyzna

Napisano 24.01.2011 - 13:14

Korzystając z generatora rozkładu dwumianowego, w którym prawdopodobieństwo sukcesu w pojedynczej probie wynosi p=0,5 wylosowano 100 elementową próbę. Wyniki przedstawiono w tabeli:
(Liczba sukcesów; Liczba Obserwacji) = (0; 3), (1;16), (2;36), (3;32), (4;11), (5;2)
Na poziomie istotności alfa = 0,05 zweryfikować hipotezę, że rozkładem generowanym przez komputer jest istotnie rozkład dwumianowy.

Jak się za to w ogóle zabrać? :/ Mógłby ktoś wytłumaczyć krok po kroku?
To będzie liczone z testu Pearsona?
  • 0

Afroman

    Kombinator

  • Użytkownik
3
  • Płeć:Kobieta

Napisano 25.09.2011 - 17:55

#2 janusz

janusz

    Wielki Analityk

  • +Mods
  • 3130 postów
1450
Starszy Wykładowca I
  • Płeć:Mężczyzna

Napisano 24.01.2011 - 17:32

Korzystając z generatora rozkładu dwumianowego, w którym prawdopodobieństwo sukcesu w pojedynczej probie wynosi p=0,5 wylosowano 100 elementową próbę. Wyniki przedstawiono w tabeli:
(Liczba sukcesów; Liczba Obserwacji) = (0; 3), (1;16), (2;36), (3;32), (4;11), (5;2)
Na poziomie istotności alfa = 0,05 zweryfikować hipotezę, że rozkładem generowanym przez komputer jest istotnie rozkład dwumianowy.

Jak się za to w ogóle zabrać? :/ Mógłby ktoś wytłumaczyć krok po kroku?
To będzie liczone z testu Pearsona?

Tak to będzie liczone z testu zgodności  \chi^2 - Charlesa Pearsona.
Dane:  n = 100, \  p = 0.5, \  \alpha = 0.05
Musimy obliczyć wartość statystyki  \chi^2.
 \chi^2 = \sum_{i=1}^{r} \frac{(n_{i} - np_{i})^2}{np_{i}},
która przy prawdziwości hipotezy zerowej  H_{0} ma asymptotyczny rozkład  \chi^2 o  (r -k -1) stopniach swobody, gdzie  r jest liczbą klas - wartości zmiennej,  k oznacza liczbę parametrów rozkładu, które zostały oszacowane na podstawie rozkładu empirycznego metodą największej wiarygodności.
W naszym przypadku wartość parametru  p  została określona od razu w hipotezie zerowej, to wartość krytyczną  \chi^2 należy wyznaczyć dla  r - 1 = 6 - 1 = 5 stopni swobody.
Do obliczeń wygodnie posłużyć się tabelą, w której liczności obserwacji zero sukcesów i sześciu sukcesów są mniejsze od pięciu, więc połączymy je z licznością obserwacji pięciu sukcesów:

Tabela:
 \begin{array}{|c.c.c.c.c.c|}\hline <br />x_{i} & n_{i} & np_{i} & (n_{i} - np_{i}) & (n_{i} - np_{i})^2 & \frac{(n_{i} - np_{i})^2}{np_{i}}\\ \hline<br />1  & 16 & 50 & -34 & 1156 & 44.18 \\ \hline <br />2 & 36 & 50 & -14 & 196 & 3.92 \\ \hline<br />3 & 32 & 50 & -18 & 324 & 6.48 \\ \hline <br />4 & 16 & 50 & -34 & 1156 & 44.18 \\ \hline <br />\end{array}

Wartość statystyki  \chi^2 = 44.18 + 3.92 + 6.48 + 44.18 = 98. 76
Z tablic rozkładu  \chi^2
 P\( \chi^2 \geq \chi^2(0.05, 5) \) = 0.05
odczytujemy
 \chi^2( 0.05, 5 ) = 11.070

Statystyka znajduje się w obszarze krytycznym testu, mamy więc podstawy do odrzucenia hipotezy zerowej, że rozkład generowany przez komputer jest istotnie rozkładem dwumianowym.
  • 2

#3 chuck

chuck

    Ułamek

  • Użytkownik
  • 12 postów
1
Neutralny
  • Płeć:Mężczyzna

Napisano 24.01.2011 - 23:53

Wielkie dzięki! Po Twoim wytłumaczeniu wydaje się to teraz banalnie proste.
Mam tylko pytanie czemu połączyłeś 0 sukcesów i 5 sukcesów z 4 sukcesami? Jest jakaś ogólnie przyjęta zasada, że jeśli liczba wystąpień sukcesu jest mniejsza od liczby stopni swobody do dodajemy to do największej liczby sukcesów, czy coś w ten deseń?
  • 0

#4 janusz

janusz

    Wielki Analityk

  • +Mods
  • 3130 postów
1450
Starszy Wykładowca I
  • Płeć:Mężczyzna

Napisano 25.01.2011 - 10:51

Wielkie dzięki! Po Twoim wytłumaczeniu wydaje się to teraz banalnie proste.
Mam tylko pytanie czemu połączyłeś 0 sukcesów i 5 sukcesów z 4 sukcesami? Jest jakaś ogólnie przyjęta zasada, że jeśli liczba wystąpień sukcesu jest mniejsza od liczby stopni swobody do dodajemy to do największej liczby sukcesów, czy coś w ten deseń?


Zasada jest taka, że liczba pojedyńczej obserwacji powinna być większa od pięciu. Jeśli jest mniejsza lub równa pięć, to łączymy ją z najmniejszą grupą obserwacji większą od pięciu. W tym przypadku grupy obserwacji dwa i trzy połączyliśmy z grupą jedenastu obsrwacji. Liczbę stopni swobody liczymy od stanu początkowego.
  • 0

#5 chuck

chuck

    Ułamek

  • Użytkownik
  • 12 postów
1
Neutralny
  • Płeć:Mężczyzna

Napisano 26.01.2011 - 13:16

A czemu pod każde p_i przyjąłeś 0,5? 0,5 to chyba tylko prawdopodobieństwo pojedynczego sukcesu, a każde p_i dotyczy innej liczby sukcesów.
Poza tym suma p_i nie powinna być równa 1?
Pytam się, bo akurat tej części rozwiązania do końca nie rozumiem, a muszę być wszystkiego pewny :P
  • 0

#6 janusz

janusz

    Wielki Analityk

  • +Mods
  • 3130 postów
1450
Starszy Wykładowca I
  • Płeć:Mężczyzna

Napisano 26.01.2011 - 20:02

A czemu pod każde p_i przyjąłeś 0,5? 0,5 to chyba tylko prawdopodobieństwo pojedynczego sukcesu, a każde p_i dotyczy innej liczby sukcesów.
Poza tym suma p_i nie powinna być równa 1?
Pytam się, bo akurat tej części rozwiązania do końca nie rozumiem, a muszę być wszystkiego pewny :P

Suma  n_{i}p wartości średniej - nie musi być równa zero.
Możesz liczyć wartość średnią dla każdej liczby sukcesów  n_{i}p i połączyć w tabeli obserwacje liczby sukcesów cztery i pięć. Wartość empirycznej statystyki Pearsona  \chi^2 = 42. (sprawdź)
Nie zmieni to decyzji o odrzuceniu hipotezy zerowej
  • 0

#7 chuck

chuck

    Ułamek

  • Użytkownik
  • 12 postów
1
Neutralny
  • Płeć:Mężczyzna

Napisano 26.01.2011 - 21:08

Chyba Cię nie rozumiem teraz ;(
Chodzi mi tylko o to, czemu jako prawdopodobieństwo w każdej grupie (1 sukces, 2 sukcesy, 3 sukcesy) bierzemy p=0,5, które jest parametrem rozkładu dwumianowego.
Mi na logikę wydawało się, że pi dla np. jednego sukcesu to powinno być prawdopodobienstwo liczone z funkcji rozkładu dwumianowego dla x=1 ;P
I czemu tak np. nie jest? Bo p podane w zadaniu to prawdopodobieństwo pojedynczego sukcesu, a w kolejnych zdarzeniach mamy różną liczbę sukcesów, a przecież sukces jednokrotny i sukces dwukrotny nie muszą być tak samo prawdopodobne.

Czy może po prostu lepiej się w to nie wgłębiac i przyjąć, że każde pi to zawsze parametr p rozkładu dwumianowego? :P
  • 0

#8 janusz

janusz

    Wielki Analityk

  • +Mods
  • 3130 postów
1450
Starszy Wykładowca I
  • Płeć:Mężczyzna

Napisano 26.01.2011 - 23:27

Chyba Cię nie rozumiem teraz ;(
Chodzi mi tylko o to, czemu jako prawdopodobieństwo w każdej grupie (1 sukces, 2 sukcesy, 3 sukcesy) bierzemy p=0,5, które jest parametrem rozkładu dwumianowego.
Mi na logikę wydawało się, że pi dla np. jednego sukcesu to powinno być prawdopodobienstwo liczone z funkcji rozkładu dwumianowego dla x=1 ;P
I czemu tak np. nie jest? Bo p podane w zadaniu to prawdopodobieństwo pojedynczego sukcesu, a w kolejnych zdarzeniach mamy różną liczbę sukcesów, a przecież sukces jednokrotny i sukces dwukrotny nie muszą być tak samo prawdopodobne.

Czy może po prostu lepiej się w to nie wgłębiac i przyjąć, że każde pi to zawsze parametr p rozkładu dwumianowego? :P

Jak policzysz z funkcji rozkładu dwumianowego  p_{i} skoro nie masz liczby porażek dla obserwacji 0, 1 sukcesu, 2 sukcesów, 3 sukcesów. Masz tylko ogólną liczbę 100 sukcesów. Dlatego przyjmujemy jako  np_{i} = 100\cdot 0.5 = 50
  • 0

#9 xaw

xaw

    Ułamek

  • Użytkownik
  • 6 postów
0
Neutralny
  • Płeć:Mężczyzna

Napisano 16.01.2013 - 16:54

Witam. Przepraszam, że odkopuję temat, ale chodzi mi dokładnie o powyższe zadanie i rozwiązanie do niego, które zostało powyżej zamieszczone. Czy dla powyższego zadania można zastosować także test Kołmogorowa? Wydaje mi się, że nie, ponieważ zakłada on zmienną losową typu ciągłego, a rozkład dwumianowy jest oczywiście dyskretny. Czy mam rację?
  • 0