Skocz do zawartości

  •  
  • Mini kompendium
  • MimeTeX
  • Regulamin

Zdjęcie
        STUDIA        

W jaki sposób obliczyć korelacje małych danych nominalnych?

Statystyka matematyczna

  • Nie możesz napisać tematu
  • Zaloguj się aby odpowiedzieć
10 odpowiedzi w tym temacie

#1 lalka

lalka

    Ułamek

  • Użytkownik
  • 12 postów
0
Neutralny
  • Płeć:Kobieta

Napisano 14.04.2015 - 18:24

Robie badania do pracy mgr. porównywałam ze sobą 2 gr. - ta sama ankieta z tym ze 1 gr chorowała na chorobe X od dawna, inna od niedawna. Kazda z grup liczyła po 60 osob.

Opracowałam wyniki ale dodatkowo muszę wykonac kilka zależności pomiedzy poszczegolnymi pytaniami. Mam program statistika i PQStat do dysozycji.
I tak.
Mam sprawdzić czy istnieje zależność pomiedzy wiekiem a objawami/dolegliwosciami które wystąpiły.
i mam 4 przedziały wiekowe:
- do 25 lat
- 26- 30 lat
-31- 35 lat
- powyzej 36 lat

i mam dolegliwosci:
1) bol głowy
2) ciśnienie
3) obrzęki
4) krwawienie

Obliczyłam wszystko, ile w której grupie było dolegliwosci i niestety ale mam duzo malych liczb, duzo 0.
Wiem ze taka zależnośc obliczana jest testem chi kwadrat ale jak to zrobic, jesli dolegliwosci zglosiła1, 3 lub 0 osób? w tabelce mam duzo 0- powiedzmy ze polowe a reszta to jakies małe liczby a ja muszę dokonac korelacji. Czy mogłabym prosić o odpowiedz, w jaki sposob moge to w Statistice obliczyc?

Z matematyki jestem niezbyt dobra, wrecz nie mam o tym pojecia ale za to duze chęci.

  • 0

Afroman

    Kombinator

  • Użytkownik
3
  • Płeć:Kobieta

Napisano 25.09.2011 - 17:55

#2 Jarekzulus

Jarekzulus

    Wielki Analityk

  • +Mods
  • Redaktor
  • 4210 postów
3410
Profesor
  • Płeć:Mężczyzna

Napisano 14.04.2015 - 21:58

Może to Ci pomoże:

http://matma4u.pl/to...ci-chi-kwadrat/

 

http://matma4u.pl/to...8-dane-z-próby/

 

http://matma4u.pl/to...est-istotności/

 

http://matma4u.pl/to...lacja-pearsona/

 

Co to tych zer: Musisz połączyć objawy np ból głowy z ciśnieniem, albo inne kombinacje lub muszisz przebadać więcej osób. Zasadniczo powinno być min 5 obserwacji.

 

Tu masz trochę informacji o tym jak wykorzystać Statistice

http://www.statsoft....zna_wycisac.pdf  (4 pierwsze strony Ci się przydadzą)

http://www.statsoft....ok/stbasic.html  (druga kropka)

 

Mogę Ci też polecić jedną książkę - Andrzej Stanisz "Przystępny kurs statystyki z zastosowaniem Statisica PL" na przykładach medycznych. StatSoft 2006

przydatne dla Ciebie informacje znajdziesz na stronach 289-318 oraz 403-406 Przyda się do Biblografii a także znajdziesz tam info co zrobić z małymi próbami.

 

Opisz dokładniej co chcesz policzyć wraz z danymi - to postaramy się pomoc w konkretnych przykładach.


  • 0

:wave: :wave: :wave: Jeśli rzuciłem choć promyczek światła na problem który postawiłeś - podziękuj. pre_1433974176__syg.jpgNad kreską


#3 lalka

lalka

    Ułamek

  • Użytkownik
  • 12 postów
0
Neutralny
  • Płeć:Kobieta

Napisano 15.04.2015 - 16:43

Dziękuje za kazdą wskazówkę.

Wg promotora mam zestawić  np pyt. 12 z 9 (sprawdzic zależność).  I na tym kończy się polecenie mojego głownego zadania.

A na moj rozum- ma sprawdzić czy dolegliwości które zgłosili badani (nieliczni), miały zwiazek z wiekiem ciązy..

 

Zliczyłam wszystko co i jak, i dla jednej 60- osobowej grupy (a w sumie są 2)  mam takie dane:

 

 

 

             omdlenia   nadcisnienie   skurcze     zak rodnych    zak mocz     krwawienie

22-31           1             0                   1                0                  0                     0  

32- 37          0             2                   1                0                  2                     1                     

38- 42          0             1                   0                 2                 3                     4  

pow. 42        0             0                    0                0                 0                      0                  

 

 

Gdyby polaczyć ze sobą 1 i 2gą 60- osobową grupe liczy by wzrosly ale nieznacznie, nadal byloy tam sporo 0 i licz mniejszych niz 5


Użytkownik lalka edytował ten post 15.04.2015 - 16:45

  • 0

#4 Jarekzulus

Jarekzulus

    Wielki Analityk

  • +Mods
  • Redaktor
  • 4210 postów
3410
Profesor
  • Płeć:Mężczyzna

Napisano 15.04.2015 - 18:16

Ok rozumiem

 

Widzę dwa rozwiązania i jeśli uda się je (lub jedno) wdrożyć to można robić test (z tym już problemu nie będzie) ale bytest był miarodajny musi być więcej danych (liczbowo) więc

 

- czy można połączyć dolegliwości np. zak d rod i zak mocz w jedną kategorię ew co możesz połączyć.

- czy jest szansa na więcej danych - przepytać jeszcze ze 100 kobiet

 

Zera mogą się pojawić ale trzeba zminimalizować ich ilość. Bo dla tych danych teraz (test nie będzie miarodajny). Wychodzi, że wiek nie jest skorelowany z dolegliwościami (a przynajmniej słabo) tyle, że wartość testu jest raczej znikoma.


  • 1

:wave: :wave: :wave: Jeśli rzuciłem choć promyczek światła na problem który postawiłeś - podziękuj. pre_1433974176__syg.jpgNad kreską


#5 lalka

lalka

    Ułamek

  • Użytkownik
  • 12 postów
0
Neutralny
  • Płeć:Kobieta

Napisano 15.04.2015 - 18:40

Bardzo Ci dziekuje za wpisy.

 

Nietstey nie mozna zwiekszyc liczby badanych.

 

Nizej połączyłam 2 grupy i zakażenia uznałam i połączyłam oba zakazenia. I dane prezentuja sie w następujący sposób:

 

                   omdlenia     nadcisn     skurcze      zakażenia x i y       krwawienie

22-31                  0               0              0                    1                             0

32-37                  1                1             2                    1                             1

38-42                   2               4             3                     5                             3

pow 42                 0              0              0                     0                               0

 

Takze szału nie ma.   w ostatniej grupie ,,wiekowej'- 42 nie było rzadnej osoby wiec domyslalm sie ze mozna to wyrzucic. ale moze moje domysly są błądne.

 

 

Konsultowałam sie z 1 osobą i ona proponowała cos w stylu:

 

Kazdą dolegliwosc przedstawić OSOBNo i podzielić na : miała- 1 lub nie miała-brak- 0.    I potem kazdą grupe wiekową porównywać z kazdą (testem chi kwadrat nw lub fishera). oczywiscie wszystko pozliczałam jeszcze raz, ale o NW nic na necie nie moge znaleśc uz nie mówiac o zaawansowanych obliczeniach a poza tym nie wiem czy to by wogole miało sens tak rozdzielac wszystko na czesci pierwsze.

Przykładowo co ta osoba mi proonowała;

 

OMDLENIA:

 

                               22-31           32-37         38-42      pow. 42

Obecne- 1                 2                  60               3               0

Nieobecne-0              58                 0                 57            60

 

Cos takiego, i tak po kolei z kazda rzeczą. Wiec nie wiem co o tym myslec, w kazdym razie Prosze o Twoje/wasze wskazówki


Użytkownik lalka edytował ten post 15.04.2015 - 18:48

  • 0

#6 Jarekzulus

Jarekzulus

    Wielki Analityk

  • +Mods
  • Redaktor
  • 4210 postów
3410
Profesor
  • Płeć:Mężczyzna

Napisano 15.04.2015 - 19:37

W ten sposób możesz zbadać, czy dana doleglowość jest skorelowana z wiekiem (mowa o tym jak rozdzielisz) Testujesz testem \chi^2

Grupy wiekowe bym połączył (Coś chyba nie gra w omdleniach - 60 masz w tabelce a chyba nie było tyle - A sory napisałaś przykładowe :) przeoczyłem słowo

 

Co do tej grupu +42 to dołącz ją do grupy 38-42 otrzymasz +38 ( odpowiedz na pytanie co z zerami).

 

Poźniej lub jutro postaram się coś zrobić (przetestować) tylko napisz mi czy to już są dane prawdziwe - czy na nich mam pracować i co mogę połączyć jeśli jeszcze zajdzie potrzeba.

 

A może inny podział wieku (3 kategorie (22-28), (29-36), (37+) - jest to do zrobienia (to tylko propozycja - możesz inaczej podzielić).

 

 

 


  • 1

:wave: :wave: :wave: Jeśli rzuciłem choć promyczek światła na problem który postawiłeś - podziękuj. pre_1433974176__syg.jpgNad kreską


#7 lalka

lalka

    Ułamek

  • Użytkownik
  • 12 postów
0
Neutralny
  • Płeć:Kobieta

Napisano 15.04.2015 - 20:15

A więc tak.

 

Prawidziwe dane wygladają następująco:

 

 

 

                      dolegliwosci     

 

tygodnie ciązy:     Omdlenia      Nadciśnienie    Skurcze       Zakażenia       Krwawienie  

22-31                          0                  0                     0                    1                       0  

32-37                          1                   1                     2                    1                      1  

Powyżej 38 tc.             2                   4                     1                    5                       3              

 

CO było mozliwe to połączyłam, w sumie badanych było 120 osób (2 gr po 60)

 

 

 

 

to jedna z 10 zależności, które muszę wyliczyć.


Użytkownik lalka edytował ten post 15.04.2015 - 20:23

  • 0

#8 Jarekzulus

Jarekzulus

    Wielki Analityk

  • +Mods
  • Redaktor
  • 4210 postów
3410
Profesor
  • Płeć:Mężczyzna

Napisano 24.04.2015 - 17:08

Ok wnioski

 

Musisz utworzyć dodatkową zmienną (Jakakolwiek dolegliwość) która przyjmuje wartość 0 gdy kobieta nie wskazała żadnej dolegliwości a 1 w przeciwnym przypadku.

Następnie tworzysz Tabele liczności

 

<br>\\ \begin{array} {|l.c.c|}\hline<br>\\ & Brak dolegliwo & Wyst jakakolwiek dol \\ \hline<br>\\22-37 & A & B \\ \hline<br>\\ 38+ & C& D \\ \hline\end{array}<br>\\

 

I liczysz test \chi^2 na zależność cech. Przykład Ci dałem w poście. NIe mogę zrobić tego na danych gdyż nie wiem ile jest kobiet w każdej grupie wiekowej i czy ile jest przypadków, że jedna kobieta zgłaszała więcej niż jedną dolegliwość.

 

Taki układ umożliwi miarodajne wnioskowanie za pomocą tego testu.


  • 0

:wave: :wave: :wave: Jeśli rzuciłem choć promyczek światła na problem który postawiłeś - podziękuj. pre_1433974176__syg.jpgNad kreską


#9 lalka

lalka

    Ułamek

  • Użytkownik
  • 12 postów
0
Neutralny
  • Płeć:Kobieta

Napisano 24.04.2015 - 19:35

Dziękuje za odpowiedz.

 

Czyli tak, zebym dobrze zrozumiala.

Zamiast tych kilku zmiennych (goraczka omdlenia itd)   mam stworzyc 1(kolumne) z sumami ilosci dolegliwosci dla całego danego przedziału wiekowego (i dla wieku- tez max 2 przedziały)  i je wpisac w B I D,  natomiast w ,,brak dolegliwosci"  zliczyć osoby, ktore nie podaly żadnej dolegliwosci z podzialem na grupy wiekowe?

 

Bo troche nie rozumiem

 

Bardzo prosze o zademonstrowanie na danych (abcd)

 

załózmy ze w sumie badanych bylo 60,       35 do 37 roku zycia, 25 powyżej 37.

 

Tylko 5 osob (na 60)   podało jednoczesnie 2 dolegliwosci...

 

 

 

I jeszcze na koniec, gdy bede miala tabele juz to moge normalnie chi kwadrat  2x2 juz liczyc?


Użytkownik lalka edytował ten post 24.04.2015 - 19:36

  • 0

#10 Jarekzulus

Jarekzulus

    Wielki Analityk

  • +Mods
  • Redaktor
  • 4210 postów
3410
Profesor
  • Płeć:Mężczyzna

Napisano 24.04.2015 - 21:44

No tak jak piszesz w A wpisujesz ile kobiet w wieku 22-36 nie miało żadnej dolegliwość

 

W B Ile osób miało jakąś dolegliwość

 

W C i D to samo tylko inna grupa wiekowa

 

i robisz test.

 

Analiza tyle trwała ponieważ żaden test nie był bardzo silny. Rozważałem współczynnik Spearmana, liczyłem też współczynniki frakcji (i do tego test) ale dane nie pozwoliły mi za wiele bo były tylko podzielona na dolegliwości a trzeba jeszcze na osoby (jedna osoba mogła mieć kilka dolegliwości).

 

Jeszcze innym pomysłem jest sprawdzenie czy choroba o której pisałaś (W PIERWSZYM POŚCIE) miała wpływ na ilość dolegliwości - można zrobić test dla dwóch średnich. liczysz średnią oddzielnie w obu grupach i robisz test

 

Tu przykład

http://matma4u.pl/to...2-dwie-srednie/

http://matma4u.pl/to...owanie-hipotez/


  • 1

:wave: :wave: :wave: Jeśli rzuciłem choć promyczek światła na problem który postawiłeś - podziękuj. pre_1433974176__syg.jpgNad kreską


#11 lalka

lalka

    Ułamek

  • Użytkownik
  • 12 postów
0
Neutralny
  • Płeć:Kobieta

Napisano 25.04.2015 - 06:24

ok, juz cos tam wiem. bardzo dziekuje

 

Ale jeszcze mam male pytania;)

 

 

powiedzmy ze z obliczen chi kwadrat koryg. yatessa wyjdzie p= 0,12   lub np 0,72

 

Jak wtedy interpretowac wynik?

Na tyle co zdazylam sie juz poduczyc czytajac fora i artykuly to wyglada na to,ze nie ma zaleznosci.  z tym ze rykonałam juz 5 róznych testów i we wszystkich wynik p mam>  niz 0,05...

Czyli wszedzie nie ma zaleznosci?

 

i jeszcze 1, na przykladzie Panskiej tabelki z wczoraj. Przy wyniku np 0.31  wynik interpretuje nastepujaco :  z wyliczen chi kwadrat skorrygowany poprawką yatesa nie ma zależności (związku) pomiędzy wiekiem badanych  a występowaniem dolegliwoci...

 

 

 

Czy to jest poprawny wniosek?


  • 0