Univerzita sv. Cyrila a Metoda v Trnave

Námestie J. Herdu 577/2

917 01 Trnava

+421 33 5565 221

Sekretariát

ŠTATISTIKA PRAKTICKY (NIELEN) V ZÁVEREČNÝCH PRÁCACH

7. ŠTATISTICKÁ DESKRIPCIA

Základom štatistického vyhodnotenia vo výskume je dôsledná deskripcia, teda popis premenných, ktoré určitým spôsobom vstupujú do testovania, alebo sú dôležité pre popis výskumného súboru. Deskripcia premenných má význam pre posúdenie relevancie výsledkov, ktoré z nich boli vypočítané

Napríklad, keď zisťujeme koreláciu medzi inteligenciou a prosociálnym správaním, tak je pre vecnú interpretáciu nevyhnutné vedieť, ako boli v súbore zastúpené jednotlivé inteligenčné pásma, aký bol rozsah hodnôt, či išlo o súbor v rámci normy alebo skôr s nadpriemerným intelektom a podobne.

Premenné popisujeme prostredníctvom deskriptívnych charakteristík (ukazovateľov, parametrov), ktoré sú prakticky výsledkom rôzne náročných matematických operácií. Výsledky deskripcie zobrazujeme v deskriptívnych tabuľkách (frekvenčné, deskriptívne tabuľky) a v grafoch. Deskriptívne hodnoty v tabuľkách a grafoch zaokrúhľujeme podľa ich rozsahu, najčastejšie na 1 alebo 2 desatinné miesta. 9

7.1 Deskripcia kategorickej premennej – nominálnej, ordinálnej

Základnou popisnou charakteristikou je POČETNOSŤ. Početnosť (angl. Frequency) môže byť aplikovaná na všetky tri typy premenných (nominálne, ordinálne, kardinálne). Ide o postup, kedy každej hodnote či kategórii premennej priraďujeme údaj, koľkokrát sa táto hodnota vyskytuje v súbore. Všetky hodnoty s príslušnými početnosťami sú zobrazené v tzv. FREKVENČNEJ tabuľke (Tabuľka 2).

A. UNIVARIAČNÁ FREKVENČNÁ ANALÝZA

Univariačná analýza znamená, že jav, premennú charakterizujeme v jednom súbore (a nie v podskupinách).

Postup v SPSS:

  • ANALYZE/ DESCRIPTIVE STATISTICS/ FREQENCIES, kde iba vložíme z ľavého panelu do okna VARIABLE(S) premenné, ktoré je treba frekvenčne vyhodnotiť.

Tabuľka s výsledkom frekvenčnej analýzy obsahuje 5 stĺpcov. V prvom sú názvy alebo kódy pre kategórie premennej, nasleduje stĺpec s pozorovanými (reálnymi) početnosťami (koľko prípadov spadá pod kategóriu), nasledujú relatívne početnosti (%), validné percentá a kumulatívne percentá. Kumulatívne percentá sú relevantné iba pri kardinálnych premenných, pokiaľ analyzujeme distribúciu premennej (napr. v psychometrických štúdiách). Validné percentá sú dôležité vtedy, ak máme v databáze pri danej premennej chýbajúce údaje (MISSING DATA), ako to je v príklade v tabuľke (Tabuľka 2). Môžeme vidieť, že validné % sú počítané zo 100% iba platných (VALID) prípadov, teda bez zahrnutia chýbajúcich údajov; obyčajné % zahŕňajú do celku (100%) aj chýbajúce údaje.
Frekvenčná analýza je vhodná na popis nominálnej premennej (typ školy, pohlavie, typ rodiny atď.) a v zásade je to jediný spôsob deskripcie pri tomto type premennej. Rovnako ju môžeme použiť pri ordinálnej premennej (ako je to v príklade v Tabuľke 2), avšak tento typ vieme popisovať aj ďalšími parametrami , ako sú miery stredu či variability.

Interpretácia tabuľky:
Výsledky frekvenčnej analýzy premennej odpovedí na otázku „Koľko máte dobrých priateľov?“ uvádzame v tabuľke (Tabuľka 2). V celom súbore na otázku neodpovedal 1 respondent (0,2%), z ostatných (validných) odpovedí bola najviac zastúpená kategória „Troch a viac“ (38,5%), nasledovala kategória „Päť a viac“ (30,4%), takmer 1/5 respondentov (19,1%) uviedla, že má dvoch dobrých priateľov, jedného priateľa 8,4% a najmenej – 3,6% respondentov odpovedalo, že nemá žiadnych dobrých priateľov.

Tabuľka 2 Frekvenčná tabuľka pre kategórie odpovedí na otázku: Koľko máte dobrých priateľov?


Koľko máte dobrých priateľov? Početnosť%Validné %
Žiadnych223,63,6
Jedného528,48,4
Dvoch11819,119,1
Troch či štyroch23838,438,5
Päť a viac18830,430,4
Chýba10,2 
Spolu619100 

Pri univariačnom zobrazení najmä nominálnej (prípadne aj ordinálnej) premennej volíme koláčový graf (Graf 1)10

Graf 1 Početnosti zastúpenia kategórií odpovedí na otázku: Koľko máte blízkych priateľov?

B. BIVARIAČNÁ FREKVENČNÁ ANALÝZA

O bivariačnej deskripcii hovoríme vtedy, pokiaľ premennú popisujeme vo viacerých skupinách (nie teda len v celom súbore), štandardne by sme mali bivariačne popisovať premenné najmä vtedy, pokiaľ ide o komparačnú (diferenciačnú) štúdiu, teda takú, ktorej výskumný problém sa týka porovnania skupín (napr. vekový, gendrový aspekt a pod.). V iných typoch výskumov sa niekedy používa na zobrazenie charakteristík výskumného súboru v podskupinách mužov a žien, ale samozrejme aj v iných prípadoch, kedy je to vhodné a relevantné pre výskum. Pokiaľ robíme bivariačnú deskripciu v SPSS, musíme najskôr rozdeliť súbor príkazom SPLIT FILE (postup v kapitole 5.3), zaškrtneme COMPARE GROUPS a do okienka presunieme rozdeľovaciu premennú (teda tú, ktorá nám súbor delí na skupiny, v tomto prípade Veková skupina). Po aplikácii (zapnutí) funkcie SPLIT FILE budú všetky ďalšie výsledky zadané v SPSS (testy, deskripcia, grafy a pod.) vypracované samostatne pre skupiny určené zvolenou premennou (Pohlavie – Muži/ Ženy; Veková skupina – Do 15 rokov/ 16 a viac rokov…), to znamená, že tabuľky v OUTPUTe budú mať viac častí pod sebou, v každej časti je výsledok pre jednu skupinu11, ako môžeme vidieť v zdvojenej frekvenčnej tabuľke (Tabuľka 3, je už upravená, neobsahuje Valid a Cummulative %).

Interpretácia bivariačnej frekvenčnej tabuľky a grafu:
Deskripciu kategorickej premennej Prospech uvádzame v tabuľke (Tabuľka 3), kde môžeme vidieť absolútne a relatívne početnosti zastúpenia kategórii v dvoch porovnávaných skupinách. V oboch skupinách je najpočetnejšou kategóriou Nadpriemerný prospech, ktorý vykazuje v skupine Do 15 rokov 66,8% a v skupine 16 a viac rokov 55,1% respondentov, nasleduje kategória Priemerný prospech, ktorý je zastúpený v staršej vekovej skupine v 43,8% a v mladšej vekovej skupine v 32,4%. Najmenej početnou kategóriou je Podpriemerný prospech, ktorý sa vyskytol v oboch skupinách výnimočne, a to u dvoch respondentov zo skupiny Do 15 rokov (0,8%) a u štyroch respondentov zo skupiny 16 a viac rokov (1,1%). Grafické zobrazenie výsledkov frekvenčnej analýzy premennej Prospech je spracované v grafe (Graf 2).

Tabuľka 3 Frekvenčná tabuľka pre kategórie Prospechu v 2 skupinách vzhľadom na vek

Veková skupina Prospech Početnosť %
Do 15 rokov Nadpriem. 165 66,8
Priem. 80 32,4
Podpriem. 2 0,8
Spolu 247 100
16 a viac rokov Nadpriem. 205 55,1
Priem. 163 43,8
Podpriem. 4 1,1
Spolu 372 100

Tabuľka 4 Usporiadanie údajov potrebné pre vytvorenie zloženého stĺpcového grafu v Exceli12

 Do 15 rokov16 a viac rokov
Nadpriem.66,855,1
Priem.32,443,8
Podpriem.0,81,1

Pre bivariačné zobrazenie kategorických premenných (nominálnej či ordinálnej) je vhodný zložený stĺpcový graf (Graf 2).

Graf 2 Zobrazenie relatívnych početností (%) zastúpenia kategórií Prospechu v dvoch vekových skupinách

7.2 Deskripcia kvantitatívnej premennej - kardinálnej, prípadne ordinálne

Kvantitatívnymi premennými nazývame tie, ktoré svojou hodnotou vyjadrujú mieru, množstvo intenzitu javu u jednotlivca, a teda na základe nich vieme určiť, u koho je niečo silnejšie, vyššie, väčšie, intenzívnejšie, viac pôsobí, než u niekoho iného, na základe nich teda vieme respondentov aj usporiadať podľa hodnôt od najväčšej po najmenšiu či naopak. Podľa presnosti možnosti určovania rozdielov medzi jednotlivcami rozlišujeme kvantitatívne premenné na ORDINÁLNE a KARDINÁLNE (viac v kapitole 2.1).

A. UNIVARIAČNÁ DESKRIPTÍVNA ANALÝZA KARDINÁLNEJ PREMENNEJ

Kardinálne, výnimočne aj ordinálne premenné (ak to je relevantné a interpretovateľné), popisujeme prostredníctvom deskriptívnych charakteristík niekoľkých druhov, ide o: miery stredu (aritmetický priemer – AM, medián – Med., Modus – Mod.); miery variability (štandardná odchýlka – ŠO; rozptyl (je druhá mocnina ŠO), rozsah (rozpätie medzi Max a Min), medzikvartilové rozpätie); a miery tvaru (šikmosť, strmosť).
DESKRIPTÍVNU tabuľku (Tabuľka 5), ktorá obsahuje deskriptívne ukazovatele v SPSS zadáme takto:

  • ANALYZE/ DESCRIPTIVE STATISTICS/ FREQUENCIES: tu však okrem presunutia premennej (prípadne viacerých, v tomto prípade Prosociálne správanie) do okna VARIABLE(S) musíme rozkliknúť /STATISTICS, kde označíme všetky charakteristiky, ktoré chceme mať v tabuľke (najmä MEAN, MEDIAN, MODE, QUARTILES, STD.DEVIATION, MINIMUM, MAXIMUM, prípadne SKEWNESS a KURTOSIS, alebo aj iné) po kliknutí na /CONTINUE v okne Frequencies môžeme zrušiť zaškrtnutie DISPLAY FREQUENCY TABLE (frekvenčnú tabuľku nepotrebujeme), /OK.

Interpretácia tabuľky:
V tabuľke (Tabuľka 5) uvádzame deskriptívne charakteristiky premennej Prosociálne správanie. Ako je možné vidieť, validných hodnôt bolo N = 612, chýbalo 7 údajov. Respondenti v celom súbore dosahovali priemerne 35,0 bodov (ŠO = 6,5), medián je 36 a modus 35 bodov. Najnižšia hodnota vyskytujúca sa v súbore bola 11, najvyššia 70 bodov a medzikvartilové rozpätie sa nachádza medzi 32 a 40 bodmi.V tabuľke (Tabuľka 5) uvádzame deskriptívne charakteristiky premennej Prosociálne správanie. Ako je možné vidieť, validných hodnôt bolo N = 612, chýbalo 7 údajov. Respondenti v celom súbore dosahovali priemerne 35,0 bodov (ŠO = 6,5), medián je 36 a modus 35 bodov. Najnižšia hodnota vyskytujúca sa v súbore bola 11, najvyššia 70 bodov a medzikvartilové rozpätie sa nachádza medzi 32 a 40 bodmi.

Tabuľka 5 Deskriptívna tabuľka pre premennú Prosociálne správanie v celom súbore

%Validné %
N612
Chýba7
Priemer35,0
Medián36
Modus35
Štd.odch.6,5
Minimum.11
Maximum44
1. kvartil32
3. kvartil40

Univariačne môže byť kardinálna premenná zobrazená histogramom (Graf 3) alebo boxplotom (Graf 4).

Histogram je možné preložiť krivkou normality (Normal curve) a tým odhadovať normalitu premennej, pokiaľ krivka kopíruje rozloženie stĺpcov, čo v tomto prípade nie je splnené. V grafe tiež vidíme minimálne, maximálne hodnoty, modus (najvyšší stĺpec), priemer (vrchol krivky); zošikmenie a sploštenie grafu (skewness a kurtosis), v tomto prípade ide o pravostranné zošikmenie. V boxplote sa zošikmenie ukáže v umiestnení boxu (v tomto prípade) vyššie od stredu), zobrazené je minimum, maximum, kvartily, hraničné hodnoty (mimo 95% intervalu spoľahlivosti) sú vyznačené krúžkami, extrémy by mali symbol hviezdičky.

Graf 3 Histogram zobrazujúci rozdelenie premennej Prosociálne správanie

Graf 4 Boxplot zobrazujúci deskriptívne parametre premennej Prosociálne správanie

B. BIVARIAČNÁ DESKRIPTÍVNA ANALÝZA KARDINÁLNEJ PREMENNEJ

Bivariačne premennú popisujeme vtedy, pokiaľ je výskum nastavený komparačne,teda výskumným problémom je hľadanie rozdielov medzi skupinami. Podobne ako pri kategorickej premennej, aj tu musíme najskôr súbor rozdeliť na skupiny prostredníctvom príkazu SPLIT FILE (viď kapitola 4.4), kde označíme COMPARE GROUPS a zadáme rozdeľovaciu premennú (tú, ktorá súbor rozdeľuje na skupiny, v tomto prípade Veková skupina). Potom realizujeme vytvorenie deskriptívnej tabuľky (v tomto prípade je premennou Podpora od učiteľa), ktorá už teraz bude mať viac častí – pre každú skupinu samostatne ( Tabuľka 6, je už mierne upravená, vymazané sú nadbytočné stĺpce a riadky).

Tabuľka 6 Deskriptívna tabuľka pre premennú Podpora od učiteľa v dvoch skupinách vzhľadom na vek

Veková skupinaPodpora od učiteľa
Do 15 rokovN244
Chýba3
Priemer20,7
Medián21
Modus20
Štd.odch.3,7
Minimum.11
Maximum32
1. kvartil19
3. kvartil23
16 a viac rokovN371
Chýba1
Priemer20,3
Medián20
Modus19,0a
Štd.odch.3,9
Minimum.8
Maximum31
1. kvartil18
3. kvartil23

Pozn.: a – viacnásobné modusy, najnižší je zobrazený.

Interpretácia deskriptívnej bivariačnej tabuľky:
Výsledky deskriptívnej bivariačnej analýzy premennej Podpora od učiteľa uvádzame v tabuľke (Tabuľka 6). V mladšej skupine (Do 15 rokov) dosahovala hodnota Podpory od učiteľa priemerne 20,7 bodov (ŠO = 3, 7), pri mediáne 21 a moduse 20 bodov. Podobné hodnoty nachádzame aj v staršej vekovej skupine (16 a viac rokov), kde evidujeme priemer 20,3 bodov (ŠO = 3,9), medián o bod nižší, než v mladšej skupine – 20 a viacnásobné modusy, z ktorých najnižší je 19 bodov. Pri deskripcii rozsahu môžeme vidieť nižšie parametre v staršej vekovej skupine, a to minimum 8 bodov, v porovnaní s 11 bodmi u respondentov do 15 rokov a maximum 31, čo je o jeden bod menej než v mladšej vekovej skupine (32). Medzikvartilové rozpätie j e však v skupinách podobné, v skupine do 15 rokov sa nachádza medzi 19 a 23 bodmi a v skupine 16 a viac rokov medzi 18 a 23 bodmi.

Bivariačnú deskriptívnu tabuľku môžeme zobraziť aj úspornejšie, keď výsledky k  skupinám umiestnime do stĺpcov veľa seba (Tabuľka 7).

Tabuľka 7 Alternatívne zobrazenie deskriptívnej tabuľky pre dve skupiny aj celý súbor

Veková skupina
Podpora od učiteľaDo 15 rokov16 a viac rokovCelý súbor
N244371615
Chýba314
Priemer20,6720,3720,50
Medián212020
Modus2019a20
Štd.odchýlka3,683,933,81
Minimum1188
Maximum323132
1. kvartil191818
3. kvartil232323

Pozn.: a – viacnásobné modusy, najnižší je zobrazený.

Bivariačnú deskipciu kardinálnej premennej môžeme vhodne znázorniť grafom boxplotom (Graf 5, avšak nesmieme predtým zabudnúť vypnúť SPLIT FILE) alebo dvoma histogramami (Graf 6), alebo v MS Excel jednoducho kombináciou stĺpcového a čiarového grafu (Graf 7)

Graf 5 Boxplot zobrazujúci deskriptívne parametre premennej Podpora od učiteľa v dvoch vekových skupinách

Graf 6 Histogramy zobrazujúce rozdelenie premennej Podpora od učiteľa v dvoch vekových skupinách

Graf 7 Zobrazenie deskriptívnych charakteristík premennej Podpora od učiteľa vo vekových skupinách

ÚLOHY

  1. Ako nazývame analýzy, ktoré realizujeme v rámci popisu premenných a aký je ich význam?
  2. Čo znamená, ak je analýza bivariačná? Aký príkaz v SPSS je potrebné aplikovať pred samotným zadaním analýzy, aby bola bivariačná?<l/i>
  3. Zopakujte si:
    • Akými charakteristikami popisujeme kategorické (N, prípadne O) premenné, ako sa nazýva príslušný typ tabuľky?
    • Akými grafmi je možné zobraziť kategorickú premennú univariačne, akým grafom bivariačne?
    • Akými charakteristikami môžeme popísať kvantitatívnu ordinálnu a akými kardinálnu premennú, ako nazývame príslušný typ tabuľky ?
    • Aké grafy používame na univariačné a bivariačné zobrazenie kvantitatívnych ordinálnych a aké na zobrazenie kardinálnych premenných?
  4. Uvažujte, kde všade sa v bežnom živote či v médiách stretávame s výsledkami
    deskriptívnych analýz?
    • Skúste sformulovať výskumný problém v oblasti psychológie, pre ktorý riešenie by bola postačujúca deskriptívna analýza.
  5. Precvičte si deskripciu kategorickej (N či O) premennej, s použitím cvičnej alebo vlastnej databázy:
    • Univariačne.
    • Bivariačne.
    • Tabuľku upravte podľa vzoru a interpretujte.
    • Vypracujte príslušné grafy v SPSS alebo v Exceli.
  6. Precvičte si deskripciu kvantitatívnej (K či O) premennej, s použitím cvičnej alebo vlastnej databázy:
    • Univariačne.
    • Bivariačne.
    • Tabuľku upravte podľa vzoru a interpretujte.
    • Vypracujte príslušné grafy v SPSS alebo v Exceli.