Univerzita sv. Cyrila a Metoda v Trnave

Námestie J. Herdu 577/2

917 01 Trnava

+421 33 5565 221

Sekretariát

ŠTATISTIKA PRAKTICKY (NIELEN) V ZÁVEREČNÝCH PRÁCACH

6.PRINCÍPY ŠTATISTICKÉHO TESTOVANIA, VOĽBA TESTOVACIEHO KRITÉRIA

Kým štatistická deskripcia slúži k usporiadaniu a popisu dát, štatistická inferencia, nazývaná i induktívna štatistika, nám už umožňuje sledovať súvislosti medzi javmi – testovať stanovené hypotézy či zodpovedať výskumné otázky prostredníctvom štatistických testov.
Vzhľadom na vedeckú a empirickú povahu skúmania, i tu uplatňujeme presne stanovené kroky a pravidlá (Sollár, Ritomský, 2002):

  • vymedzenie teoretickej hypotézy;
  • operacionalizácia pojmov;
  • vymedzenie empirickej hypotézy;
  • formulácia nulovej hypotézy;
  • stanovenie hladiny významnosti;
  • voľba štatistického testovacieho kritéria a výpočet štatistík;
  • štatistická deskripcia;
  • štatistická inferencia;
  • konzekvencie pre empirickú hypotézu;
  • konzekvencie pre teoretickú hypotézu.
Z uvedených krokov sme sa nevenovali téme stanovenie hladiny významnosti a samotnej voľbe štatistických testov, ktoré si uvedieme v nasledujúcom texte. V rámci témy výberu testov, ktorá tvorí predpoklad správnej analýzy a následnej interpretácie dát, vysvetlíme nosnú tému normality premenných.

6.1 Stanovenie hladiny významnosti

Vzhľadom na nepriamosť merania v psychológii, kedy meriame len hypotetické konštrukty, na ktorých existenciu usudzujeme cez ich manifestné prejavy, sa musíme vysporiadať s chybovosťou merania. V humanitných a sociálnych vedách pracujeme s 5% pravdepodobnosťou (0,05) – mierou rizika, že prijmeme hypotézu, ktorá nie je pravdivá. Túto hodnotu zaviedol do štatistiky v roku 1925 Ronald Fisher a nazýva sa Alfa (Kelley, 2016). Výsledky sú platné vtedy, ak je hodnota p – pravdepodobnosť (štatistická významnosť = Sig.) menšia ako 5%. V tomto prípade označíme výsledky za štatisticky významné. Hodnotu „p“ (Sig.) vypočítajú jednotlivé testy, ktoré realizujeme v štatistickom programe (napr. v SPSS, v Exceli, v PSPP a pod.), a teda sú podstatnou súčasťou štatistickej inferencie. Hodnota štatistickej významnosti je odvodená z výslednej hodnoty príslušného testu (napr. t -testu, F pri ANOVA, r korelačný koeficient a pod., hodnota Chí-kvadrátu), prípadne stupňov voľnosti a počtu prípadov (respondentov, participantov) vzorky, na ktorej dátach bol test aplikovaný.

Podľa hodnoty p (Sig.) rozlišujeme tri stupne štatistickej významnosti:

  • pravdepodobnosť menej ako 5%, že výsledok je chybný: p (Sig.) < 0,05;
  • pravdepodobnosť menej ako 1%, že výsledok je chybný: p (Sig.) < 0,01;
  • pravdepodobnosť menej ako 0,1%, že výsledok je chybný: p (Sig.) < 0,001.

6.2 Pravidlá výberu testov. Voľba štatistického testovacieho kritéria

Nástrojmi štatistickej inferencie sú ŠTATISTICKÉ TESTY. Výber testu resp. vhodnosť konkrétneho štatistického kritéria sa odvíja od niekoľkých kritérií:

  • Typ premennej podľa úrovne merania: kardinálna, ordinálna, nominálna. Ako sme uviedli v predchádzajúcej kapitole, od úrovne merania premennej závisí, aké matematické a štatistické operácie môžeme s danou premennou vykonávať. Kým napr. pri kardinálnej úrovni môžeme pracovať s priemermi, pri nominálnej len s početnosťami. Jednotlivé testy pracujú práve s vybranými matematickými charakteristikami. Delíme ich na parametrické pre kardinálnu úroveň (ak je splnená podmienka normality, viď nižšie) a neparametrické pre ostatné úrovne merania (alebo v prípade nepotvrdenia normality kardinálnej premennej)
  • Teoretická hypotéza: testy delíme podľa toho, či sledujú vzťahy medzi premennými (korelačné testy), alebo rozdiely medzi skupinami (komparačné testy).
  • Normalita rozloženia premennej: dáta KARDINÁLNEJ premennej, s ktorými pracujeme, musia spĺňať podmienku normálneho rozloženia, po jej splnení používame pre kardinálnu) premennú parametrické testy, pri nesplnení podmienky normality testy neparametrické.
    • Kritérium normality sa zhodnocuje aj vzhľadom na veľkosť výskumného súboru, prípadne porovnávaných skupín. Normalitu je potrebné dodržať najmä v malých súboroch (n < 50) a pokiaľ premenná nie je meraná štandardizovaným meracím nástrojom.

6.3 Normalita: normálne rozloženie premennej

Normalita znamená zhodu rozloženia premennej v našej výskumnej vzorke s „normálnou“ – celou, bežnou populáciou. Normalita súvisí s očakávaním, že jednotlivé javy v živote majú tzv. normálne rozloženie podľa Gaussovej krivky – Gaussovho rozdelenia pravdepodobnosti, kde platí tzv. pravidlo 3 sigma (Rimarčík, 2007):

  • V rozpätí jednej štandardnej odchýlky na obe strany od priemeru leží 68% všetkých osôb, u ktorých bol odhad robený.
  • V rozpätí druhých nasledujúcich štandardných odchýlok na obe strany od priemeru sa nachádza ďalších 28% z meraných osôb.
  • V rozpätí tretích odchýlok na obe strany sa nachádzajú ďalšie 4% z meraných osôb.

Typickým príkladom je inteligencia, ale pre zjednodušene si môžeme uviesť výšku. Väčšina osôb je priemerne vysoká, časť nadpriemerne alebo podpriemere, a len malé percento osôb je veľmi nízkych alebo veľmi vysokých .

Normalita súvisí s tzv. centrálnou limitnou vetou, ktorá hovorí, že čím väčší počet náhodných sčítancov, tým vyššia pravdepodobnosť normálneho rozloženia javu. Z toho vyplýva, že čím väčší počet osôb vo výskumnom súbore, tým väčšia pravdepodobnosť splnenia podmienky normálneho rozloženia premennej v rámci výskumu.
Téma normality preto súvisí s témou výberu a reprezentatívnosti výskumnej vzorky, s ktorou pracujeme. Nie je prakticky možné v rámci výskumov skúmať celé populácie (základný súbor) a vždy z nich vyberáme podľa určitých vopred stanovených kritérií iba časť (výskumný, výberový súbor), pričom najvhodnejší je pravdepodobnostný spôsob výberu.
Vzhľadom na uvedené je potrebné vždy pred výberom testov, ktoré budeme v analýze používať, overiť normalitu (kardinálnych) premenných. Jednotlivé testy totiž pracujú s rozličnými matematickými operáciami. PARAMETRICKÉ TESTY využívajú priemer, NEPARAMETRICKÉ pracujú s poradím a početnosťami. Keďže priemer ako miera stredu je citlivý na extrémne hodnoty, pokiaľ nie je zabezpečené normálne rozloženie, výsledky testovania by pri nesprávnej aplikácii boli skreslené.
V zmysle centrálnej limitnej vety (viď vyššie) platí, že so vzrastajúcim počtom prípadov vo vzorke klesá riziko, že by výsledky parametrického testu aj pri nie normálnom rozdelení premenných boli skreslené.
Preto sa jednak vo výskume snažíme o dosiahnutie náhodného a čím väčšieho výberu participantov, ale zároveň voľbe štatistického testovacieho kritéria predchádza overenie normality (kardinálnych premenných). 

Spôsoby overovania:

  • Grafické zobrazenie: histogram preložený Gaussovou krivkou.
  • Miery centrálnej tendencie: priemer, medián, modus – majú mať približne
    rovnakú hodnotu.
  • Miery tvaru: ukazovatele tvaru distribúcie – šikmosť a špicatosť – nesmú
    presiahnuť hodnotu ± 1.
  • Testy normality: v psychológii štandardne používané sú Kolmogorov-Smirnov
    (pre veľké výbery) a Shapiro-Wilkov test (pre malé výbery).

DÔLEŽITÉ: Pri overovaní normálneho rozloženia premennej platí, že ju overujeme pre každý súbor pre ktorý chceme analýzu realizovať. Ak vo výskume porovnávame skupiny, parametrický test môže byť použitý iba vtedy, ak je v obidvoch skupinách potvrdené normálne rozdelenie skúmanej premennej (použijeme vtedy rozdelenie výsledkov testovania príkazom SPLIT FILE).

Napríklad, ak porovnávame chlapcov a dievčatá v miere empatii, musíme overiť normálne rozloženie premennej empatia zvlášť pre súbor dievčat a zvlášť pre súbor chlapcov.

A. GRAFICKÉ ZOBRAZENIE
Postup v SPSS:

    • GRAPHS/ LEGACY DIALOGS/ HISTOGRAM: do okna VARIABLE
      presunieme z výberovej časti vľavo premennú, zaškrtneme DISPLAY NORMAL CURVE, potom klikneme /OK.

 

Interpretácia:

  • Zhodnotenie podobnosti s Gaussovou krivkou normálneho rozloženia. Tzn. stĺpce histogramu majú čo najviac kopírovať tvar krivky, nesmú obsahovať viaceré vrcholy, najvyšší bod (modus) má byť zároveň v strede (priemer), krivka nesmie byť naklonená doľava ani doprava, nesmie byť príliš strmá ani príliš sploštená.

 

B. MIERY CENTRÁLNEJ TENDENCIE
Postup v SPSS:

    • ANALYZE/ DESCRIPTIVE STATISTICS/ FREQUENCIES: z ľavého výberového okna presunieme premennú do VARIABLE(S), klikneme na tlačidlo /STATISTICS, zapneme požadované tatistiky: MEAN, MEDIAN, MODUS, klikneme /CONTINUE a /OK.

 

Interpretácia:

  • ak všetky tri miery nadobúdajú približne tú istú hodnotu, usudzujeme na normálne rozloženie.

 

C. MIERY TVARU
Miery tvaru sú ukazovatele tvaru distribúcie miera šikmosti – SKEWNESS a miera
špicatosti – KURTOSIS

  • Miery šikmosti: sú založené na porovnaní stupňa koncentrácie malých hodnôt
    sledovaného štatistického znaku so stupňom koncentrácie veľkých hodnôt tohto
    znaku. Rovnaký stupeň hustoty malých a veľkých hodnôt sa prejavuje v symetrii tvaru rozdelenia početností. Väčší stupeň koncentrácie malých hodnôt v porovnaní s koncentráciou veľkých hodnôt sa prejaví zošikmením tvaru rozdelenia doľava (príslušná miera šikmosti je záporná). Naopak väčšia koncentrácia veľkých hodnôt v porovnaní s hustotou malých hodnôt sa prejaví spravidla zošikmením tvaru rozdelenia početností doprava (príslušná miera šikmosti je kladná).
  • Miery špicatosti: sú založené na porovnávaní stupňa koncentrácie hodnôt prostrednej veľkosti so stupňom nahustenia ostatných hodnôt. Ak je podiel početnosti prostredných hodnôt porovnateľný s početnosťami ostatných, resp. všetkých hodnôt premennej, špicatosť sa prejavuje spravidla plochým tvarom rozdelenia početností, naopak, väčší stupeň koncentrácie prostredných hodnôt v porovnaní s početnosťami všetkých ostatných hodnôt sa prejaví špicatým tvarom rozdelenia početností.

Postup v SPSS:

    • ANALYZE/ FREQUENCIES; presunieme príslušnú premennú, klikneme na tlačidlo /STATISTICS, zapneme požadované štatistiky: SKEWNESS a KURTOSIS, klikneme /CONTINUE a /OK.

 

Interpretácia:

  • Hodnota koeficientu v intervale -1 až +1 vypovedá, že rozloženie vykazuje podobnosť s normálnym rozložením

 

D. TESTY NORMALITY

  • Shapiro-Wilkov test normality (pre menšie výberové súbory – s N do 50)
  • Kolmogorov-Smirnovov test normality (pre väčšie výberové súbory – s N nad 50)

Postup v SPSS:

    • ANALYZE/ DESCRIPTIVE STATISTICS/ EXPLORE: do okna DEPENDENT LIST vložíme premennú z ľavej výberovej časti, otvoríme /PLOTS, zaškrtneme NORMALITY PLOTS WITH TESTS. Odklikneme /CONTINUE a /OK.

 

Interpretácia:

  • Ak p > 0,05 interpretujeme, že dáta sú normálne rozložené

6.4 Druhy bivariačných štatistických testov

Po zvážení všetkých kritérií pre voľbu štatistického testu (typ premennej podľa úrovne merania, teoretická hypotéza, normalita rozloženia premennej a veľkosť výskumnej vzorky či porovnávaných skupín), zvolíme vhodný bivariačný štatistický test k overeniu stanovených hypotéz. Tabuľka 1 poskytuje prehľad štandardných základných testov podľa druhu analýzy a úrovne merania premennej, ktoré sú najčastejšie používané v inferenčných analýzach na úrovni záverečných študentských prác v odbore Psychológia.
Uvedený zoznam dostupné štatistické inferenčné metódy nevyčerpáva. V prípade určitých hypotéz a premenných je aj na bivariačnej úrovni možné použiť špecifické testy, ktoré sú pre konkrétne podmienky citlivejšie, presnejšie (napr. McNemarov test, koeficienty Kendallovo tau, Eta, Lambda, Gama, Fisherov exaktný test a pod., viac in Tomšík, 2017). Nadstavbou nad základnými štatistickými testami sú metódy testovania jednoduchých či multivariačných kauzálnych modelov, a to predovšetkým na báze analýzy rozptylu (Multi-way ANOVA, ANCOVA, MANOVA, MANCOVA a pod.) a regresné analýzy (lineárna, logistická a pod.) (viac napr. McQueen, Knussen, 2013; Dancey, Reidy, 2011; Howel, 2010) .
Aplikácii vybraných základných testov sa venujeme podrobne v nasledujúcich kapitolách publikácie.

Tabuľka 1 Základné, štandardne v psychológii používané bivariačné štatistické testy

 Kardinálna
premenná
Ordinálna
premenná
Nominálna premenná
Vzťah dvoch
premenných
Pearsonov korelačný koeficientSpearmanov korelačný koeficientCramerovo V (kontingencia)
Komparácia dvoch populácii (výberov)Studentov t test pre dva nezávislé výberyMann Whitneyho U testChí-kvadrát test homogenity
Komparácia
viacerých populácii
(výberov)
One-way ANOVAKruskal-Wallisova
analýza rozptylu
Komparácia závislých výberov (premenných, viacerých meraní)Studentov t-test pre dva závislé výbery ANOVA pre opakované meraniaWilcoxonov poradový test, Friedmanov poradový testMc.Nemarov test, Cochranov Q test

ZHRNUTIE

Aplikácia štatistických testov – štatistická indukcia: umožňuje testovať stanovené hypotézy alebo odpovedať na výskumné otázky.
Štatistické testovanie sa riadi presne stanovenými krokmi a pravidlami.
Voľba vhodného štatistického testu sa odvíja od typu premennej podľa úrovne merania, teoretickej hypotézy a normality rozloženia premennej.
Normalita – normálne rozloženie premennej znamená zhodu rozloženia premennej v našej výskumnej vzorke s „normálnou“ – celou populáciou.
K overeniu normálneho rozloženia premennej používame grafické zobrazenie, miery centrálnej tendencie, miery tvaru a testy normality.

ÚLOHY KU KAPITOLÁM 1 – 6

  1. Predmetom skúmania sú sociálne kompetencie a empatia vysokoškolských študentov. K zberu údajov používame: Dotazník sociálnych kompetencií, ktorý obsahuje dve dimenzie sociálnych kompetencií: ofenzivita a reflexivita, merané na Likertovej škále a Dotazník empatie, ktorý meria celkovú úroveň empatie na Likertovej škále a taktiež obsahuje dve dimenzie: kognitívna a afektívna empatia. Pre overenie normálneho rozloženia premenných sme použili Kolmogorov-Smirnovov test normality, pričom hodnota pre všetky premenné bola menšia ako 0,05.
    • Formulujte teoretickú a empirickú hypotézu :
      • Jednosmernnú aj dvojsmernnú.
      • V prípade potreby čiastkové hypotézy.
    • Zhodnoťte normalitu rozloženia premenných podľa výsledku testu normality.
    • Určite, aký test použijeme (parametrický/neparametrický, druh testu).
  2. Predmetom skúmania je empatia u chlapcov a dievčat. K zberu údajov používame: Dotazník empatie, ktorý meria celkovú úroveň empatie na Likertovej škále a obsahuje dve dimenzie: kognitívna a afektívna empatia. Pre overenie normálneho rozloženia premenných sme použili Shapiro-Wilkov test normality, pričom hodnota pre všetky premenné bola väčšia ako 0,05.
    • Formulujte teoretickú a empirickú hypotézu :
      • Jednosmernnú aj dvojsmernnú.
      • V prípade potreby čiastkové hypotézy.
    • Zhodnoťte normalitu rozloženia premenných podľa výsledku testu normality.
    • Určite, aký test použijeme (parametrický/neparametrický, druh testu).