Univerzita sv. Cyrila a Metoda v Trnave

Námestie J. Herdu 577/2

917 01 Trnava

+421 33 5565 221

Sekretariát

ŠTATISTIKA PRAKTICKY (NIELEN) V ZÁVEREČNÝCH PRÁCACH

4. DATABÁZOVÝ SÚBOR A ZÁKLADNÉ PRÍKAZY V PROGRAME „SPSS“

V kvantitatívnom výskume zbierame informácie o psychických javoch od mnohých jednotlivcov. Všetky javy sú kvantifikované, teda zakódované do čísel. I keď v kvantitatívnom výskume hovoríme o redukcionizme (sledujeme niekoľko premenných, nie komplexný jav), v praxi ide o množstvo čiastkových hodnôt, ktoré reprezentujú rôzne demografické charakteristiky (pohlavie, vek), odpovede v jednotlivých položkách dotazníka, pričom v zásade býva dotazníkov alebo meraní viacero. Prakticky zistíme, že u jedného respondenta vieme získať aj rádovo desiatky rôznych údajov. Je potrebné údaje systematicky vložiť do tabuľky, na čo slúžia databázové softvéry. Najjednoduchším spôsobom je pripraviť databázu v programe MS Excel, ale je to možné aj priamo v IBM SPSS Statistics, čo popíšeme nižšie.

Uplatňujeme dve zásady:

  • Riadky: reprezentujú jednotlivé prípady (respondentov, jednotlivcov).
  • Stĺpce: reprezentujú jednotlivé premenné (položky dotazníka, závislú či
    nezávislú premennú, demografické charakteristiky a pod.).

Pokiaľ vytvárame databázu v MS Exceli (ďalej už len Excel), v prvom riadku je tzv. hlavička stĺpcov (Tomšík, 2017), bunky obsahujú názvy premenných a samotné dáta k prvému prípadu vkladáme až do ďalšieho riadku. Takto pripravenú databázu je možné otvoriť aj v štatistickom softvéri IBM SPSS Statistics.
IBM SPSS Statistics (ďalej už len „SPSS“) predstavuje softvér, ktorý zhromažďuje, zobrazuje a analyzuje štatistické dáta. V nasledujúcich kapitolách budeme pri jednotlivých krokoch práce s dátami popisovať postup práce v ňom.

4.1 Vytváranie súboru v SPSS

Prvým krokom práce so štatistickým softvérom SPSS je vloženie dát do systému.
Tvorba databázy je možná dvomi spôsobmi:

  • otvorením hotovej databázy z programu Excel (*.xls, *.xlsx, *.xlsm);
  • tvorbou vlastnej databázy priamo v SPSS.

Pokiaľ máme vytvorený dátový súbor v programe Excel, konvertujeme ho nasledovne:

  • FILE/ OPEN/ DATA /LOOK IN: označíme, kde sa súbor nachádza;
    rozklikneme /FILES OF TYPE, kde zvolíme typ Excel (*.xls, *.xlsx, *.xlsm)
    /OPEN: otvorí sa ešte okno, kde sa program pýta, či má prvý riadok Excel
    súboru považovať za názvy premenných a ktorý hárok má otvoriť, ak je to
    v poriadku, klikneme na /OK.

Dáta budú prekonvertované do SPSS, pričom prvý riadok z Excelu (hlavičku stĺpcov) nájdeme na vodorovnom paneli nad samotnou tabuľkou s dátami

V hlavnom okne SPSS sú k dispozícii dva hárky (záložky): DATA VIEW a VARIABLE VIEW (preklik vľavo dolu).

  • v časti DATA VIEW vidíme všetky vložené údaje,
  • každej premennej/položke/ prislúcha jeden stĺpec,

 

Pokiaľ vpisujeme dáta priamo do SPSS, alebo potrebujeme už priamo v ňom doplniť premenné či ich popísať, postupujeme nasledovne:

  • vkladáme vždy číselné hodnoty: pre výskumné účely zväčša hrubé skóre (nevkladáme odpovede ÁNO alebo NIE, ale ich rekódujeme do čísiel, napr. 1 alebo 2),
  • pokiaľ sa rozhodneme vkladať odpovede pre jednotlivé položky (napr. dotazník meria Empatiu a má 20 položiek, do databázy píšeme hodnotu z každej položky, a nie iba celkové skóre), môžeme vypočítať výslednú hodnotu (= skóre) premennej následne priamo v SPSS cez príkazy (COMPUTE),
  • k charakteristike údajov (premenných) nám slúži okno VARIABLE VIEW, ktoré obsahuje nasledovné polia, nachádzajúce sa na hornej lište:
    • NAME: názov premennej, ktorý sa bude zobrazovať len v časti DATA
      VIEW (horný panel) a v oknách pri vkladaní premenných pri práci s nimi; ale vo výsledných tabuľkách sa premenné zobrazia podľa zadania v časti LABEL (viď nižšie). Názov premennej nesmie obsahovať medzery, viacslovné názvy oddeľujeme bodkou, podtržníkom, pomlčkou…, nesmie obsahovať čiarky. Napríklad: podpora.ucitela.
    • TYPE: typ premennej, ponúka niekoľko možností, zadávame najčastejšie NUMERIC = číselná (ďalšie: date, string, comma, dot…). Pokiaľ máme
      svedomito zakódované všetky odpovede do čísel, ide o numerický typ. Avšak niekedy potrebujeme zachovať aj textové otvorené odpovede (napr. v rámci odpovedí „Iné“, kde respondent vpíše, čo tým myslí), vtedy ide o typ STRING.
    • WIDTH: počet znakov.
    • DECIMALS: počet desatinných miest.
    • LABEL: označenie premennej, ktoré sa bude zobrazovať vo výstupných tabuľkách a grafoch z SPSS. Na rozdiel od časti NAME môžeme použiť
      viac slov, označené je celé meno premennej, čiže má začínať veľkým písmenom. Napríklad: Podpora od učiteľa.
    • VALUES: hodnota premenných, jedno z najdôležitejších zadaní. Ak
      jednotlivým kvalitám, odpovediam priraďujeme konkrétne čísla, kvantifikujeme ich, ide o nominálne premenné, napr. Typ školy, Pohlavie, Mesto a pod., v tejto časti podľa nami zvoleného kľúča jednotlivým kategóriám premennej priradíme čísla, napr. Pohlavie (do stĺpca Values zadáme): Ženy = 1, Muži = 2; Typ školy: ZŠ = 1, SŠ = 2, VŠ = 3. V prípade, že je v dotazníku ordinálna stupnica slovná a hodnotám sú pridelené konkrétne výrazy (Denne, 5x za týždeň, 2x za týždeň, 4x za mesiac…), zapisujeme ich rovnakým spôsobom (priraďujeme im hodnoty 1, 2, a pod., avšak tu už rešpektujeme zvyšujúcu sa mieru, úroveň, frekvenciu). Pri kardinálnych premenných, kde pracujeme so skóre, či vysokou variabilitou hodnôt, ktoré vznikli sčítaním hodnôt z viacerých položiek, číselným vyjadreniam nevieme priradiť slovné, preto VALUES viac
      nešpecifikujeme.
      • Po rozkliknutí okna VALUES zadáme do poľa VALUE číselnú hodnotu (napr. 1).
      • Do poľa LABEL vložíme pomenovanie úrovne, kategórie premennej (napr. Ženy), teda názov kvality, ktorú hodnota reprezentuje.
      • Potvrdíme pomocou príkazového políčka ADD a pridávame ďalšie kategórie, po kompletnom zadaní stlačíme OK. Príkazové okná CHANGE a REMOVE umožňujú úpravu a vymazanie.
      • Cesta v SPSS: VARIABLE VIEW/ VALUES/ VALUE/ LABEL/ ADD/ OK.
    • MISSING: ak v dátach chýba odpoveď na položku, zobrazuje sa ako bodka; v tomto stĺpci si vieme určiť, ak chceme mať chýbajúce údaje kódované inak, napr. 0 alebo 1 ( potrebné skontrolovať pri neznámej databáze).
    • COLUMS: šírka stĺpca.
    • ALIGN: zarovnanie textu na stred, vľavo alebo vpravo.
    • MEASURE: ďalšie dôležité zadanie, ktoré označuje úroveň merania, resp. typ premennej, potrebné pre štatistické spracovanie: nominálna (Nominal), ordinálna (Ordinal), kardinálna (Scale) premenná.

 

  • Po zadaní popisov v okne VARIABLE VIEW vidíme v okne DATA VIEW pomenované premenné podľa NAME. Pomenovania podľa LABEL sa objavia v grafoch a tabuľkách, rovnako ako názvy kategórii pri nominálnych premenných zadané v časti VALUES.
  • Môžeme kopírovať dáta z programu Excel alebo vpisovať dáta z vyhodnotených
    meracích nástrojov.

4.2 Správne určenie nominálnej, ordinálnej a kardinálnej premennej

Pokiaľ sami robíme výskum, je pomerne jednoduché podľa metódy merania a spôsobu, ako sami dáta z výskumu zaznačujeme (kódujeme) do databázy určiť, či ide o nominálnu, ordinálnu alebo kardinálnu premennú. Avšak často je potrebné pracovať s databázou, ktorú nepoznáme, a vidíme len „množstvo čísel“. V hárku VARIABLE VIEW, môže byť typ premennej určený automaticky v príslušnom stĺpci TYPE, ale program (SPSS) premennú nie vždy určí správne.

DÔLEŽITÉ: Vždy musíme príslušné premenné, s ktorými budeme pracovať, skontrolovať.

Postup:
Pozrieme sa na hodnoty danej premennej v DATA VIEW v príslušnom stĺpci (alebo cez príkaz FREQUENCIES):

  • Ak hodnoty dosahujú 11 a viac bodov, ide o kardinálnu premennú (Scale 6)
  • Ak nie (v stĺpci nachádzame hodnoty do 10), pozrieme sa na hárok VARIABLE
    VIEW do stĺpca VALUES, či sú a ako sú definované hodnoty danej premennej.
    • Pokiaľ VALUES nie sú definované, musíme nahliadnuť do dotazníka, testu, manuálu, metodiky výskumu, ako vyzerala položka a odpovede.
    • Porovnáme odpoveď s hodnotou 1 a s hodnotou 2: Vieme povedať, že
      hodnota 2 danej premennej znamená, že je jav väčší, intenzívnejší alebo častejší ako keď nadobúda hodnotu 1 ???
      • Ak ÁNO, ide o ordinálnu (Ordinal) premennú.
      • Ak NIE a odpovede (hodnoty) sú kvalitatívne = rovnocenné, vyjadrujú iné kvality a nie mieru niečoho (napr. súhlasu, vzdelania a pod.) ide o nominálne (Nominal) premenné – hodnoty iba inak pomenúvajú
        vlastnosti javu, nevyjadrujú intenzitu, množstvo javu.

Napr. Pohlavie: Muž = 1, Žena = 2 neznamená, že žena má viac pohlavia ako muž. Taktiež Vyhýbavá väzba = 1, Ambivalentná väzba = 2, Bezpečná väzba = 3 neznamená, že Bezpečná väzba má najviac väzby, ale je to iný typ väzby.

4.3 Základné príkazy práce s premennými v SPSS (transformácia a tvorba nových premenných)

Základné príkazy, ktoré uplatňujeme v SPSS slúžia, k operáciám, pri ktorých z existujúcich premenných vznikajú nové alebo sa tieto premenné systematicky podľa zadaného predpisu menia, napr. COMPUTE, RECODE, SPLIT FILE, IF, RANK, AUTORECODE. Popíšeme najčastejšie využívané.

A. REKÓDOVANIE PREMENNÝCH (RECODE)

Príkazom RECODE meníme hodnoty premennej podľa nami zadaného predpisu, najčastejšie ho používame:

  1. Pri rekódovaní reverzných položiek (opačne skórované položky), tie môžeme zmeniť do (into) SAME VARIABLE: napr. pri odpoveďovej škále od 1 do 5: 1 na 5, 2 na 4, 3 na 3, 4 na 2 a 5 na 1; alebo pri škále 0 až 5, 0 na 5, 1 na 4, 2 na 3, 3 na 2, 4 na 1, 5 = 0, a podobne podľa pôvodných hodnôt.
  2. Pri redukovaní kardinálnej premennej na ordinálnu. Napr. Vek v rokoch redukujeme na vekové kategórie (do 20 rokov = 1, od 21 – 30 rokov = 2, 30 – 40 rokov = 3, atď.) – odporúčame do DIFFERENT VARIABLE, aby sa nestratila pôvodná premenná veku v rokoch.
  3. Redukcia ordinálnej premennej na menej kategórií alebo až na dichotomickú
    premennú.
  4. Zmena hodnôt – kódov odpovedí z dotazníka, pokiaľ pôvodné (hodnoty) nereprezentovali zvyšujúcu/znižujúcu sa tendenciu, intenzitu javu a chceme pracovať s nimi ako s ordinálnou premennou (napr. počet cigariet za deň), počítať korelácie, komparácie. Napr. na Obrázku 1 vidíme, že pôvodné kódovanie v databáze bolo: a (1 cigareta) = 1, b = 2, c = 3… g (0 cigariet) = 7.  Potrebujeme, aby g = 0 a nie 7, pretože je to žiadny výskyt javu (f potom bude najvyššia hodnota = 6).

 

Obrázok 1. Príklad odpovedí z dotazníka, ktoré treba rekódovať.

Postup pre RECODE v SPSS:
  • TRANSFORM/ RECODE INTO SAME VARIABLES: presunieme premennú z ľavého stĺpca do VARIABLES, klikneme na /OLD AND NEW VALUES: zapíšeme, ako meníme hodnoty škály, pričom vľavo špecifikujeme, ktoré hodnoty meníme a vpravo uvedieme nové hodnoty, na ktoré sa staré hodnoty (definované vľavo) zmenia, musíme tak urobiť v toľkých krokoch, koľko nových hodnôt vznikne, za každou klikneme /ADD, po vložení všetkých zmien /CONTINUE a /OK. Pri tomto príkaze meníme hodnoty premennej, ktorá zostáva s rovnakým názvom, nevytvárame ďalšiu novú premenenú (pôvodné dáta už neexistujú).
  • TRANSFORM/ RECODE INTO DIFFERENT VARIABLES: do časti OUTPUT VARIABLE – NAME zadáme názov novej premennej a /CHANGE; klikneme /OLD AND NEW VALUES, kde zapíšeme ako meníme hodnoty škály (rovnako ako vyššie), po každej špecifikácii klikneme /ADD, po zadaní všetkých zmien /CONTINUE a /OK. Týmto príkazom meníme hodnoty a vytvárame novú premennú, pôvodná premenná zostáva.

B. TVORBA NOVÝCH PREMENNÝCH (COMPUTE)

Príkaz COMPUTE umožňuje vytvoriť novú premennú (v numerickom formáte, napr. súčet), prípadne modifikovať hodnoty existujúcej numerickej premennej (napr. odčítať položku z celkového skóre, vydeliť skóre počtom položiek a pod.)
  • Používame hlavne pri súčte odpovedí na položky pri tvorbe premennej celkového skóre z dotazníka, škály, resp. súčet dimenzií, subškál do celkového skóre, atď.
  • Umožňuje základné aritmetické zadania: COMPUTE Var3 = Var1 + Var2 (súčet Var1 a Var2).
Postup pre COMPUTE v SPSS:
  • TRANSFORM/ COMPUTE VARIABLE: do TARGET VARIABLE vpíšeme názov novej premennej, ďalej z panelu vľavo prenášame šípkou postupne položky/premenné/dimenzie/faktory do okna NUMERIC EXPRESSION, pričom ich spájame znamienkom + (alebo použijeme znamienko podľa účelu), po zadaní všetkých stlačíme /OK.

4.4 Príkazy selekcie, „filtrovania“ prípadov (SPLIT FILE, SELECT CASES)

Medzi najviac využívané príkazy, ktoré uplatňujeme v rámci štatistických postupov, tak pri deskripcii, ako i inferencii, patria SELECT CASES a SPLIT FILE. Umožňujú nám vybrať časť výskumnej vzorky, alebo rozdelenie súboru pri analýze podľa zadaných kritérií.

A. SELECT CASES (filtrovanie)

Príkaz používame ak chceme niektoré prípady z analýzy vynechať. Napr. súbor tvoria respondenti z troch typov škôl, ale chceme porovnať len dva typy, alebo chceme realizovať analýzu len pre dievčatá a potrebujeme zo súboru vylúčiť chlapcov, atď.

Postup pre SELECT CASES v SPSS:

  • DATA/ SELECT CASES: zaškrtnúť IF CONDITION IS SATISFIED: zadáme vzorec (logickú podmienku), ktorá ak sa splní, respondent bude zaradený do spracovania, resp. bude vyradený.

Príklady:

  • Chceme zo súboru podľa typu školy vylúčiť ZŠ, pozrieme sa ako máme v rámci VALUES označený tento typ (zistíme, že má hodnotu 11) a zadáme do príkazu, aby boli zahrnuté tie prípady, ktoré neobsahujú túto hodnotu, čiže všetky, ktoré majú hodnotu nižšiu. Do riadku zadáme: school _type < 11.
  • Chceme v analýze ponechať dievčatá, ale vylúčiť chlapcov. Do podmienky
    zadáme: pohlavie = 1 (ak máme dievčatá v časti VALUES označené ako 1). Analýza sa bude realizovať len pre prípady, ktoré majú túto hodnotu, teda dievčatá.
  • V okne vpravo môžeme vidieť množstvo logických funkcií, ktoré využívame, ak máme zložitejšie kritériá na selekciu, napr. ak chceme vynechať hodnotu 5 a zahrnúť 1- 4 a 6 a viac – príkaz je potom zložitejší a musí sa použiť napr. spojka &, čiarka a pod.

SELECT CASES prakticky nastaví filter a tento filter sa potom nachádza na konci databázy ako nová premenná s hodnotami 0 a 1 – dá sa kedykoľvek znovu aktivovať (v okne pre SELECT CASES po zaškrtnutí USE FILTER VARIABLE a presunutí premennej filtra z ľavého výberového okna).

DÔLEŽITÉ: príkaz po skončení analýzy, pre ktorú bol určený, musíme následne zrušiť – použitím /RESET v rovnakom dialógovom okne.

B. SPLIT FILE

Príkaz využívame najmä v komparačných výskumoch, teda v takých, kde je výskumným problémom porovnanie javov medzi skupinami. Slúži na rozdelenie (predovšetkým deskriptívnych) analýz podľa zadaného kritéria (premennej, ktorá rozdeľuje súbor na skupiny), čiže pokiaľ ide o bivariačnú (deskriptívnu) analýzu. Po zadaní premennej, ktorá rozdelí súbor, program ďalej všetky výpočty vypracuje v skupinách, kde v jednej tabuľke budú výsledky pre jednotlivé skupiny pod sebou (typ COMPARE GROUPS), alebo celé výsledky sa najskôr zobrazia pre jednu skupinu, potom pre druhú, tretiu a pod. (typ ORGANIZE OUTPUT GROUPS).

Príklad:

  • Počítame vzťah medzi podporou od učiteľa a motiváciou k štúdiu, vzorku tvoria dievčatá a chlapci, po zadaní príkazu SPLIT FILE nám SPSS bude realizovať analýzu zvlášť pre každé pohlavie a výsledky deliť do separátnych (častí) tabuliek. Bez zadania príkazu by bola analýza realizovaná pre celý súbor.

 

Postup pre SPLIT FILE v SPSS:

  • DATA/ SPLIT FILE: zaškrtneme jednu z dvoch možností: ORGANIZE
    OUTPUTS BY GROUPS
    alebo COMPARE GROUPS. Z výberového okna
    presunieme kategorickú (rozdeľujúcu) premennú (napr. pohlavie, typ školy) do
    GROUPS BASED ON.

 

DÔLEŽITÉ: Rozdeľujúce premenné, teda kategorické, ktoré definujú skupiny, v ktorých sa následne robia analýzy samostatne, môžu byť l en NOMINÁLNE, prípadne ORDINÁLNE premenné7!
Tak, ako pri SELECT CASES, i tu platí, že po realizácii potrebných (najmä) deskriptívnych analýz je potrebné príkaz vypnúť v dialógovom okne pomocou /RESET.

V inom prípade by nebolo možné realizovať ani komparačné testovania (pre nezávislé výbery medzi definovanými skupinami), ktoré na bivariačnú deskriptívnu analýzu nadväzujú!

ZHRNUTIE

Prvým krokom pri práci s SPSS je tvorba databázy (prenosom z programu Excel alebo vlastnou tvorbou v SPSS).
Hlavné okno SPSS obsahuje dva hárky: DATA VIEW (vložené údaje) a VARIABLE VIEW (charakteristiky údajov- názov premennej, typ premennej podľa úrovne merania, hodnoty premenných pri kategorickom type dát a ďalšie).
Príkaz RECODE slúži na zmenenie hodnôt premennej podľa nami zvoleného predpisu, napr. pri reverzných položkách.
Príkaz COMPUTE umožňuje vytvoriť novú premennú, prípadne modifikovať existujúcu.
Príkaz SELECT CASES používame, ak potrebujeme z analýzy vynechať niektoré prípady, súbory, podsúbory.
Príkaz SPLIT FILE slúži na rozdelenie analýz podľa zadaného kritéria – po zadaní sú analýzy realizované napr. pre jednotlivé skupiny súboru.