Statistika, mjere centralne tendencije

Koristim literaturu sa Filozofskog fakulteta Sarajevo, odsjek psihologija: Priručnik iz Statistike u psihologiji, Poglavlje 3, Đapo, N., Đokić, R. (2010)

Mjere centralne tendencije:

Mjere centralne tendencije su vrijednosti koje odražavaju centralno mjesto distribucije podataka; to je vrijednost koja je tipična, tj. reprezentira skup podataka.

U svakodnevnom jeziku za mjere centralne evidencije koristimo termin "prosjek", ali je ovaj termin neprecizan jer uključuje više mjera.

Tri najvažnije mjere centralne tendencije su mod, medijana i aritmetička sredina

Dominantna vrijednost - Mod

Dominantna vrijednost je najučestalija vrijednost u distribuciju. Ako u distribuciji podataka postoji jedna dominantna vrijednost distribucija je unimodalna, ako postoje dvije dominantne vrijednosti, distribucija je bimodalna, itd.

Primjer: U skupu podataka/rezultata  x={2,4,5,4,6,3}, najviše imamo rezultata 4 => Mod = 4

Medijana (centralna vrijednost) - C

Medijana (centralna vrijednost) je vrijednost koja distribuciju dijeli na dva jednaka dijela, tj vrijednost koja, kad se podaci poredaju po veličini, nalazi tačno u sredini. Položaj medijane nalazimo prema formuli (N+1)/2, gdje je N broj podatka.

Primjer: U skupu podataka/rezultata  x={2,7,4,5,6,7,2}, N=7, Medijana je na poziciji = (7+1)/2=4. Poredajmo rezultate po veličini: {2,2,4,5,6,7,7}. Medijana/Centralna vrijednost C=5

Aritmetička sredina - M

Aritmetička sredina je suma svih rezultata podijeljena brojem rezultata.

Aritmetička sredina predstavlja TEŽIŠTE rezultata i stoga je osjetljiva na ekstremne vrijednosti rezultata. M = SUM(X)/N

Aritmetičku sredinu je opravdano računati kada je: distribucija rezultata simetrična i kada je korištena intervalna ili racio skala mjerenja(*)

Primjer(**): x={2,7,4,5,6,7,2}, M = (2+7+4+5+6+7+2)/7 = 4.71; M = (2+7+4+5+6+7+2000)/7 = 290.14

Izbor mjera centralne evidencije -  kada šta koristiti

Kod normalno distribucije Mod, C, M su približno jednake.

Izbor mjera centralne tendencije zavisi od skale mjerenja i oblika distribucije:

  1. nominalna => Mod
  2. intervalna ili racio, simetrična distribucija => M
  3. intervalna ili racio, nesimentrična => Mod
  4. ordinalna => Mod, C

--

(*) Objašnjeno u polavlju 1:

Skale mjerenja su: nominalna (kategorizacija), ordinalna (redoslijed + kategorizacija), intervalna (interval+redoslijed+kategorizacija) i racio (apsolutna nula + interval + redoslijed + kategorizacija).

Ovaj put Đapu ništa ne kontam. Šta je htio kod ovog redoslijed+kategorizacija, interval+redoslijed ... apsolutna nula + ... :(

Znam šta je apsolutna nula u fizici, ali ovdje nigdje nisam našao da se  taj pojam uvodi ??

(**) Ja sam dodao primjer sa jednom ekstremnom vrijednosti. To materijalu fali.

 

 

2319 views and 6 responses

  • Dec 3 2010, 1:04 PM
    hdzenana responded:
    Ernade, tri su osnovne stvari koje određuju nivo skale mjerenja: veličinski niz, jednakost intervala i postojanje apsolutne nule.
    1. NOMINALNA SKALA - najniži nivo mjerenja. Varijable koje se mejre na ovom nivou obično zovemo kategorične varijable, jer je ovaj nivo mjerenja nipta drugo nego smještanje hrpe podaaka u kategorije. Kao da uzmeš špil karata i sortiraš prema varijabli "Znak" Imaš četiri kategorije, a svaka karta ada u jednu od tih ekspluzivnih (odvojenih) kategorija. Ova skala niti ima veličinski niz (ne zna se koja je kateroija prva a koja zadnja, bolja ili gora jer su to kvalitativne razlike), niti ima jednakost intervala (jer i nema intervala),a tek nema apsolutne nule. Jedino što dobiješ to su broj elemenata unutar svake kategije. Npa primjer pitaš ljude Koju mineralnu pijete: KIseljak, VItinka ili Jamnica. Varijabla se zove "Vrsta mineralne vode" ima tri kategorije. Na ovoj skali nemas sta koristiti nikakve mjere parametrijske statistike, a kako bi se ispitalo da li se naka od kategorija više preferira koristi se hi-kvadrat test (ali o tome cemo pricati aBd kada dodje vrijeme).
    Sljedeća skala se zove ORDINALNA (engelski order - poredak) - ovo se još zove i rang skala, jer imas rangiranje ispitanika. Tipičan primjer je redosljed u nekoj trci. Trc'o BOlt stigo prvi (9 sekundi), za njim Jonson stig'o drugi (9,5 sekundi), a Malkovich stigo treći (15 sekundi). E gledaj, ovde imas velicinski niz (prvi drugi, treci), ali nemas jednakost intervala jer razlika između prvog i drugog nije ista kao i razlika između drugog i trećeg. Kada gledas rangove - razlike su iste, ali one sustinski, sadržajno nisu ni nalik. Ja na primejr pitam ispitanike: poredajte glumce po tome koliko vam se svidjaju tako da na prvo mjesto stavite svog najdražeg, pa onda drugog, i tako dalje. dakle, RANG ili ORDINALNA skala ima veličinski niz (zna se ko je gore, a ko ispod, ali nema jednakost rangova niti ima apsolutnu nulu.
    INTERVALNA SKALA - je skala koja je najčešća skala mjerenjima u društvenim naukama, a nije rijetka ni u egzaktnim. Primjer ti je mjerenje bilo koje psihološke karakteristike - na primjer depresivnosti. Imas upitnik od 30 pitanja, rezultati su na skali od 1 do 30 (a kako pricamo o nekoj ljudskoj osobini pretpostavka je da se ona u nekim populacijama distribuira noramlno, te da mozes izracunati i aritmetičku sredinu i st.dev) . Imas velicinski niz, imas jednakost intervala (ali ne i jednakost omjera), ali nemas apsolutnu nulu. Sta to znaci? Znas ko je depresivniji, a ko nije, postoji jednakost intervala (razlika između 10 i 15 je ista kao i između 15 i 20) ali kvalitativno to nije isto. Npr. rezultati 10 i 15 padaju oko aritmetičke sredine (u onih -1 do 1 st.dev) jer je na mjerenju dobiveno da je aritmetička sredin 12, a st.dev 3, a 20 je već ozbiljna simtomatologija. Znači između 10 i 15 kvalitativno nije ista razlika u intenzitetu ili sadržaju kao između 15 i 20. I jos nesto, nula je arbitrarna - onaj ko ima 0 na testu ne znaci da nije depresivan, nego test to mozda nije zahvatio. Ako neko dobije 0 na testu iz bosanskog jezika ne znaci da nema pojma sa bosanskim jezikom.
    I na kraju je OMJERNA SKALA, a zove se jer ima omjere, a ne intervale i ima apsolutnu nulu. Znaci ima velicinski niz, ima jednaksot omjera (razlika između imati jedno i svoje djee je ista kao imati 2 i 3 djece) i ima apsolutnu nulu (ako nemas djece, onda nemas djece).
    Kapiši sada?
  • Dec 3 2010, 1:34 PM
    Ernad Husremović responded:
    Trebala si ovo "krkanskije" brate objasniti. Previše si mi objasnila. Shvatiti mogu, ali sigurno neću moći izreproducirati.

    Sad ovo fakat ne mogu isprocesirati :(.

    Nek stoji za drugi put. Ona me asistentica definitvno "tuširala"

  • Dec 3 2010, 1:44 PM
    Ernad Husremović responded:
    1) Nominalna

    Primjer: Vrsta min vode: Kiseljak / Jamnica / Vitinka

    2) Ordinalna, odnosno rang skala.

    Primjer: Rezultati trke: 9.5; 12; 15.5 sec

    3) Intervalna:

    Primjer: rezultati studenata na univerzitetu: 5..10 ocjene

    4) Omjerna

    ?? ovaj tvoj primjer sa djecom ne kontam.

  • Dec 3 2010, 1:49 PM
    Ernad Husremović responded:
    Dženana via telefon:

    Omjerna skala primjer:

    dužina: 0 - 200 cm

    omjerna skala je zato što je *razlika* između mjerenja 120 i 100 i ista kao i između mjerenja 190-180

  • Dec 3 2010, 1:52 PM
    Ernad Husremović responded:
    broj djece: 0, 1, 2, 3, 4, 5, 6, 7. razlika između imati 5 i 4 djece je jedno dijete, razlika između imati 3 i 2 djeteta je takođe jedno dijete.

    Razlika je ista ? pa sad .. Hajd dobro, Dobro statistički gledajući jeste :)

    Kad se onome što ima 7 djece ima jedno zagubi na igralištu on i ne primjeti.

  • Dec 3 2010, 2:02 PM
    Ernad Husremović responded:
    Glavna kvaka kod intervalne skale što kvalitativno razlika između pojedinih mjerenja nije proporcionalna.

    One ocjene i nisu baš dobar primjer (iako se tretiraju kod obrade kao intervalna skala)

    Kvaka je da kada to što pripada intervalnoj skali, i recimo, mjerenja su u rasponu recimo 10 .. 100, dio rezultati 10 naspram 12 (koji se nalazi u donjem dijelu skale) nisu srazmjerni sa rezultatom 75 naspram 77 koji se nalazi u gornjem dijelu skale. Ta delta 2 u donjem dijelu ne znači uopšte istu razliku kao u gornjem dijelu.