Statistika, mjere centralne tendencije
Koristim literaturu sa Filozofskog fakulteta Sarajevo, odsjek psihologija: Priručnik iz Statistike u psihologiji, Poglavlje 3, Đapo, N., Đokić, R. (2010)
Mjere centralne tendencije:
Mjere centralne tendencije su vrijednosti koje odražavaju centralno mjesto distribucije podataka; to je vrijednost koja je tipična, tj. reprezentira skup podataka.
U svakodnevnom jeziku za mjere centralne evidencije koristimo termin "prosjek", ali je ovaj termin neprecizan jer uključuje više mjera.
Tri najvažnije mjere centralne tendencije su mod, medijana i aritmetička sredina
Dominantna vrijednost - Mod
Dominantna vrijednost je najučestalija vrijednost u distribuciju. Ako u distribuciji podataka postoji jedna dominantna vrijednost distribucija je unimodalna, ako postoje dvije dominantne vrijednosti, distribucija je bimodalna, itd.
Primjer: U skupu podataka/rezultata x={2,4,5,4,6,3}, najviše imamo rezultata 4 => Mod = 4
Medijana (centralna vrijednost) - C
Medijana (centralna vrijednost) je vrijednost koja distribuciju dijeli na dva jednaka dijela, tj vrijednost koja, kad se podaci poredaju po veličini, nalazi tačno u sredini. Položaj medijane nalazimo prema formuli (N+1)/2, gdje je N broj podatka.
Primjer: U skupu podataka/rezultata x={2,7,4,5,6,7,2}, N=7, Medijana je na poziciji = (7+1)/2=4. Poredajmo rezultate po veličini: {2,2,4,5,6,7,7}. Medijana/Centralna vrijednost C=5
Aritmetička sredina - M
Aritmetička sredina je suma svih rezultata podijeljena brojem rezultata.
Aritmetička sredina predstavlja TEŽIŠTE rezultata i stoga je osjetljiva na ekstremne vrijednosti rezultata. M = SUM(X)/N
Aritmetičku sredinu je opravdano računati kada je: distribucija rezultata simetrična i kada je korištena intervalna ili racio skala mjerenja(*)
Primjer(**): x={2,7,4,5,6,7,2}, M = (2+7+4+5+6+7+2)/7 = 4.71; M = (2+7+4+5+6+7+2000)/7 = 290.14
Izbor mjera centralne evidencije - kada šta koristiti
Kod normalno distribucije Mod, C, M su približno jednake.
Izbor mjera centralne tendencije zavisi od skale mjerenja i oblika distribucije:
- nominalna => Mod
- intervalna ili racio, simetrična distribucija => M
- intervalna ili racio, nesimentrična => Mod
- ordinalna => Mod, C
--
(*) Objašnjeno u polavlju 1:
Skale mjerenja su: nominalna (kategorizacija), ordinalna (redoslijed + kategorizacija), intervalna (interval+redoslijed+kategorizacija) i racio (apsolutna nula + interval + redoslijed + kategorizacija).
Ovaj put Đapu ništa ne kontam. Šta je htio kod ovog redoslijed+kategorizacija, interval+redoslijed ... apsolutna nula + ... :(
Znam šta je apsolutna nula u fizici, ali ovdje nigdje nisam našao da se taj pojam uvodi ??
(**) Ja sam dodao primjer sa jednom ekstremnom vrijednosti. To materijalu fali.
2319 views and 6 responses
-
Dec 3 2010, 1:04 PMhdzenana responded:Ernade, tri su osnovne stvari koje određuju nivo skale mjerenja: veličinski niz, jednakost intervala i postojanje apsolutne nule.
1. NOMINALNA SKALA - najniži nivo mjerenja. Varijable koje se mejre na ovom nivou obično zovemo kategorične varijable, jer je ovaj nivo mjerenja nipta drugo nego smještanje hrpe podaaka u kategorije. Kao da uzmeš špil karata i sortiraš prema varijabli "Znak" Imaš četiri kategorije, a svaka karta ada u jednu od tih ekspluzivnih (odvojenih) kategorija. Ova skala niti ima veličinski niz (ne zna se koja je kateroija prva a koja zadnja, bolja ili gora jer su to kvalitativne razlike), niti ima jednakost intervala (jer i nema intervala),a tek nema apsolutne nule. Jedino što dobiješ to su broj elemenata unutar svake kategije. Npa primjer pitaš ljude Koju mineralnu pijete: KIseljak, VItinka ili Jamnica. Varijabla se zove "Vrsta mineralne vode" ima tri kategorije. Na ovoj skali nemas sta koristiti nikakve mjere parametrijske statistike, a kako bi se ispitalo da li se naka od kategorija više preferira koristi se hi-kvadrat test (ali o tome cemo pricati aBd kada dodje vrijeme).
Sljedeća skala se zove ORDINALNA (engelski order - poredak) - ovo se još zove i rang skala, jer imas rangiranje ispitanika. Tipičan primjer je redosljed u nekoj trci. Trc'o BOlt stigo prvi (9 sekundi), za njim Jonson stig'o drugi (9,5 sekundi), a Malkovich stigo treći (15 sekundi). E gledaj, ovde imas velicinski niz (prvi drugi, treci), ali nemas jednakost intervala jer razlika između prvog i drugog nije ista kao i razlika između drugog i trećeg. Kada gledas rangove - razlike su iste, ali one sustinski, sadržajno nisu ni nalik. Ja na primejr pitam ispitanike: poredajte glumce po tome koliko vam se svidjaju tako da na prvo mjesto stavite svog najdražeg, pa onda drugog, i tako dalje. dakle, RANG ili ORDINALNA skala ima veličinski niz (zna se ko je gore, a ko ispod, ali nema jednakost rangova niti ima apsolutnu nulu.
INTERVALNA SKALA - je skala koja je najčešća skala mjerenjima u društvenim naukama, a nije rijetka ni u egzaktnim. Primjer ti je mjerenje bilo koje psihološke karakteristike - na primjer depresivnosti. Imas upitnik od 30 pitanja, rezultati su na skali od 1 do 30 (a kako pricamo o nekoj ljudskoj osobini pretpostavka je da se ona u nekim populacijama distribuira noramlno, te da mozes izracunati i aritmetičku sredinu i st.dev) . Imas velicinski niz, imas jednakost intervala (ali ne i jednakost omjera), ali nemas apsolutnu nulu. Sta to znaci? Znas ko je depresivniji, a ko nije, postoji jednakost intervala (razlika između 10 i 15 je ista kao i između 15 i 20) ali kvalitativno to nije isto. Npr. rezultati 10 i 15 padaju oko aritmetičke sredine (u onih -1 do 1 st.dev) jer je na mjerenju dobiveno da je aritmetička sredin 12, a st.dev 3, a 20 je već ozbiljna simtomatologija. Znači između 10 i 15 kvalitativno nije ista razlika u intenzitetu ili sadržaju kao između 15 i 20. I jos nesto, nula je arbitrarna - onaj ko ima 0 na testu ne znaci da nije depresivan, nego test to mozda nije zahvatio. Ako neko dobije 0 na testu iz bosanskog jezika ne znaci da nema pojma sa bosanskim jezikom.
I na kraju je OMJERNA SKALA, a zove se jer ima omjere, a ne intervale i ima apsolutnu nulu. Znaci ima velicinski niz, ima jednaksot omjera (razlika između imati jedno i svoje djee je ista kao imati 2 i 3 djece) i ima apsolutnu nulu (ako nemas djece, onda nemas djece).
Kapiši sada? -
Dec 3 2010, 1:34 PMErnad Husremović responded:Trebala si ovo "krkanskije" brate objasniti. Previše si mi objasnila. Shvatiti mogu, ali sigurno neću moći izreproducirati.
Sad ovo fakat ne mogu isprocesirati :(.
Nek stoji za drugi put. Ona me asistentica definitvno "tuširala"
-
Dec 3 2010, 1:44 PMErnad Husremović responded:1) Nominalna
Primjer: Vrsta min vode: Kiseljak / Jamnica / Vitinka2) Ordinalna, odnosno rang skala.
Primjer: Rezultati trke: 9.5; 12; 15.5 sec3) Intervalna:
Primjer: rezultati studenata na univerzitetu: 5..10 ocjene
4) Omjerna
?? ovaj tvoj primjer sa djecom ne kontam.
-
Dec 3 2010, 1:49 PMErnad Husremović responded:Dženana via telefon:
Omjerna skala primjer:
dužina: 0 - 200 cm
omjerna skala je zato što je *razlika* između mjerenja 120 i 100 i ista kao i između mjerenja 190-180
-
Dec 3 2010, 1:52 PMErnad Husremović responded:broj djece: 0, 1, 2, 3, 4, 5, 6, 7. razlika između imati 5 i 4 djece je jedno dijete, razlika između imati 3 i 2 djeteta je takođe jedno dijete.
Razlika je ista ? pa sad .. Hajd dobro, Dobro statistički gledajući jeste :)
Kad se onome što ima 7 djece ima jedno zagubi na igralištu on i ne primjeti.
-
Dec 3 2010, 2:02 PMErnad Husremović responded:Glavna kvaka kod intervalne skale što kvalitativno razlika između pojedinih mjerenja nije proporcionalna.
One ocjene i nisu baš dobar primjer (iako se tretiraju kod obrade kao intervalna skala)
Kvaka je da kada to što pripada intervalnoj skali, i recimo, mjerenja su u rasponu recimo 10 .. 100, dio rezultati 10 naspram 12 (koji se nalazi u donjem dijelu skale) nisu srazmjerni sa rezultatom 75 naspram 77 koji se nalazi u gornjem dijelu skale. Ta delta 2 u donjem dijelu ne znači uopšte istu razliku kao u gornjem dijelu.