Blog

HomeMārketinga pētījumiDispersijas analīze
Dispersijas analīze

Dispersijas analīze

Ievads

Dispersijas analīze ir būtiska dažādu statistisko un mārketinga pētījumu sastāvdaļa, to izmanto dažādu statistisko hipotēžu pārbaudei un secinājumiem matemātiskai argumentācijai. Izmantojot dispersijas analīzi, iespējams aprēķināt vai starp pētāmo pazīmi un mainīgajiem pastāv kāda sakarība. Tādēļ, lai dažādos mārketinga pētījumos noteiktu sakarības starp dažādiem ietekmējošiem faktoriem uz pētāmo pazīmi, kā piemēram, cik ļoti reklāma ietekmē noteiktā produkta pārdošanas apjomus, vai kādā mērā dažādu mediju – radio, televīzijas un interneta reklāma ietekmē noteiktā produkta pārdošanas apjomus.Dispersijas analīze pētījuma veicējamdod iespēju argumentēt un aizstāvēt savu viedokli savu pētījumu rezultātu apstrādē un analīzē.

Autori darbā raksturos dispersijas analīzes būtību, skaidros vienfaktora dispersijas analīzi, daudzfaktoru dispersijas analīzi, kā arī sniegs ieskatu galvenajās atšķirības starp tām.

Dispersijas analīzes raksturojums

Dispersija ir izkliedes rādītājs, kas apraksta vidējo kvadrātisko novirzi no aritmētiskā vidējā. Pazīmes izkliede ap vidējo vērtību raksturo pazīmes stabilitāti. Pazīme ar mazāku izkliedi ir stabilāka. Dispersijas mērvienība ir sākotnējo datu mērvienības kvadrāts, un tai nav reālas ekonomiskās interpretācijas. Dispersija ir svarīgs starprezultāts citu ekonomiski interpretējamu variācijas rādītāju aprēķināšanai, kā arī variācijas pakāpes salīdzinošai novērtēšanai dažādās kopās vai vienas kopas daļās. Tā kā dispersijai nevar rast ekonomisku interpretāciju, tad no dispersijas aprēķinu rezultātā iegūst standartnovirzi un variācijas koeficientu.

Dispersijas analīze ir metode, ar kuru tiek pētīta kādas pazīmes dispersija, sadalot to sastāvdaļās (komponentēs) un salīdzinot tās. Metode pamatā tiek izmantota statistisko hipotēžu pārbaudei un secinājumu matemātiskai argumentācijai. Dispersiju analīzes priekšrocība ir iespēja pārbaudīt hipotēzes par vairāku izlašu (grupu) līdzību vai atšķirību. Ja, piemēram, patstāvīgu novērojumu rezultātā ir savākti dati par noteiktām kopas daļām, tad ar dispersijas analīzi iespējams pārbaudīt hipotēzes par to, vai eksistē sakarības starp dažādām pazīmēm, pēc kurām veikta grupēšana un kāds ir šo sakarību raksturs.

Pazīmes tiek iedalītas faktoriālajās un rezultatīvajās pazīmēs. Rezultatīvā pazīme (Y) ir pazīme, kuras skaitlisko vērtību variācija atkarīga no citu pazīmju ietekmes, savukārt faktoriālā pazīme (X) ir pazīme, kura nosaka rezultatīvās pazīmes reakciju.

Komponentes, kuru kvalitatīvās vai kvantitatīvās pazīmes izraisa pētāmās jeb rezultatīvās pazīmesizmaiņas, sauc par faktoriem. Dažādu faktoru ietekme uz pētāmo pazīmi parasti nav vienāda. Katrāfaktoru kompleksā ir iespējams izdalīt vienu vai vairākus faktorus, kuru ietekme ir nozīmīga. Dispersiju analīzi izmanto, lai noskaidrotu, kāda un cik būtiska ir faktoru ietekme uz rezultatīvo pazīmi. Pētāmos faktorus izvēlas pētījuma veicējs. Atkarībā no izvēlēto vienlaikus pētāmo faktoru skaita iespējams izdalīt vienfaktora (ANOVA), divfaktoru un daudzfaktoru (MANOVA) dispersiju analīzi. Katru no faktoriem sadala vairākās grupāsjeb līmeņos, ko sauc par faktora gradācijas klasēm un kuru minimālais skaits ir divi. Gradācijas klases ir aprakstāmas kvalitatīvā vai kvantitatīvā veidā.

Var apskatīt piemēru par jogurta lietotājiem. Tiek izdalīti lietotāji, kas jogurtu uzturā lieto regulāri, vidēji bieži, reti, vai nelieto vispār – šo rādītāju aptaujās parasti apraksta ar Likerta skalu. Šādā pētījumā nulles hipotēze paredz, ka izvēlē par labu konkrētajam zīmolam starp četrām lietotāju grupām nozīmīgas atšķirības nepastāv.Ja kāda faktora iedarbība nav būtiska, tad būtiska nav arī starpība starp šī faktora gradācijas klasēmun nulles hipotēze netiek noraidīta. Ja faktora iedarbība ir būtiska, nulles hipotēze tiek noraidīta, un gradācijas klases nepieder vienai ģenerālkopai. Starp gradācijas klašu iespējamajām starpībām vismaz viena vai vairākas ir būtiskas.

Dispersiju analīzes vienkāršākajā gadījumā tiek izvēlēts viens atkarīgais mainīgais (izvēle par labu konkrēta zīmola jogurtam), kā arī viens vai vairāki neatkarīgie mainīgie jeb faktori (piemēram, produkta lietošanas biežums – regulāri, vidēji bieži, reti, nemaz). Vienfaktora dispersiju analīzē tiek apskatīts tikai viens faktors, savukārt, ja apskata divus vai vairākus faktorus (lietošanas biežums, lojalitāte, attieksme utt.), tad tiek veikta daudzfaktoru dispersiju analīze.

Pētnieki dispersiju analīzi galvenokārt izmanto aptauju rezultātu apstrādei. Piemēram, mārketinga pētījumos metode ļauj atbildēt uz sekojošiem jautājumiem:

  • Vai dažādos pircēju segmentos atšķiras noteikta produkta patērētais apjoms?
  • Vai skatītāji, kas redzējuši dažādas reklāmas, sniedz atšķirīgu zīmola vērtējumu?
  • Vai konkrēta zīmola lietotājiem, bijušajiem lietotājiem un lietotājiem, kas nelieto zīmolu, ir atšķirīga attieksme pret zīmolu?
  • Kā dažādi cenu līmeņi ietekmē pircēju lēmumu iegādāties noteikta zīmola produktu?
  • u.c.

Lai sekmīgi veiktu dispersiju analīzi, jāievēro sekojoši priekšnosacījumi:

  • salīdzināmie dati veido nejaušu izlasi
  • gradācijas klasēm jābūt neatkarīgām
  • gradācijas klasēm jāatbilst normālajam sadalījumam
  • gradācijas klašu dispersijām jābūt aptuveni vienādām

Kā iepriekš tika aprakstīts, dispersiju analīzi veic, izdarot analītisko grupēšanu, statistisko kopu sagrupējot un par katru grupu aprēķinot kādas citas pazīmes vidējo lielumu. Grupējums dod iespēju konstatēt, vai starp pazīmēm eksistē sakarības un kāds ir šo sakarību raksturs. Pazīmes variāciju iespējams pētīt ne tikai visai kopai, bet arī atsevišķām kopas grupām, kā arī sakarības starp grupām. Variācijas radītāju pētīšanu veic, aprēķinot un analizējot dažāda veida dispersijas. Ja statistiskais grupējums veikts pēc faktoriālās pazīmes, tad dispersiju analīzē izmantoto šādas dispersijas:

1. Kopējā jeb parastā dispersija – pēta pazīmes variāciju visai kopai, kuru ietekmē visi faktori (datu variācija ap visas kopas aritmētisko vidējo)

Dispersijas analize 1

2. Izskaidrotā jeb starpgrupu dispersija – raksturo pētāmās pazīmes lieluma atšķirības, kas rodas grupēšanas pamatā ietvertās pazīmes jeb faktora ietekmē (grupu aritmētisko vidējo variācija ap visas kopas aritmētisko vidējo)

Dispersijas analize 2

3. Neizskaidrotā jeb iekšgrupu dispersija – parāda variācijas daļu, kas radusies vērā neņemtu faktoru ietekmē un nav atkarīga no grupēšanas pamatā ieliktās pazīmes (mainīgā lieluma vērtību variācija ap attiecīgo grupu vidējiem)

Neizskaidrotā jeb iekšgrupu dispersija 56

Formulās izmantotie apzīmējumi:

Formulās izmantotie apzīmējumi

 Gadījumos, kad izskaidrotā dispersija ir relatīvi liela, turpretim neizskaidrotā – maza, uzskatāms, ka grupēšanas pazīme ir cieši saistīta ar pazīmi, kuras dispersija tiek analizēta un otrādi. Tādejādi var secināt, ka dispersijas analīzi var izmantot sakarību statistiskās nozīmības pētīšanai, noskaidrojot, vai sakarības ir nozīmīgas vai arī tās radušās gadījuma rakstura cēloņu rezultātā.

Izskaidrotās (starpgrupu) un neizskaidrotās (iekšgrupu) dispersijas summa ir vienāda ar kopējo dispersiju, attiecīgi, ja zināmas divas no trijām dispersijām, tad, balstoties uz šo sakarību (pazīmes daļas dispersiju saskaitīšanas teorēma jeb dispersiju saskaitīšanas likums), vienmēr var aprēķināt atlikušo dispersiju.

Ārzemju literatūrā variācijas rādītāju aprakstīšanā bieži vien tiek uzrādīti arī starprezultāti, kur galvenokārt figurē noviržu kvadrātu summu aprēķins. Noviržu kvadrātu summas apzīmē vienkāršoti kā SSt, SSb un SSw(sum of squares -total, between, within) vai SStotal, SSexplained un SSerror(sum of squares -total, explained, error), kas būtībā ir jau iepriekš aprakstītās dispersijas, nedalītas ar brīvības pakāpju skaitu (n-1, k-1 un n-k). Dispersijas savukārt apzīmē ar MS (MeanSquare) un katras dispersijas attiecīgajiem indeksiem.

Vienfaktora dispersijas analīze

            Vienfaktora dispersiju analīzē sākotnēji veic noviržu kvadrātu summas un brīvības pakāpju skaita sadalīšanu komponentēs, tad seko dispersiju aprēķināšana uz vienu brīvības pakāpi. Beigās tiek noteikta F dispersiju attiecība un tiek meklēta F robežvērtība matemātiskajās tabulās, ņemot vērā konkrētajā situācijā vēlamo nozīmības līmeni. Empīrisko F  attiecību salīdzina ar kritisko robežu un pieņem lēmumu hipotēzi pieņemt vai noraidīt. Lai noteiktu F vērtību, nepieciešams arī noskaidrot iekšgrupu un starpgrupu brīvības pakāpju skaitu.

Tiks apskatīts konkrēts piemērs par to, kā reklāmas pasākumi ietekmē lielveikala pārdošanas apjomus. Reklāmas apjoms tiek raksturots trijos līmeņos – augsts, vidējs un zems. Pētījumā nejaušas izlases veidā tiek izvēlēti 15 veikali un 5 veikali pēc nejaušības principa tiek pakļauti noteiktai situācijai – tiek izmantoti dažādi reklāmas apjomi. Iegūtos rezultātus apstrādā un rezultējošo pazīmi (pārdošanas apjomu) sadala skalā no 1 līdz 10. Tabulā uzrādīti iegūtie pārdošanas rezultāti pēc datu apstrādes:

Vienfaktora dispersijas analīzes piemērs
Tiek izvirzīta nulles hipotēze, ka grupu aritmētiskie vidējie neatšķiras statistiski nozīmīgi, respektīvi – reklāmas apjoms būtiski neietekmē lielveikalu pārdošanas apjomu. Lai veiktu šīs hipotēzes pārbaudi, vispirms ir jāaprēķina variācijas rādītāji – starpgrupu, iekšgrupu un kopējo kvadrātu summu, kā arī jānosaka brīvības pakāpju skaits, lai varētu iegūt dispersiju vērtības.
Variācijas rādītāji

Kā redzams tabulā, kopējā noviržu kvadrātu summa iegūta, saskaitot starpgrupu un iekšgrupu kvadrātu summas. Tādejādi ir iespējams noskaidrot, cik lielā mērā faktoriālā pazīme (reklāmas apjoms) izskaidro rezultatīvo pazīmi (pārdošanas apjoms). Dalot starpgrupu kvadrātu summu ar kopējo kvadrātu summu, noskaidrojas, ka 71,4% gadījumu reklāmas apjoms izskaidro pārdošanas apjomu (η2=70/98=0,714). Tas norāda uz samērā būtisku faktora ietekmi.

Dalot noviržu kvadrātu summas ar brīvības pakāpju skaitu, iespējams aprēķināt attiecīgās starpgrupu un iekšgrupu dispersijas. Pēc tam dalot starpgrupu dispersiju ar iekšgrupu dispersiju tiek noteikts Fišera kritērija vērtējums (15.0).

Fišera kritērija mērijums

Empīrisko F  attiecību salīdzina ar kritisko robežu, ko atrod statistiskajā tabulā (brīvības pakāpju skaiti ir 2 un 12, par nozīmības līmeni pieņem α=0,05). Kritiskā robežvērtība F tabulā ir 3.89, un tā kā aprēķinātā empīriskā vērtība ir lielāka (15.0>3.89), tātad nulles hipotēze tiek noraidīta. Ja hipotēzi noraida, tad faktoriālās pazīmes ietekme uz rezultatīvo pazīmi tiek atzīta par būtisku. Citiem vārdiem sakot, rezultatīvās pazīmes vidējā vērtība katras atsevišķās faktoriālās pazīmes kategorijas ietekmē iegūst atšķirīgu vērtību.

            No dotā piemēra var secināt, ka reklāmas apjoma ietekme uz lielveikalu pārdošanas apjomu ir statistiski nozīmīga. Relatīvie grupu vidējo rādītāju lielumi attiecīgi norāda uz sakarību, ka augstāks reklāmas apjoms nodrošina lielākus pārdošanas apjomus (pie dažādiem reklāmas apjomiem vidējie pārdošanas apjomi ir attiecīgi – 9, 5 un 4).

Vienfaktora dispersijas analīzes pielietojums ir visai plašs. Izmantojot vienfaktora dispersijas analīzi mārketinga pētījumos var iegūt sekojošu informāciju, piemēram:

1.      Kā pircēja vēlme iegādāties noteikto produktu mainās, ja tiek pazemināta vai palielināta cena;

2.      Kā produkta sadales kanālu maiņa ietekmē produkta pārdošanas apjomus;

3.      Kā reklāmu kampaņas ietekmē produkta pārdošanas apjomus;

4.      Vai ienākumu līmenis ietekmē produkta vai pakalpojuma pārdošanas apjomus;

5.      u.t.t

Darba turpinājumā autori skaidros daudzfaktoru dispersijas analīzes būtību.

Daudzfaktoru dispersijas analīze (MANOVA)

Daudzfaktoru dispersijas analīze atšķirībā no vienfaktora dispersijas analīzes pēta nevis viena faktora iedarbību uz pētāmo pazīmi, bet divu vai vairāku faktoru vienlaicīgu iedarbību uz pētāmo pazīmi.

Daudzfaktoru dispersijas analīzes būtība ir noskaidrot cik lielā mērā pētāmo pazīmi ietekmē citi faktori.Ja kāda faktora ietekme ir būtiska, tad nulles hipotēze tiek noraidīta, kas nozīmē, ka starp kādām gradācijas klasēm pastāv būtiskas atšķirības.Daudzfaktoru dispersijas analīze ir salīdzinājumā ar vienfaktora dispersijas analīzi ir sarežģītāka, jo katrai dispersijas komponentei ir jārēķina sava F attiecība.

Lai labāk izprastu daudzfaktoru dispersijas analīzes piemērošanas iespēju apskatīsim sekojošu piemēru: pieņemsim, ka 4 četrām grupām, kurās katrā ir pa 100 brīvi izvēlētiem cilvēkiem pētījuma ietvaros katrai grupai ir jānoskatās viena no 4 BMW 1. sērijas reklāmām. Vēlāk katras grupas loceklim ir jāaizpilda anketa par to, kā viņam patika redzētā reklāma un ko viņš vispār domā par BMW 1. sērijas automašīnām. Izmantojot iegūtos datus un daudzfaktoru dispersijas analīzi ir iespējams noteikt, kura no reklāmām ir visefektīvākā. Šis ir viens no piemēriem, kā daudzfaktoru dispersijas analīzi var izmantot internacionālos mārketinga pētījumos.

Lai veiktu daudzfaktoru analīzi ir nepieciešams iziet cauri sekojošiem posmiem:

1.      Jāsadala noviržu kvadrātu summas Q komponentēs

2.      Jāsadala brīvības pakāpju skaits komponentēs

3.      Jāaprēķina dispersija

4.      Jāaprēķina F attiecības

5.      Nozīmības līmeņa noteikšana

6.      F robežvērtības atrašana F sadalījuma matemātiskajās tabulās

7.      Jāsalīdzina empīriskās jeb aprēķinātās vērtības ar kritiskajām vērtībām un pieņem lēmumu.

Apskatīsim katru no šiem posmiem sīkāk:

1.     Posms. Noviržu kvadrātu summas sadalīšana komponentēs:

            Noviržu kvadrātu summas var aprēķināt izmantojot noviržu metodi vai momentu metodi. Momentu metodes priekšrocība ir tāda, ka izmantojot šo metodi ir iespējams vienkāršot skaitļošanas darbu, bet noviržu metode ir loģiskāk saprotama.

Noviržu kvadrātu summa sadalīšana komponentēs

2. Posms. Brīvības pakāpju skaita sadalīšana komponentēs:

brīvības pakāpju skaita sadalīšana komponentēs

Brīvības pakāpju skaita aprēķināšana pēc šādām formulā:

Brīvības pakāpju skaita aprēķināšana pēc šādām formulā

Noviržu kvadrātu summas dalot ar attiecīgo brīvības pakāpju skatu, atrod dispersijas uz vienu brīvības pakāpi.

Lai aprēķinātu F attiecības ir jādala visas atrastās dispersijas ar atlikušo dispersiju .

 

3. Posms. Attiecīgo dispersiju aprēķināšana:

Kad noviržu kvadrātu summa un brīvības pakāpes ir sadalītas, aprēķina dispersijas uz vienu brīvības pakāpi:

dispersijas uz vienu brīvības pakāpi

Ja nulles hipotēze ir pareiza, tad abām dispersijām, rēķinātām uz vienu brīvības pakāpi ir jābūt aptuveni vienādām jeb noviržu kvadrātu summām QA un QZ ir jābūt aptuveni proporcionālām atbilstošajām brīvības pakāpēm.

Salīdzinot izskaidroto dispersiju faktoram Aun neizskaidroto dispersiju var secināt, vai pazīme, pēc kuras ir izdarīts grupējums nav saistīta ar otru statistisko pazīmi vai ir.Salīdzinot aprēķinātās dispersijas, var spriest, vai noteiktā grupējuma pazīme ir saistīta ar citu statistisko pazīmi, vai nav saistīta ar to, kā arī to, vai tā rezultatīvo pazīmi būtiski ietekmē vai neietekmē.

4. Posms. Empīriskās F(Fišera )attiecības atrašana:

Empīriskās F(Fišera )attiecības atrašana5. Posms. Nozīmības līmeņa noteikšana

Šajā posmā izvēlas nozīmības līmeni alfa (vērtību), ar kuru izpildās hipotēze. Piemēram, alfa= 0,05

 

6. Posms. F robežvērtības atrašana F sadalījuma matemātiskajās tabulās

Šajā posmā izmantojot Fišera matemātiskās sadalījuma tabulas ir jāatrod attiecīgās vērtības.

F robežvērtības atrašana F sadalījuma matemātiskajās tabulās.18

7. Posms. Salīdzina empīriskās jeb aprēķinātās vērtības ar kritiskajām vērtībām un pieņem slēdzienu jeb lēmumu.

Salīdzina empīriskās jeb aprēķinātās vērtības ar kritiskajām vērtībām un pieņem slēdzienu jeb lēmumu
Šajā posmā salīdzina empīrisko F vērtību ar tabulu un pieņem lēmumu vai nulles hipotēze tiek noraidīta vai pieņemta.Ja empīriskā F vērtība ir mazāka vai vienāda ar Fkritisko vērtību, tad nulles hipotēzi pieņem, jeb nevar noraidīt ar noteikto nozīmības līmeni.Ja empīriskā F vērtība ir lielāka nekā F kritiskā vērtībā, tad nulles hipotēzi nepieņem, vai noraida ar noteikto nozīmības līmeni.

 

Izmantotās literatūras un avotu saraksts

 

Grāmatas:

  1. Arhipova I., Bāliņa S. Statistika ar Microsoft Excel ikvienam 1. – Rīga: Datorzinību centrs, 1999 – 133 lpp.
  2. Gilbert A. Churchill, Jr., DawnIacobucci. Marketingresearch: methodologicalfoundations, 9th edition, Mason: South -Westerns, 2005. – 498. – 501. lpp.
  3. Goša Zigrīda, Statistika, Izglītības soļi, Latvijas Universitāte, 2003. – 160. – 161. lpp.
  4. KentRay, MarketingResearch, Approaches, MethodsandapplicationsinEurope, ThomsonLearning, 2007. – 386.- 388. lpp.
  5. Krastiņš O., Ciemiņa I. Statistika. Rīga: LR Centrālā statistikas pārvalde, 2003. – 191.lpp
  6. Krastiņš Oļģerts, Ciemiņa Inta – Statistika. Mācību grāmata augstskolām, LR CSP, Rīga, 2003. – 178. – 189. lpp.
  7. MalhotraNaresh K., David F. Birks. Marketingresearch: anappliedapproach, 3rd Edition, Harlow: Prentice-Hall/FinancialTimes, 2007, 545. – 555. lpp.
  8. MalhotraNaresh K., Peterson Mark, BasicMarketingresearch: a decision-makingapproach, 2nd edition, PearsonEducation, 2006. – 476. – 480. lpp.
  9. McDanielCarl, GatesRoger, MarketingResearch, SeventhEdition, JohnWiley&Sons, 2007. – 502. – 507. lpp.
  10. Naresh K. Malhotra, David F. Birks. MarketingResearch. – PrenticeHill, 2007 – 555. – 566. lpp.
  11. RayKent. Marketinga Research: Approaches, MethodsandApplicationsinEurope. – ThomsonLearning, 2007 – 417. lpp
  12. Yang, KaiTrewn, Jayant. MultivariateStatisticalMethodsinQualityManagement. – McGraw – Hill Professional Publishing, 2004. – 90. lpp.
    1. Elferts Didzis, Korelācijas analīze, Pieejams: ftp://www.bf.lu.lv/grozs/Datorlietas/Biometrija/Prezentacijas/9_tema_Korelacijas_analize_2011.pdf, (skatīts: 01.06.2011.)

 

Interneta resursi:

  1. ftp://www.bf.lu.lv/grozs/Datorlietas/Biometrija/Prezentacijas/9_tema_Korelacijas_analize_2011.pdf, (skatīts: 01.06.2011.)
  2. HarlandBryant, TheAdvantages of MANOVA Over ANOVA, pieejams: http://www.ehow.com/info_8291160_advantages-manova-over-anova.html (skatīts: 01.06.2011)
  3. Pavļenko Oksana, Lekciju materiāli statistikā, RTU DITF, Varbūtības teorijas un matemātiskās statistikas katedra, pieejams: http://mspi.itl.rtu.lv/Pavlenko/materiali/Statistika/2lekcija.pdf (skatīts: 01.06.2011.)
  4. Teibe Uldis, Berķis Uldis, Varbūtību teorijas un matemātiskās statistikas elementi medicīnas studentiem, LMA/RSU, Rīga, 2001, Pieejams: http://spg.saldus.lv/dokumenti/Gramata.pdf?1274120101, (skatīts: 02.06.2011.)

POST A COMMENT