teorinë dhe statistikat e probabilitetit, varianca ose dispersioni është shamngia në katror nga mesatarja e një ndryshoreje rasti . Varianca shpesh përkufizohet gjithashtu si katrori i devijimit standard . Varianca është një matëse e shpërndarjes, që do të thotë se është një matëse se sa larg është shpërndarë një grup numrash nga vlera e tyre mesatare. Është momenti i dytë qendror i një shpërndarjeje, dhe kovarianca e ndryshores së rastësishme me vetveten, dhe shpesh përfaqësohet nga , , , , ose . [1]

Shembull i zgjedhjeve nga dy popullata me të njëjtën mesatare por varianca të ndryshme. Popullata e kuqe e ka mesataren 100 dhe variancën 100 (D.S=10) ndërsa popullata blu ka mesataren 100 dhe variancën 2500 (D.S=50).

Një avantazh i dispersionit si masë e shpërndarjes është se është më i përshtatshëm për manipulimin algjebrik sesa masat e tjera të shpërndarjes, siç është devijimi absolut i pritur ; për shembull, varianca e një shume ndryshoresh rasti të pakorreluara është e barabartë me shumën e variancave të tyre. Një disavantazh i dispersionit në zbatime praktike është se, ndryshe nga devijimi standard, njësitë e tij ndryshojnë nga ajo e n.r, kjo është arsyeja pse devijimi standard raportohet më shpesh si një masë e shpërndarjes pasi përfundon llogaritja.

Ka dy koncepte të ndryshme që emërtohen të dyja "variancë". Njëra, siç u diskutua më lart, është pjesë e një shpërndarjeje teorike probabiliteti dhe përcaktohet nga një ekuacion. Varianca tjetër është një karakteristikë e një grupi vëzhgimesh. Kur varianca llogaritet nga vëzhgimet, ato vëzhgime zakonisht maten nga një sistem i botës reale. Nëse të gjitha rezultatet e mundshme të sistemit janë të pranishme, atëherë varianca e llogaritur quhet variancë e popullsisë. Normalisht, megjithatë, vetëm një nëngrup është i gatshëm dhe varianca e llogaritur nga kjo mënyrë quhet variancë e mostrës. Varianca e llogaritur nga një kampion konsiderohet si një vlerësim i variancës së plotë të popullsisë. Ka shumë mënyra për të llogaritur një vlerësim të variancës së popullsisë, siç diskutohet në seksionin më poshtë.

Përkufizimi

Redakto

Varianca e një ndryshoreje rasti   është vlera e pritur e devijimit nga mesatarja në katror e  ,   :

 

Ky përkufizim përfshin ndryshore rasti që krijohen nga procese që janë diskrete, të vazhdueshme, as ose të përziera. Varianca mund të konsiderohet gjithashtu si kovarianca e një ndryshoreje të rastësishme me vetveten:

 

Një tjetër formulë për dispersionin merret si më poshtë:

 

Me fjalë të tjera, varianca e X është e barabartë me mesataren e n.r   të ngritur në katror minus katrorin e mesatares së  . Ky ekuacion nuk duhet të përdoret për llogaritjet duke përdorur aritmetikën me pikë lundruese, sepse vuan nga anulimi katastrofik nëse dy komponentët e ekuacionit janë të ngjashëm në madhësi. Për alternativa të tjera numerikisht të qëndrueshme, shihni Algoritmet për llogaritjen e variancës .

Ndryshore e rastit diskrete

Redakto

Nëse ndryshorja e rastit   është diskrete me funksion mase probabiliteti  , atëherë

 

ku   është vlera e pritur. Kjo është,

 

Varianca e një bashkësie të   vlerash njëlloj të mundshme shkruhet edhe si:

 

ku   është vlera mesatare. Kjo është,

 

Ndryshoret e rastit absolutisht të vazhdueshme

Redakto

Nëse ndryshorja e rastit   ka një funksion të densitetit të probabilitetit  , dhe   është funksioni përkatës i shpërndarjes mbledhëse, atëherë

 

ose në mënyrë të njëvlershme,

 

Shembuj

Redakto

Shpërndarja eksponenciale

Redakto

Shpërndarja eksponenciale me parametërrin   është një shpërndarje e vazhdueshme, funksioni i densitetit të probabilitetit të së cilës është dhënë nga

 

në intervalin [0, ∞ ) . Mesatarja e kësaj shpërndarje mund të tregohet se është

 

Duke përdorur integrimin me pjesë dhe duke përdorur pritje matematike tashmë të llogaritur, ne kemi:

 

Kështu, varianca e   jepet nga

 

Zari i drejtë

Redakto

Hedhja e një zari të drejtë mund të modelohet si n.r diskrete,  , me rezultate nga 1 deri tek 6, secila me probabilitet të njëjtë 1/6. Pritja matematike e   është  Kështu që, varianca e   është

 

Shpërndarjet e probabilitetit të përdorura zakonisht

Redakto
Emri i shpërndarjes së probabilitetit Funksioni i shpërndarjes së probabilitetit Mesatarja Varianca
Shpërndarja binomiale      
Shpërndarja gjeometrike      
Shpërndarja normale      
Shpërndarja uniforme (e vazhdueshme)      
Shpërndarja eksponenciale      
Shpërndarja Poisson      

Vetitë

Redakto

Vetitë themelore

Redakto

Varianca është jo negative sepse madhësitë e ngritura në katror janë gjithmonë pozitive ose zero:

 

Varianca e një konstante është zero.

 

Çështja e pafundësisë

Redakto

Nëse një shpërndarje nuk ka pritje matematike të fundme, siç është rasti për shpërndarjen Cauchy, atëherë edhe varianca nuk mund të jetë e fundme. Megjithatë, disa shpërndarje mund të mos kenë një variancë të fundme, pavarësisht se pritja matematike është e fundme. Një shembull i tillë është një shpërndarje Pareto, indeksi i së cilës   plotëson kushtin  

Njësitë matëse

Redakto

Ndryshe nga devijimi absolut i pritur, varianca e një ndryshore ka njësi që janë katrori i njësive të vetë ndryshores. Për shembull, një ndryshore e matur në metra do të ketë një variancë të matur në metra katrorë. Për këtë arsye, përshkrimi i grupeve të të dhënave nëpërmjet devijimit të tyre standard ose devijimit mesatar katror nën rrënjë shpesh preferohet ndaj përdorimit të variancës. Në shembullin e zareve, devijimi standard është  , pak më i madh se devijimi absolut i pritur, 1.5.

Përhapja

Redakto

Mbledhja dhe shumëzimi me një konstante

Redakto

Varianca është e pandjeshme ndaj ndryshimeve në një parametër vendndodhjeje . Kjo do të thotë se nëse një konstante u shtohet të gjitha vlerave të ndryshores, varianca mbetet e pandryshuar:

 

Nëse të gjitha vlerat shkallëzohen me një konstante, varianca shkallëzohet me katrorin e asaj konstante:

 

Varianca e shumës së dy ndryshoreve të rastit jepet nga barazimi

 
 

ku   është kovarianca dhe   është devijimi standard i  .

Kombinimet lineare

Redakto

Në përgjithësi, për shumën e   ndryshoreve të rastit  , varianca gjendet si:

 

Këto rezultate çojnë në variancën e një kombinimi linear të gjetur si:

 

Nëse ndryshoret e rastit   janë të tilla që

 

atëherë thuhet se janë të pakorreluara . Kështu që për to mund të shkruhet:

 

Prodhimi ndryshoreve

Redakto

Prodhimi i ndryshoreve të pavarura

Redakto

Nëse dy ndryshore   dhe   janë të pavarura, varianca e prodhimit të tyre jepet nga [2]

 

Në mënyrë të njëvlerëshme, duke përdorur vetitë themelore të pritjes matematike, ajo jepet nga

 

Produkt i ndryshoreve statistikisht të varura

Redakto
 

Varianca e popullatës dhe varianca e zgjedhjes/kampionimit

Redakto

Vëzhgimet e botës reale të tilla si matjet e shiut të djeshëm gjatë gjithë ditës zakonisht nuk mund të jenë grupe të plota të të gjitha vëzhgimeve të mundshme. Si e tillë, varianca e llogaritur nga bashkësia e fundme në përgjithësi nuk do të përputhet me variancën që do të ishte llogaritur nga popullata e plotë e vëzhgimeve të mundshme. Kjo do të thotë që vlerësohet mesatarja dhe varianca nga një bashkësi e kufizuar vëzhgimesh duke përdorur një ekuacion vlerësues . Vlerësuesi është një funksion i zgjedhjes së   vëzhgimeve të nxjerra pa paragjykime vëzhguese nga e gjithë popullata e vëzhgimeve të mundshme. Në këtë shembull ajo zgjedhje do të ishte grupi i matjeve të reshjeve të djeshme nga matësat në gatishmëri.

Vlerësuesit më të thjeshtë për mesataren e popullsisë dhe variancën e popullsisë janë thjesht mesatarja dhe varianca e zgjedhjes/kampionit, mesatarja e zgjedhjes dhe varianca (e pakorrigjuar) e zgjedhjes- këta janë vlerësues të qëndrueshëm (ata konvergjojnë në vlerën e saktë teksa numri i zgjedhjeve rritet), por mund të të përmirësohet. Vlerësimi i variancës së popullatës duke marrë variancën e zgjedhjes është afër optimales në përgjithësi, por mund të përmirësohet në dy mënyra. Më thjeshtë, varianca e kampionit llogaritet si një mesatare e devijimeve në katror rreth mesatares (së kampionit), duke e pjesëtuar me  . Megjithatë, përdorimi i vlerave të tjera përveç   përmirëson vlerësuesin në mënyra të ndryshme. Katër vlera për emëruesin janë  ,  ,  , dhe  :   është më e thjeshta (varianca e popullsisë së kampionit),   eliminon paragjykimet,   minimizon gabimin mesatar në katror për shpërndarjen normale, dhe   më së shumti eliminon zjvendosjet/anësinë në vlerësimin e paanshëm të devijimit standard për shpërndarjen normale.

Varianca e popullsisë

Redakto

Në përgjithësi, varianca e popullsisë së një popullatefundme me madhësi   me vlera   jepet nga

 

ku mesatarja e popullësisë është

 

Varianca e popullsisë gjithashtu mund të llogaritet duke përdorur

 

Varianca e kampionit

Redakto

Varianca e pazhvendosur e kampionit

Redakto

Në shumë situata praktike, varianca e vërtetë e një popullate nuk dihet apriori dhe duhet të llogaritet sipas ndonjë mënyre. Kur kemi të bëjmë me popullata jashtëzakonisht të mëdha, nuk është e mundur të numërohet çdo objekt i popullatës, kështu që llogaritja duhet të kryhet në një zgjedhje të popullsisë. [3] Kjo zakonisht quhet variancë e zgjedhjes ose variancë empirike . Varianca e zgjedhjes mund të zbatohet gjithashtu për vlerësimin e variancës së një shpërndarjeje të vazhdueshme nga një kampion i asaj shpërndarjeje.

Marrim një kampion me zëvendësim të   vlerave   nga popullsia, ku  , dhe vlerësojmë variancën në bazë të këtij kampioni. [4] Marrja e drejtpërdrejtë e variancës së të dhënave të mostrës jep mesataren e devijimeve në katror :

 

Këtu,   tregon mesataren e mostrës :

 

Meqenëse Y i zgjidhen rastësisht, të dyja   dhe   janë ndryshore të rastit. Pritjet matematike të tyre mund të vlerësohen duke marrë një mesatare mbi grupin e të gjitha kampioneve të mundshme   me madhësi n nga popullata. Për   kjo jep:

 

Prandaj   jep një vlerësim të variancës së popullatës që është e njëanshme/ e zhvendosur me një faktor prej   . Per kete arsye,   referohet si varianca e mostrës së njëanshme .

Varianca e pazhvendosur e zgjedhjes

Redakto

Korrigjimi për këtë anësi jep variancën e pazhvendosur të mostrës, të shënuar   :

 

Secili vlerësues mund të referohet thjesht si varianca e kampionit kur versioni mund të përcaktohet nga konteksti.

  1. ^ Wasserman, Larry (2005). All of Statistics: a concise course in statistical inference. Springer texts in statistics. fq. 51. ISBN 9781441923226. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  2. ^ Goodman, Leo A. (dhjetor 1960). "On the Exact Variance of Products". Journal of the American Statistical Association. 55 (292): 708–713. doi:10.2307/2281592. JSTOR 2281592. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  3. ^ Navidi, William (2006) Statistics for Engineers and Scientists, McGraw-Hill, p. 14.
  4. ^ Montgomery, D. C. and Runger, G. C. (1994) Applied statistics and probability for engineers, page 201. John Wiley & Sons New York