teorinë e probabilitetit dhe statistikë, shpërndarja hi-katrore (gjithashtu hi-katror ose -shpërndarja ) me shkallë lirie është shpërndarja e një shume të katrorëve të ndryshoreve rasti të pavarura standarde normale. Shpërndarja hi katror është një rast i veçantë i shpërndarjes gama dhe është një nga shpërndarjet më të përdorura të probabilitetit në statistikat konkluzive, veçanërisht në testimin e hipotezave dhe në ndërtimin e intervaleve të besimit . [2] [3] [4] Kjo shpërndarje quhet nganjëherë shpërndarja qendrore hi-katrore, një rast i veçantë i shpërndarjes më të përgjithshme joqendrore hi-katrore .

Hi katror
Probability density function
Cumulative distribution function
Simboli ose
Parametrat (e njohur edhe si "shkallë lirie")
Mbështetës nëse , përndryshe
FDGJ
FGSH
Vlera e pritur
Mediana
Moda
Varianca
Shtrirja
Kurtoza e tepërt
Entropia
FGJM
FK[1]
FGJGJ

Shpërndarja hi-katrore përdoret kryesisht në testimin e hipotezave dhe në një masë më të vogël për intervalet e besimit për variancën e popullatës kur shpërndarja themelore është normale. Ndryshe nga shpërndarjet më të njohura si shpërndarja normale dhe shpërndarja eksponenciale, shpërndarja hi-katrore nuk përdoret aq shpesh në modelimin e drejtpërdrejtë të dukurive natyrore. Ajo lind në testet e hipotezave të mëposhtme, ndër të tjera:

Përkufizimet

Redakto

Nëse   janë ndryshore rasti normale standarde të pavarura, atëherë shuma e katrorëve të tyre,

 

shpërndahet sipas shpërndarjes hi-katrore me   shkallë lirie. Kjo zakonisht shënohet si

 

Shpërndarja hi-katrore ka një parametër: një numër i plotë pozitiv   që specifikon numrin e shkallëve të lirisë (numrin e ndryshoreve të rastit që mblidhen).

Paraqitje

Redakto

Shpërndarja hi-katrore përdoret kryesisht në testimin e hipotezave dhe në një masë më të vogël për intervalet e besimit për variancën e popullatës kur shpërndarja e saj është normale. Ndryshe nga shpërndarjet më të njohura si shpërndarja normale dhe shpërndarja eksponenciale, shpërndarja hi-katrore nuk përdoret aq shpesh në modelimin e drejtpërdrejtë të fenomeneve natyrore. Ajo lind në testet e hipotezave të mëposhtme, ndër të tjera:

  • Testi hi-katror i pavarësisë në tabelat e kontigjencës
  • Testi hi-katror i përshtatshmërisë së të dhënave të vëzhguara me shpërndarjet hipotetike
  • Testi i raportit të përgjasisë për modelet e folezuara
  • Testi log-rank në analizën e mbijetesës
  • Testi Cochran–Mantel–Haenszel për tabelat e shtresuara të kontigjencës
  • Testi Wald
  • Testi i rezultateve

Është gjithashtu një përbërës i përkufizimit të shpërndarjes t dhe shpërndarjes F të përdorur në testet t, analizën e variancës dhe analizën e regresionit.

Supozoni se   është një ndryshore e rastit e kampionuar nga shpërndarja normale standarde, ku mesatarja është   dhe varianca është   :   . Tani, merrni parasysh ndryshoren e rastit   . Shpërndarja e ndryshores së rastit   është një shembull i një shpërndarjeje hi-katrore:   . Nënshkrimi 1 tregon se kjo shpërndarje e veçantë hi-katrore është ndërtuar nga vetëm 1 shpërndarje normale standarde. Një shpërndarje hi-katrore e ndërtuar duke ngritur në katror një shpërndarje normale standarde të vetme thuhet se ka 1 shkallë lirie. Kështu, ndërsa madhësia e kampionit për një test hipoteze rritet, shpërndarja e statistikave të testit i afrohet një shpërndarjeje normale. Ashtu si vlerat ekstreme të shpërndarjes normale kanë probabilitet të ulët (dhe japin vlera të vogla p), vlerat ekstreme të shpërndarjes hi-katrore kanë probabilitet të ulët.

Një arsye shtesë që shpërndarja hi-katrore përdoret gjerësisht është se ajo shfaqet si shpërndarja e kampionit të madh të testeve të raportit të përgjithësuar të përgjasisë (LRT). [5] LRT-të kanë disa veti të dëshirueshme; në veçanti, LRT-të e thjeshta zakonisht ofrojnë fuqinë më të lartë për të refuzuar hipotezën zero ( lema Neyman–Pearson ) dhe kjo çon gjithashtu në vetitë optimale të LRT-ve të përgjithësuara. Megjithatë, përafrimet normale dhe hi-katrore janë të vlefshme vetëm në mënyrë asimptotike. Për këtë arsye, është e preferueshme të përdoret shpërndarja t në vend të përafrimit normal ose përafrimit hi-katror për një madhësi të vogël kampioni. Në mënyrë të ngjashme, në analizat e tabelave të kontigjencës, përafrimi sipas hi-katror do të jetë i dobët për një madhësi të vogël kampioni dhe preferohet të përdoret testi i saktë i Fisher-it . Ramsey tregon se testi i saktë binomial është gjithmonë më i fuqishëm se përafrimi normal. [6]

Lancaster tregon lidhjet midis shpërndarjeve binomiale, normale dhe hi-katrore, si më poshtë. [7] De Moivre dhe Laplace vërtetuan se një shpërndarje binomiale mund të përafrohet me një shpërndarje normale. Konkretisht ata treguan normalitetin asimptotik të ndryshores së rastit

 

ku   është numri i vëzhguar i sukseseve në   prova, ku është probabiliteti i suksesit  , dhe   .

Ngritja në katror e të dyja anëve të ekuacionit jep

 

Duke përdorur  ,  , dhe  , ky ekuacion mund të rishkruhet si

 

Shprehja në të djathtë është e formës që Karl Pearson do ta përgjithësonte në formën

 


  = Statistika e testit kumulativ të Pearson-it, e cila në mënyrë asimptotike i afrohet a   shpërndarja;

  = numri i vëzhgimeve të llojit   ;

  = frekuenca e pritur (teorike) e tipit  , e pohuar nga hipoteza zero se thyesa e tipit   në popullatë është   ;

dhe   = numri i qelizave në tabelë.

Funksioni i dendësisë së probabilitetit

Redakto

Funksioni i dendësisë së probabilitetit (FDP) i shpërndarjes hi-katrore është

 

ku   tregon funksionin gama, i cili ka vlera të formës së mbyllur për numrin e plotë <span about="#mwt180" class="mwe-math-element" data-mw="{&quot;name&quot;:&quot;math&quot;,&quot;attrs&quot;:{},&quot;body&quot;:{&quot;extsrc&quot;:&quot;k&quot;}}" id="7" typeof="mw:Extension/math"><span class="mwe-math-mathml-inline mwe-math-mathml-a11y" style="display: none;"><math xmlns="http://www.w3.org/1998/Math/MathML"> <semantics> <mrow class="MJX-TeXAtom-ORD"> <mstyle displaystyle="true" scriptlevel="0"> <mi>k</mi> </mstyle> </mrow> <annotation encoding="application/x-tex">{\displaystyle k}</annotation> </semantics> </math></span><img alt="k" aria-hidden="true" class="mwe-math-fallback-image-inline" data-cx="{&quot;adapted&quot;:false}" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/c3c9a2c7b599b37105512c5d570edc034056dd40" style="vertical-align: -0.338ex; width:1.211ex; height:2.176ex;"></span> .

Funksioni mbledhës i shpërndarjes

Redakto
 
Chernoff i kufizuar për FMP dhe bishtin (1-FMP) të një ndryshoreje të rastit hi-katrore me dhjetë shkallë lirie (   )

Funksioni i tij mbledhës i shpërndarjes është:

 

ku   është funksioni më i ulët i gama jo i plotë dhe   është funksioni gama i rregulluar .

Në një rast të veçantë të   Ky funksion ka formën e thjeshtë:

 

Vetitë

Redakto

Teorema e Koçranit

Redakto

Nëse   janë n.r të pavarura të shpërndara në mënyrë identike (iid), standarde normale, atëherë   ku  

Mbledhja

Redakto

Nga përkufizimi i shpërndarjes hi-katrore rezulton se shuma e ndryshoreve të pavarura hi-katrore është gjithashtu e shpërndarë sipas ligjit hi-katror. Konkretisht, nëse   janë ndryshore të pavarura hi-katror me  ,   shkallët e lirisë, përkatësisht, atëherë   është hii-katror i shpërndarë me   shkallë lirie.

Mesatarja e kampionit

Redakto

Mesatarja e kampionit së   iid ndryshoreve hi-katror me   shkallë lirie shpërndahet sipas një shpërndarjeje gama me formë   dhe shkallë   parametrat:

 

Në mënyrë asimptotike, duke pasur parasysh se për një parametër shkallë   duke shkuar në pafundësi, një shpërndarje Gama konvergjon drejt një shpërndarjeje normale me pritje   dhe variancë  , mesatarja e kampionit konvergjon drejt:

 

Përqendrimi

Redakto

Shpërndarja hi-katrore shfaq përqendrim të fortë rreth mesatares së saj. Kufijtë standardë të Laurent-Massart [8] janë:

 
 

Vetitë asimptotike

Redakto
 
Formula e përafërt për mesataren (nga transformimi Wilson–Hilferty) krahasuar me kuantilin numerik (lart); dhe dallimi (blu) dhe ndryshimi relativ (e kuqe) ndërmjet sasisë numerike dhe formulës së përafërt (poshtë). Për shpërndarjen hi-katror, vetëm numrat e plotë pozitiv të shkallëve të lirisë (qarqet) kanë kuptim.

Nga teoremën qëndrore limite, meqenëse shpërndarja hi-katrore është shuma e   variabla të rastit të pavarura me mesatare dhe variancë të fundme, ajo konvergjon në një shpërndarje normale për të mëdha   . Për shumë qëllime praktike, për   shpërndarja është mjaft e afërt me një shpërndarje normale, kështu që ndryshimi është i papërfillshëm. [9] Konkretisht, nëse  , atëherë si   priret drejt pafundësisë, shpërndarja e   priret drejt një shpërndarje normale standarde. Megjithatë, konvergjenca është e ngadaltë siç është edhe anësia   dhe kurtoza e tepërt është   .

Shpërndarja e kampionit të   konvergjon në normalitet shumë më shpejt se shpërndarja e kampionit të  , [10] pasi transformimi logaritmik heq shumë nga asimetria. [11]

Funksionet e tjera të shpërndarjes hi-katror konvergjojnë më shpejt në një shpërndarje normale. Disa shembuj janë:

  • Nëse   atëherë   shpërndahet përafërsisht normalisht me mesatare   dhe variancë njësi (1922, nga RA Fisher, shih (18.23), f. 426 i Johnson. [3]
  • Nëse   atëherë   shpërndahet përafërsisht normalisht me mesatare   dhe variancë   [12] Ky njihet si transformimi Wilson–Hilferty, shih (18.24), f. 426 i Johnson. [3]
    • Ky transformim normalizues çon drejtpërdrejt në përafrimin mesatar të përdorur zakonisht  duke u kthyer prapa nga mesatarja, e cila është edhe mediana, e shpërndarjes normale.

Shpërndarjet e ndërlidhura

Redakto
  • Kur  ,   ( shpërndarje normale )
  •   ( Shpërndarja joqendrore hi-katrore me parametër joqëndror   )
  • Nëse   atëherë   ka shpërndarje hi-katror  
  • Si një rast i veçantë, nëse   atëherë   ka shpërndarje hi-katror  
  •   ( Norma në katror e k ndryshoreve të rastit standarde të shpërndara normalisht është një shpërndarje hi-katrore me k shkallë lirie )
  • Nëse   dhe  , atëherë   . ( shpërndarja gama )
  • Nëse   atëherë   ( shpërndarja hi )
  • Nëse  , atëherë   është një shpërndarje eksponenciale .
  • Nëse  , atëherë   është një shpërndarje Erlang .
  • Nëse  , atëherë  
  • Nëse   ( Shpërndarja Rayleigh ) atëherë  
  • Nëse   ( Shpërndarja Maxwell ) atëherë  
  • Nëse   atëherë   ( Shpërndarja inverse-hi-katrore )
  • Shpërndarja hi-katrore është një rast i veçantë i shpërndarjes Pearson të tipit III
  • Nëse   dhe   janë të pavarur atëherë   ( shpërndarja beta )
  • Nëse   ( shpërndarje uniforme ) atëherë  
  • Nëse   atëherë  
  • Nëse   ndjek shpërndarjen normale të përgjithësuar (lloji 1) me parametra   atëherë   [13]
  • Shpërndarja hi-katrore është një transformim i shpërndarjes Pareto
  • Shpërndarja e studentit është një transformim i shpërndarjes hi-katrore
  • Shpërndarja e studentit mund të merret nga shpërndarja hi-katror dhe shpërndarja normale
  • Shpërndarja joqendrore beta mund të merret si një transformim i shpërndarjes hi-katror dhe shpërndarjes joqendrore hi-katrore
  • Shpërndarja joqendrore t mund të merret nga shpërndarja normale dhe shpërndarja hi-katrore

Një ndryshore hi-katror me   shkallët lirie përkufizohet si shuma e katrorëve të   ndryshoreve rasti të pavarura standarde normale.

Shpërndarja hi-katrore është gjithashtu e lidhur natyrshëm me shpërndarjet e tjera që dalin nga shpërndarja gausiane. Veçanërisht,

  •   është i shpërndarë sipas F,   nëse  , ku   dhe   janë statistikisht të pavarura.
  • Nëse   dhe   janë statistikisht të pavarura atëherë   . Nëse   dhe   nuk janë të pavarura atëherë   nuk shpërndahet sipas hi-katror.

Metodat llogaritëse

Redakto
Shkallët e lirisë (shl)   vlera [14]
1 0,004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.63 10.83
2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.61 5.99 9.21 13.82
3 0.35 0,58 1.01 1.42 2.37 3.66 4.64 6.25 7.81 11.34 16.27
4 0.71 1.06 1.65 2.20 3.36 4.88 5.99 7.78 9.49 13.28 18.47
5 1.14 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 15.09 20.52
6 1.63 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 16.81 22.46
7 2.17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 18.48 24.32
8 2.73 3.49 4.59 5.53 7.34 9.52 11.03 13.36 15.51 20.09 26.12
9 3.32 4.17 5.38 6.39 8.34 10.66 12.24 14.68 16.92 21.67 27.88
10 3.94 4.87 6.18 7.27 9.34 11.78 13.44 15.99 18.31 23.21 29.59
p -vlera (probabiliteti) 0,95 0,90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001
  1. ^ M.A. Sanders. "Characteristic function of the central chi-square distribution" (PDF). Arkivuar nga origjinali (PDF) më 2011-07-15. Marrë më 2009-03-06. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  2. ^ NIST (2006).
  3. ^ a b c Johnson, N. L.; Kotz, S.; Balakrishnan, N. (1994). "Chi-Square Distributions including Chi and Rayleigh". Continuous Univariate Distributions. Vëll. 1 (bot. Second). John Wiley and Sons. fq. 415–493. ISBN 978-0-471-58495-7. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  4. ^ Mood, Alexander; Graybill, Franklin A.; Boes, Duane C. (1974). Introduction to the Theory of Statistics (bot. Third). McGraw-Hill. fq. 241–246. ISBN 978-0-07-042864-5. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  5. ^ Westfall, Peter H. (2013). Understanding Advanced Statistical Methods. Boca Raton, FL: CRC Press. ISBN 978-1-4665-1210-8. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  6. ^ Ramsey, PH (1988). "Evaluating the Normal Approximation to the Binomial Test". Journal of Educational Statistics. 13 (2): 173–82. doi:10.2307/1164752. JSTOR 1164752. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  7. ^ Lancaster, H.O. (1969), The Chi-squared Distribution, Wiley {{citation}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  8. ^ Laurent, B.; Massart, P. (2000-10-01). "Adaptive estimation of a quadratic functional by model selection". The Annals of Statistics. 28 (5). doi:10.1214/aos/1015957395. ISSN 0090-5364. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  9. ^ Box, Hunter and Hunter (1978). Statistics for experimenters. Wiley. fq. 118. ISBN 978-0-471-09315-2. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  10. ^ Bartlett, M. S.; Kendall, D. G. (1946). "The Statistical Analysis of Variance-Heterogeneity and the Logarithmic Transformation". Supplement to the Journal of the Royal Statistical Society. 8 (1): 128–138. doi:10.2307/2983618. JSTOR 2983618. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  11. ^ Pillai, Natesh S. (2016). "An unexpected encounter with Cauchy and Lévy". Annals of Statistics. 44 (5): 2089–2097. arXiv:1505.01957. doi:10.1214/15-aos1407. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  12. ^ Wilson, E. B.; Hilferty, M. M. (1931). "The distribution of chi-squared". Proc. Natl. Acad. Sci. USA. 17 (12): 684–688. Bibcode:1931PNAS...17..684W. doi:10.1073/pnas.17.12.684. PMC 1076144. PMID 16577411. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  13. ^ Bäckström, T.; Fischer, J. (janar 2018). "Fast Randomization for Distributed Low-Bitrate Coding of Speech and Audio". IEEE/ACM Transactions on Audio, Speech, and Language Processing. 26 (1): 19–30. doi:10.1109/TASLP.2017.2757601. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  14. ^ Chi-Squared Test Arkivuar 18 nëntor 2013 tek Wayback Machine Table B.2.