teorinë e probabilitetit dhe statistikë, shpërndarja t e Studentit (ose thjesht shpërndarja t ) është një shpërndarje e vazhdueshme probabiliteti që përgjithëson shpërndarjen normale standarde . Ashtu si kjo e fundit, ajo është simetrike rreth zeros dhe në formë këmbane.

Shpërndarja e Studentit
Probability density function
Cumulative distribution function
Parametrat Shkallët e lirisë (real)
FDGJ
FGSH ku 2F1 është funksioni hipergjeometrik
Vlera e pritur0 për , ndryshe
Mediana0
Moda0
Varianca për , ∞ për , përndryshe e papërcaktuar
Shtrirja0 për , përndryshe e papërcaktuar
Kurtoza e tepërt për , ∞ për , përndryshe e papërcaktuar

Megjithatë, ka bishta më të rëndë dhe sasia e masës së probabilitetit në bishta kontrollohet nga parametri . Për shpërndarja e t Studentit bëhet shpërndarje standarde Cauchy, ndërsa për bëhet shpërndarje normale standarde .

Shpërndarja e studentit luan një rol në një numër analizash statistikore të përdorura gjerësisht, duke përfshirë testin t Student për vlerësimin e rëndësisë statistikore të ndryshesës midis dy mesatareve të mostrës, ndërtimin e intervaleve të besimit për ndryshesën midis dy mesatareve të popullsisë dhe në analiza e regresit linear.

Në formën e shkallës-vendndodhje shpërndarja t ajo përgjithëson shpërndarjen normale dhe gjithashtu lind në analizën Bejesiane të të dhënave nga një familje normale si një shpërndarje e përbërë kur margjinalizohet mbi parametrin e variancës.

ku

Përkufizimi

Redakto

Funksioni i dendësisë së probabilitetit

Redakto

Shpërndarja t e studentit ka funksionin e dendësisë së probabilitetit (PDF) të dhënë nga

 

ku   është numri i shkallëve të lirisë dhe   është funksioni gama. Kjo mund të shkruhet edhe si

 

ku B është funksioni Beta. Në veçanti për shkallët e lirisë me vlerë të plotë   ne kemi:

Për   çift,

 

Për   tek,

 

Funksioni i dendësisë së probabilitetit është simetrik, dhe forma e tij e përgjithshme i ngjan formës së këmbanës me mesatare 0 dhe variancë 1, përveç se është pak më e ulët dhe më e gjerë. Ndërsa numri i shkallëve të lirisë rritet, shpërndarja t i afrohet shpërndarjes normale me mesataren 0 dhe variancën 1. Per kete arsye   njihet edhe si parametri i normalitetit. [1]

 

Funksioni mbledhës i shpërndarjes

Redakto

Funksioni i shpërndarjes mbledhëse (FSHM) mund të shkruhet në termat e I, funksioni beta jo i plotë i rregulluar. Për t > 0,

 

Shpërndarja e Studentit lind në një sërë problemesh të vlerësimit statistikor ku qëllimi është të vlerësohet një parametër i panjohur, si një vlerë mesatare, në një mjedis ku të dhënat vëzhgohen me gabime mbledhëse. Nëse (si në pothuajse të gjitha punët praktike statistikore) devijimi standard i popullatës i këtyre gabimeve është i panjohur dhe duhet të vlerësohet nga të dhënat, shpërndarja t përdoret shpesh për të llogaritur pasigurinë shtesë që rezulton nga ky vlerësim. Në shumicën e problemeve të tilla, nëse dihej shmangia standarde e gabimeve, do të përdorej një shpërndarje normale në vend të shpërndarjes t .

 

Raste të veçanta

Redakto

Vlerat e caktuara të   jepni një formë të thjeshtë për shpërndarjen së Studentit.

  PDF CDF shënime
1     Shih shpërndarjen Cauchy
2    
3    
4    
5    
      Shikoni Shpërndarja normale, Funksioni i gabimit

Vendndodhja-shkalla e shpërndarjes t

Redakto

Shndërrimi i shkallës-vendndodhje

Redakto

Shpërndarja t e studentit përgjithësohet në shpërndarjen e tre parametrave vendndodhje-shkalla t   duke futur një parametër vendndodhjeje   dhe një parametër shkallë   . Me

 

dhe transformimi i familjes në shkallë vendi

 

marrim

 

Raste të veçanta

Redakto
  • Nëse   ndjek një shpërndarje Studenti shkallë-vendndodhje   pastaj për     shpërndahet normalisht   me mesatare   dhe variancë   .
  • Shpërndarja e Studentit shkallë-vendndodhje   me shkallë lirie   është e njëvlerëshme me shpërndarjen Cauchy   .
  • Shpërndarja t -shkallë-vendndodhje   me   dhe   reduktohet në shpërndarjen e Studentit  

Si lind shpërndarja t (karakterizimi)

Redakto

Shpërndarja e mostrës së statistikës Student

Redakto

Shpërndarja t lind si shpërndarja e mostrës së statistikës t . Më poshtë diskutohet statistika t në një kampion, për statistikën t korresponduese me dy mostra shihni T-testin e Studentit .

Vlerësimi i paanshëm i variancës

Redakto

Le   të jenë mostra të pavarura dhe të shpërndara identikisht nga një shpërndarje normale me mesatare   dhe variancë   . Varianca mesatare dhe e paanshme e kampionit jepen nga:

 

Statistika t që rezulton (një mostër) jepet nga

 

dhe shpërndahet sipas një shpërndarjeje që ndjek ligjin e Studentit me   shkallët e lirisë.

Vlerësimi i variancës PM

Redakto

Në vend të vlerësimit të paanshëm   ne gjithashtu mund të përdorim vlerësuesin e përgjasisë maksimale

 

duke dhënë statistikën

 

Kjo shpërndahet sipas shpërndarjes t shkallës-vendndodhje:

 

Përdorimet

Redakto

Në përfundimin statistikor frekuentist

Redakto

Shpërndarja e Studentit lind në një sërë problemesh të vlerësimit statistikor ku qëllimi është të vlerësohet një parametër i panjohur, si një vlerë mesatare, në një mjedis ku të dhënat vëzhgohen me gabime mbledhëse. Nëse (si në pothuajse të gjitha punët praktike statistikore) shmangia standard i popullatës i këtyre gabimeve është i panjohur dhe duhet të vlerësohet nga të dhënat, shpërndarja t përdoret shpesh për të llogaritur pasigurinë shtesë që rezulton nga ky vlerësim. Në shumicën e problemeve të tilla, nëse do të dihej shmangia standarde e gabimeve, do të përdorej një shpërndarje normale në vend të shpërndarjes së Studentit .

Intervalet e besimit dhe testet e hipotezave janë dy procedura statistikore në të cilat kërkohen kuantiljet e shpërndarjes së mostrës së një statistike të caktuar (p.sh. rezultati standard ). Në çdo situatë ku kjo statistikë është një funksion linear i të dhënave, pjesëtuar me vlerësimin e zakonshëm të shmangies standarde, sasia që rezulton mund të rishkallëzohet dhe të përqendrohet për të ndjekur shpërndarjen e Studentit. Analizat statistikore që përfshijnë mesataret, mesataret e ponderuara dhe koeficientët e regresionit të gjitha çojnë në statistika që kanë këtë formë.

Testimi i hipotezave

Redakto

Një numër statistikash mund të tregohet se kanë shpërndarje t-Studenti për mostrat me madhësi mesatare nën hipotezat zero që janë me interes, në mënyrë që shpërndarja e Studentit të formojë bazën për testet e rëndësisë. Për shembull, shpërndarja e koeficientit të korrelacionit të Spearman ρ, në rastin zero (korrelacion zero) përafrohet mirë me shpërndarjen t për madhësitë e mostrës mbi 20. 

Intervalet e besimit

Redakto

Supozoni se numri A është zgjedhur i tillë që

 

kur T ka një shpërndarje Studenti me n − 1 shkallë lirie. Nga simetria, kjo është njësoj si të thuash që A kënaq kushtin

 

pra A është "përqindja 95" e kësaj shpërndarjeje probabiliteti, ose   . Atëherë

 

dhe kjo është e njëvlerëshme me

 

Prandaj, intervali, pikat fundore të të cilit janë

 

është një interval besimi 90% për μ. Prandaj, nëse gjejmë mesataren e një grupi vëzhgimesh që mund të presim në mënyrë të arsyeshme të kemi një shpërndarje normale, mund të përdorim shpërndarjen e Studentit për të shqyrtuar nëse kufijtë e besimit në atë mesatare përfshijnë disa vlera të parashikuara teorikisht - siç është vlera e parashikuar nën një hipotezë zero .

Është ky rezultat që përdoret në testet e Studentit : meqenëse ndryshesa midis mesatareve të mostrave nga dy shpërndarje normale shpërndahet normalisht, shpërndarja t-Student mund të përdoret për të ekzaminuar nëse kjo diferencë mund të supozohet në mënyrë të arsyeshme të jetë zero. .

Tabelë e vlerave të zgjedhura

Redakto

Tabela e mëposhtme liston vlerat për shpërndarjet t-Student me ν shkallë lirie për një sërë zonash kritike të njëanshme ose të dyanshme. Kolona e parë është ν, përqindjet përgjatë majës janë nivele besimi dhe numrat në trupin e tabelës janë   faktorët e përshkruar në seksionin mbi intervalet e besimit .

I njëanshëm 75% 80% 85% 90% 95% 97.5% 99% 99.5% 99.75% 99.9% 99.95%
I dyanshëm 50% 60% 70% 80% 90% 95% 98% 99% 99.5% 99.8% 99.9%
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.767
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
50 0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496
60 0.679 0.848 1.045 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
80 0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416
100 0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617 2.860 3.160 3.373
0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291
I njëanshëm 75% 80% 85% 90% 95% 97.5% 99% 99.5% 99.75% 99.9% 99.95%
I dyanshëm 50% 60% 70% 80% 90% 95% 98% 99% 99.5% 99.8% 99.9%

Llogaritja e intervalit të besimit

Le të themi se kemi një mostër me madhësi 11, mesatare të kampionit 10 dhe variancë të mostrës 2. Për shkallën e besimit 90% me 10 gradë lirie, vlera e njëanshme t nga tabela është 1.372. Pastaj me interval besimi të llogaritur nga

 

ne përcaktojmë se me 90% besim kemi një mesatare të vërtetë që ndodhet poshtë

 

Me fjalë të tjera, 90% e rasteve kur një prag i sipërm llogaritet me këtë metodë nga mostra të veçanta, ky prag i sipërm tejkalon mesataren e vërtetë.

Dhe me 90% besim ne kemi një mesatare të vërtetë që ndodhet më lart

 

Me fjalë të tjera, 90% e rasteve kur një prag më i ulët llogaritet me këtë metodë nga mostra të veçanta, ky prag më i ulët qëndron nën mesataren e vërtetë.

Kështu që me 80% besim (llogaritur nga 100% − 2 × (1 − 90%) = 80%), kemi një mesatare të vërtetë që shtrihet brenda intervalit

 
  1. ^ Kruschke JK (2015). Doing Bayesian Data Analysis (bot. 2nd). Academic Press. ISBN 9780124058880. OCLC 959632184. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)