Khí-négyzet eloszlás

A valószínűségszámítás elméletében és a statisztika területén, a k szabadságfokú khí-négyzet eloszlás (más neveken: khi-négyzet, Khi2) k darab független normális eloszlású valószínűségi változónak a négyzetösszege.

Ez az eloszlás széles körben használatos a valószínűség-eloszlások között, a statisztikai területén, például a hipotézisek ellenőrzésekor, vagy egy konfidenciaintervallum létrehozásakor.^[1]^[2]^[3]^[4]

Ha szükséges a khí-négyzet eloszlást megkülönböztetni a nem-centrális khí-négyzet eloszlástól, akkor szokták néha centrális khí-négyzet eloszlásnak is nevezni.

A khí-négyzet eloszlást statisztikák ellenőrzésére használják, az elméleti és a megfigyelt értékek kiértékelésénél, összehasonlításánál. A khí-négyzet eloszlás, a gamma-eloszlás egy speciális esete.

Definíció

Ha Z₁, ..., Z_k független, standard normális eloszlású valószínűségi változók, akkor a négyzeteik összege,

Q\ =\sum _{i=1}^{k}Z_{i}^{2},

a khí-négyzet eloszlás szerint oszlik el, k szabadságfokkal. Ezt a következőképpen is jelölik:

Q\ \sim \ \chi ^{2}(k)\ \ {\text{vagy}}\ \ Q\ \sim \ \chi _{k}^{2}.

A khi-négyzet eloszlásnak egy paramétere van, a k, egy pozitív egész, mely a szabadságfok mértéke.

Valószínűség sűrűségfüggvény

A khí-négyzet eloszlás valószínűség sűrűségfüggvénye:

f(x;\,k)={\begin{cases}{\frac {x^{(k/2)-1}e^{-x/2}}{2^{k/2}\Gamma \left({\frac {k}{2}}\right)}},&x\geq 0;\\0,&{\text{más esetben}}.\end{cases}}

ahol Γ(k/2) a gamma-eloszlást jelöli A sűrűségfüggvényének deriválását a khi-négyzet eloszlás valószínűség sűrűségfüggvényének deriválása szócikk tárgyalja.

Kumulatív eloszlás függvény

A kumulatív eloszlás függvény:

F(x;\,k)={\frac {\gamma ({\frac {k}{2}},\,{\frac {x}{2}})}{\Gamma ({\frac {k}{2}})}}=P\left({\frac {k}{2}},\,{\frac {x}{2}}\right),

Ahol γ(k,z) az inkomplett gamma-függvény, és a P(k,z) a rendezett gamma-függvény . Abban a speciális esetben, amikor k=2, léteik egy egyszerű képlet:

F(x;\,2)=1-e^{-{\frac {x}{2}}}.

Ennek az eloszlásnak a táblázatai – rendszerint kumulatív formában – számos helyen megtalálhatók, általában statisztikai csomagokban. Egy zárt formájú közelítés található a nem-centrális khí-négyzet eloszlásnál.

Additivitás

A khí-négyzet eloszlás definíciója szerint a független khí-négyzet változók összege is khí-négyzet eloszlású. Speciálisan, ha {X_i}_i=1ⁿ független khí-négyzet eloszlású változók {k_i}_i=1ⁿ szabadságfokkal, akkor Y = X₁ + ⋯ + X_n is khí-négyzet eloszlásúak k₁ + ⋯ + k_n szabadságfokkal.

Információ entrópiája

Az információ entrópiája:

H=\int _{-\infty }^{\infty }f(x;\,k)\ln f(x;\,k)\,dx={\frac {k}{2}}+\ln \left(2\Gamma \left({\frac {k}{2}}\right)\right)+\left(1-{\frac {k}{2}}\right)\psi \left({\frac {k}{2}}\right),

ahol ψ(x) a Digamma-függvény. A khí-négyzet eloszlás az X valószínűségi változó maximális entrópiájú valószínűség eloszlása, ahol $E(X)=\nu$ rögzített, és $E(\ln(X))=\psi \left({\frac {1}{2}}\right)+\ln(2)$ is rögzített.^[5]

Nem centrális momentumok

A k szabadságfokú khí-négyzet eloszlás zéró körüli momentumai:^[6]^[7]

$\operatorname {E} (X^{m})=k(k+2)(k+4)\cdots (k+2m-2)=2^{m}{\frac {\Gamma (m+{\frac {k}{2}})}{\Gamma ({\frac {k}{2}})}}.$

Kumulánsok

A kumulánsok a karakterisztikus függvény logaritmusának egy hatvány sor kiterjesztésével kaphatók:

\kappa _{n}=2^{n-1}(n-1)!\,k

Aszimptotikus tulajdonságok

A centrális határeloszlás tételéből következően, mivel a khi-négyzet eloszlás független k szabadságfokú valószínűségi változók szummája, véges átlaggal és szórásnégyzettel, konvergál a normális eloszláshoz nagy k értékeknél.

Praktikus okok miatt, k > 50 esetben az eloszlás elég közel áll a normális eloszláshoz, hogy a különbség elhanyagolható lehessen.^[8]

Ha X ~ χ²(k), akkor k tart a végtelenhez, a $(X-k)/{\sqrt {2k}}$ eloszlás pedig a normális eloszlás felé tart. Azonban ez a konvergencia lassú, mivel a ferdeség ${\sqrt {8/k}}$ , és az eloszlásgörbe meredeksége 12/k. A khí-négyzet eloszlás más függvényei jóval gyorsabban konvergálnak a normális eloszláshoz. Néhány példa:

Ha X ~ χ²(k), akkor $\scriptstyle {\sqrt {2X}}$ közel normálisan eloszlású, $\scriptstyle {\sqrt {2k-1}}$ középértékkel.
Ha X ~ χ²(k), akkor $\scriptstyle {\sqrt[{3}]{X/k}}$ közel normálisan eloszlású $\scriptstyle 1-2/(9k)$ középértékkel, és $\scriptstyle 2/(9k).$ szórásnégyzettel^[9] Ezt Wilson-Hilferty transzformációnak hívják.

Kapcsolódó eloszlások

$\lim _{k\to \infty }{\tfrac {\chi _{k}^{2}(x)-\mu _{k}}{\sigma _{k}}}{\xrightarrow {d}}\ N(0,1)\,$ (normális eloszlás)
$\chi _{k}^{2}\sim {\chi '}_{k}^{2}(0)$ (Nem-centrális khi-négyzet eloszlás nem-centralitás paraméterrel $\lambda =0$ )
Khí-négyzet eloszlás, a Pareto-eloszlás egy transzformációja
A T-eloszlás, a khí-négyzet eloszlás egy transzformációja
A T-eloszlás származtatható a khi-négyzet eloszlásból, és a normális eloszlásból
Nem-centrális T-eloszlás származtatható a khí-négyzet eloszlásból, és a normális eloszlásból

Statisztikailag független egységnyi szórásnégyzetes Gauss-eloszlású változók négyzeteinek szummája, melynek nincs zéró középértéke, a khí-négyzet eloszlás általánosításához vezet, és nem-centrális khi-négyzet eloszlásnak hívják. A khí-négyzet eloszlás természetesen kapcsolódik más eloszlásokhoz, melyeknek a Gauss-eloszláshoz van közük. Például:

Y F-eloszlású, Y ~ F(k₁,k₂) ha $\scriptstyle Y={\frac {X_{1}/k_{1}}{X_{2}/k_{2}}}$ ahol X₁ ~ χ²(k₁), és X₂ ~ χ²(k₂) statisztikailag független.

Ha X khí-négyzet eloszlású, akkor $\scriptstyle {\sqrt {X}}$ khí-eloszlású.
Ha X₁ ~ χ²_k₁ és X₂ ~ χ²_k₂ statisztikailag független, akkor X₁ + X₂ ~ χ²_k₁+k₂. Ha X₁ and X₂ nem függetlenek, akkor X₁ + X₂ nem khi –eloszlású.

Általánosítás

A khí-négyzet eloszlást a Gaussi k, független, zéró középértékű, egységnyi szórásnégyzetű valószínűségi változók négyzeteinek szummájával kapjuk. Ennek az eloszlásnak az általánosítását úgy kaphatjuk, ha összegezzük más típusú Gaussi valószínűségi változók négyzeteit. A következőkben bemutatunk néhány ilyen eloszlást.

Khí-négyzet eloszlások

Nem-centrális khí-négyzet eloszlás

A nem-centrális khí-négyzet eloszlást a független gaussi valószínűségi változók négyzeteinek szummájával kapjuk, melyek egység szórásnégyzettel , és nem zéró középértékkel rendelkeznek.

Általánosított khí-négyzet eloszlás

Az általánosított khí-négyzet eloszlást a z′Az kvadratikus képletéből kapjuk, ahol z, a zéró középértékű Gaussi vektor, tetszőleges kovariáns mátrixxal, és A egy tetszőleges mátrix.

Gamma-, exponenciális- és kapcsolódó eloszlások

A X ~ χ²(k) khí-négyzet eloszlás, a gamma-eloszlás egy speciális esete, X ~ Γ(k/2, 1/2), ahol k egy egész. Mivel az exponenciális eloszlás szintén a Gamma-eloszlás egy speciális esete, ezért X ~ χ²(2), és X ~ Exp(1/2) egy exponenciális eloszlás. Az Erlang-eloszlás szintén a Gamma-eloszlás egy speciális esete, ezért ha X ~ χ²(k) páros k-val, akkor X is Erlang-eloszlású k/2 alakparaméterrel, és ½ skálaparaméterrel.

Alkalmazások

A khí-négyzet eloszlásnak számos alkalmazása ismert a statisztikában, például a khí-négyzet teszt, vagy a szórásnégyzetek becslése. Felveti a normális eloszlás középérték becslésének a problémáját, és a regressziós vonal meredekségének a becslését, a T-eloszláson keresztül. A szórásnégyet analízis problémájában is van szerepe, az F-eloszlással kapcsolatban, mely két független khí-négyzet valószínűségi változó arányának az eloszlása, mindegyik osztva a megfelelő szabadságfokkal. A következő táblázat olyan eloszlásokat mutat be, melyek neve ‘khí’-vel kezdődik, valamilyen statisztikához kapcsolódik, a X_i ∼ Normal(μ_i, σ²_i), i = 1, ⋯, k, független valószínűségi változókra alapozva:

Név	Statisztika
Khí-négyzet eloszlás	$\sum _{i=1}^{k}\left({\frac {X_{i}-\mu _{i}}{\sigma _{i}}}\right)^{2}$
Nem-centrális khí-négyzet eloszlás	$\sum _{i=1}^{k}\left({\frac {X_{i}}{\sigma _{i}}}\right)^{2}$
Khí-eloszlás	${\sqrt {\sum _{i=1}^{k}\left({\frac {X_{i}-\mu _{i}}{\sigma _{i}}}\right)^{2}}}$
nem-centrális khí-eloszlás	${\sqrt {\sum _{i=1}^{k}\left({\frac {X_{i}}{\sigma _{i}}}\right)^{2}}}$

Irodalom

Wilson, E.B – Hilferty, M.M: The distribution of chi-squared. Washington: Proceedings of the National Academy of Sciences. 1931. 684–688. o.
Horváth Gézáné: Kvantitatív módszerek I.Fejezetek a valószínűségszámításból. (hely nélkül): PERFEKT ZRT. 2005. ISBN 9789633945902
Jonhson, N.L.; S. Kotz, , N. Balakrishnan: Continuous Univariate Distributions (Second Ed., Vol. 1, Chapter 18). (hely nélkül): John Willey and Sons. 1994. ISBN 0-471-58495-9
Maddala, G.S: Limited-Dependent and Qualitative Variables in Econometrics. (hely nélkül): Cambridge University Press. 1983.

Kapcsolódó szócikkek

Jegyzetek

↑ Milton Abramowitz; Irene Stegun, (szerk.) (1983) [June 1964]. "[Irene Stegun Chapter 26]". Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematics Series. 55 (Ninth reprint with additional corrections of tenth original printing with corrections (December 1972); first ed.). Washington D.C.; New York: United States Department of Commerce, National Bureau of Standards; Dover Publications. p. 940. ISBN 978-0-486-61272-0. LCCN 64-60036. MR 0167642. LCCN 65-12253.
↑ NIST (2006). Engineering Statistics Handbook - Chi-Squared Distribution
↑ Jonhson, N.L., S. Kotz, , N. Balakrishnan. Continuous Univariate Distributions (Second Ed., Vol. 1, Chapter 18). John Willey and Sons (1994). ISBN 0-471-58495-9
↑ Mood, Alexander, Franklin A. Graybill, Duane C. Boes. Introduction to the Theory of Statistics (Third Edition, p. 241-246). McGraw-Hill (1974). ISBN 0-07-042864-6
↑ (2009) „Maximum entropy autoregressive conditional heteroskedasticity model”. Journal of Econometrics, 219–230. o, Kiadó: Elsevier. [2016. március 7-i dátummal az eredetiből archiválva]. (Hozzáférés: 2011. június 2.)
↑ Chi-squared distribution, from MathWorld, Hozzáférés ideje: Feb. 11, 2009
↑ M. K. Simon, Probability Distributions Involving Gaussian Random Variables, New York: Springer, 2002, eq. (2.35), ISBN 978-0-387-34657-1
↑ Box, Hunter and Hunter. Statistics for experimenters. Wiley, 46. o. (2005)
↑ Wilson, E.B.; Hilferty, M.M. (1931) "The distribution of chi-squared". Proceedings of the National Academy of Sciences, Washington, 17, 684–688.