Satunnaismuuttujien riippuvuus

Satunnaismuuttujien riippuvuus eli stokastinen riippuvuus [1] on todennäköisyyslaskennassa nimitys ilmiölle, jossa kahden satunnaismuuttujan saamat arvot ovat joko osittain tai kokonaan verrannollisia tai muuten riippuvaisia toistaan. Yleisessä tapauksessa toisistaan riippuvia satunnaismuuttujia voi olla useita. Satunnaismuuttujien riippuvuus voi olla seurausta niiden yhteisistä taustamekanismeista, joka vaikuttaa satunnaismuuttujien saamiin arvoihin. Näiden mekanismien yhteisvaikutus on siten osittainen eli stokastinen riippuvuus. Jos kaksi satunnaismuuttujaa ovat riippumattomia, ei niiden arvoihin vaikuta mitään yhteisiä mekanismeja. Jos kaksi satunnaismuuttujaa ovat täysin riippuvia toisistaan, määrää toisen satunnaismuuttujan arvo täysin toisen satunnaismuuttujan arvon, ja päinvastoin. Tätä riippuvuutta kutsutaan funktionaaliseksi riippuvuudeksi. Satunnaismuuttujien riippuvuus on ilmiönä sukua tapahtumien riippuvuudelle.[2][1]

Satunnaismuuttujien välisen riippuvuuden mallintaminen vaatii niiden yhteisjakauman tarkastelua. Tällöin yhteisjakaumasta erotetaan eri satunnaismuuttujien suhteen ehdolliset reunajakaumat. Reunajakaumien avulla voidaan riippuvuuden laatua ja määrää mallintaa.[2][1]

Tapahtumien riippumattomuus

Pääartikkeli: Tapahtumien riippuvuus

Kahden tapahtuman riippumattomuus tarkoittaa sitä, ettei tapahtumien todennäköisyydet riipu toisistaan. Merkitään tapahtumia A {\displaystyle A} ja B {\displaystyle B} ja lasketaan tapahtuman "tapahtuu A, kun tapahtuu myös B" ehdollinen todennäköisyys (merkitään P ( A | B ) {\displaystyle P(A|B)} ). Vertailun vuoksi, lasketaan myös tapahtuman A {\displaystyle A} todennäköisyys. Tapahtumat ovat toistaan riippumattomia, mikäli ehdollinen todennäköisyys ja kokonaistodennäköisyys ovat samat. Tapahtumalla B {\displaystyle B} ei ole silloin vaikutusta tapahtuman A {\displaystyle A} todennäköisyyteen. Yhtäsuuruudet tulisivat olla samat kummallakin tavalla ajateltuna eli

P ( A | B ) = P ( A ) {\displaystyle P(A|B)=P(A)} ja P ( B | A ) = P ( B ) . {\displaystyle P(B|A)=P(B).}

Mikäli edelliset todennäköisyydet eivät ole yhtäsuuret, ovat tapahtumat riippuvia toistaan.[3][4][5]

Kun tapahtumat ovat riippumattomia toisistaan, voidaan tapahtuma "molemmat tapahtuu" (eli A  ja  B {\displaystyle \scriptstyle A{\text{ ja }}B} ) laskea

P ( A  ja  B ) = P ( A B ) = P ( A ) P ( B ) . {\displaystyle P(A{\text{ ja }}B)=P(A\cap B)=P(A)\cdot P(B).} [3] (riippumattomien tapahtumien kertolaskusääntö)

Useamman riippumattoman tapahtuman todennäköisyys lasketaan vastaavasti

P ( A 1 A 2 . . . A n ) = P ( A 1 ) P ( A 2 ) P ( A n ) . {\displaystyle P(A_{1}\cap A_{2}\cap ...\cap A_{n})=P(A_{1})\cdot P(A_{2})\cdot \cdot \cdot P(A_{n}).} [6]

Riippumattomuuden testaamiseen löytyy työläs keino. Jos halutaan varmistaa, ovatko kolme tapahtumaa riippumattomia keskenään, tulee testit tehdä pareittain ja kaikki kolme yhdessä. Seuraavat yhdistelmät tulisi tällöin toteutua:[7][8]

A B P ( A B ) = P ( A ) P ( B ) {\displaystyle A\perp B\Leftrightarrow P(A\cap B)=P(A)P(B)}
A C P ( A C ) = P ( A ) P ( C ) {\displaystyle A\perp C\Leftrightarrow P(A\cap C)=P(A)P(C)}
B C P ( B C ) = P ( B ) P ( C ) {\displaystyle B\perp C\Leftrightarrow P(B\cap C)=P(B)P(C)}
P ( A B C ) = P ( A ) P ( B ) P ( C ) {\displaystyle P(A\cap B\cap C)=P(A)P(B)P(C)}

Riippumattomuus toteutuu vastavasti useammalle tapahtumalle.

Satunnaismuuttujien riippuvuus

Riippumattomuus

Satunnaismuuttujat X {\displaystyle X} ja Y {\displaystyle Y} ovat riippumattomia, jos yhden satunnaismuuttujan saama arvo ei vaikuta toiseen (muihin) satunnaismuuttujan arvoihin ollenkaan ja näin on myös toisen (muiden) satunnaismuuttujan suhteen. Satunnaismuuttujat ovat riippumattomia, mikäli kaikilla tapahtumien A X X {\displaystyle A_{X}\subseteq X} ja B Y Y {\displaystyle B_{Y}\subseteq Y} yhdistelmillä satunnaismuuttujien väliset ehdolliset todennäköisyydet ovat samat kuin todennäköisyydet a priori.[4] Silloin

P ( A X | B Y ) = P ( A X ) {\displaystyle P(A_{X}|B_{Y})=P(A_{X})} ja P ( B Y | A X ) = P ( B Y ) . {\displaystyle P(B_{Y}|A_{X})=P(B_{Y}).}

Tällöin diskreettien satunnaismuuttujien kaikki yksittäiset tapahtumat tulisivat olla riippumattomia keskenään eli pistetodennäköisyyksillä

P ( X = x Y = y ) = P ( X = x ) P ( Y = y ) {\displaystyle P(X=x\land Y=y)=P(X=x)\cdot P(Y=y)} [9]

eli käyttäen pistetodennäköisyysfunktion merkintöjä

f X Y ( x , y ) = f X ( x ) f Y ( y ) , {\displaystyle f_{XY}(x,y)=f_{X}(x)f_{Y}(y),}

tai vaihtoehtoisesti diskreettien ja jatkuvien satunnaismuuttujien kaikki tapahtumat tulisivat olla vastaavasti riippumattomia keskenään

P ( X x Y y ) = P ( X x ) P ( Y y ) {\displaystyle P(X\leq x\land Y\leq y)=P(X\leq x)\cdot P(Y\leq y)}

eli kertymäfunktiolla esitettynä

F X , Y ( x , y ) = F X ( x ) F Y ( y ) . {\displaystyle F_{X,Y}(x,y)=F_{X}(x)F_{Y}(y).} [10][4]

Tämä on kunkin yksittäisen satunnaismuuttujan jakauman ja niiden yhteisjakauman välinen yhtäsuuruusehto.

Jatkuvien satunnaismuuttujien tapaukessa sama pätee niiden tiheysfunktioille

f X , Y ( x , y ) = f X ( x ) f Y ( y ) {\displaystyle f_{X,Y}(x,y)=f_{X}(x)f_{Y}(y)} [10]

ja niiden kertymäfunktiolle diskreetin tapauksen tapaan.

Jos satunnaismuuttujia on kolme, tutkitaan näiden riippumattomuuksia samaan tapaan kuin kolmen tapahtuman riippumattomuuksia. Tällöin tutkitaan riippumattomuus pareittain ja lopuksi kolmistaan. Kun kaikissa neljässä tapauksessa satunnaismuuttujat ovat riippumattomia, ovat kaikki satunnaismuuttujat keskenään riippumattomia. Jos tutkitaan n {\displaystyle n} satunnaismuuttujan riippumattomuutta, käydään läpi kaikki mahdolliset kombinaatiot. Niitä on ( n n ) + ( n n 1 ) + + ( n 2 ) {\displaystyle {\tbinom {n}{n}}+{\tbinom {n}{n-1}}+\dots +{\tbinom {n}{2}}} kappaletta.[8][9][5]

Funktionaalinen riippuvuus

Funktionaalinen riippuvuus viittaa täydelliseen riippuvuuteen, jossa kahden satunnaismuuttujan tapauksessa toisen arvon tunteminen mahdollistaa toisen arvon laskemisen. Tämä voidaan ilmaista yhtälöllä g ( X , Y ) = C {\displaystyle g(X,Y)=C} . Lineaarinen riippuvuus voidaan kirjoittaa lineaarikombinaationa a X X + a Y Y = C {\displaystyle a_{X}X+a_{Y}Y=C} .[1][5]

Useamman satunnaismuuttujan tapauksessa yksi satunnaismuuttuja määräytyy täysin, kun muiden arvot saadaan ensin käyttöön. Riippuvuuden laatu voi vaihdella suuresti. Yleisin käytetty riippuvuus on lineaarinen, jossa lineaarikombinaatio

a 1 X 1 + a 2 X 2 + . . . + a n X n = C {\displaystyle a_{1}X_{1}+a_{2}X_{2}+...+a_{n}X_{n}=C} [1]

liittää satunnaismuuttujien arvot toisiinsa. Tämän yleistys on mikä tahansa funktionaalinen riippuvuus

g ( X 1 , X 2 , . . . , X n ) = C . {\displaystyle g(X_{1},X_{2},...,X_{n})=C.} [1]

Stokastinen riippuvuus

Satunnaismuuttujan riippuvuus voi olla osittaista siinä mielessä, ettei se ole täysin riippumatonta mutta ei myöskään täysin funktionaalisen riippuvaista. Tälle kiinnostavalle välimuodolle voidaan antaa nimeksi stokastinen riippuvuus, jossa sana stokastinen korostaa satunnaisuuden läsnäoloa.[4]

Riippuvuuden määrä

Kahden satunnaismuuttujan riippuvuutta voidaan mitata käyttämällä kovarianssia ja korrelaatiota.

Kovarianssi

Pääartikkeli: Kovarianssi

Kahden satunnaismuuttujan X {\displaystyle X} ja Y {\displaystyle Y} riippuvuutta voidaan mitata laskemalla niiden välinen kovarianssi σ X Y . {\displaystyle \sigma _{XY}.} Kovarianssin ja riippuvuuden välistä suhdetta voidaan valaista tutkimalla satunnaismuuttujan arvojen poikkeamista sen odotusarvosta. Satunnaismuuttujan X {\displaystyle X} ja sen odotusarvon μ X {\displaystyle \mu _{X}} erotus eli poikkeama on X μ X . {\displaystyle X-\mu _{X}.} Poikkeama saa tasapuolisesti sekä positiivisia että negatiivisia arvoja. Poikkeamien summasta tulee keskimäärin nolla, joten poikkeamien odotusarvo yleisesti aina nolla.

Kun kummankin satunnaismuuttujan poikkeamat kerrotaan keskenään ( X μ X ) ( Y μ Y ) {\displaystyle (X-\mu _{X})(Y-\mu _{Y})} , on tulos riippumattomassa tapauksessa nolla. Mikäli satunnaismuuttujat riippuvat toisistaan, voi riippuvuus olla positiivista tai negatiivista. Riippuvuus on positiivista, kun sekä X {\displaystyle X} että Y {\displaystyle Y} poikkeavat positiiviseen suuntaan yhdessä ja molemmat negatiiviseen suuntaan yhdessä. Poikkeamien tulo on tällöin aina positiivinen, koska tulontekijät ovat samanmerkkisiä. Jos X {\displaystyle X} poikkeaa positiiviseen suuntaan, kun Y {\displaystyle Y} poikkeaa negatiiviseen suuntaan, on poikkeamien tulo negatiivinen. Sama tulos saadaan, kun ne poikkeavat päinvastaisiin suuntiin.

Yleistäen voidaan sanoa, että kun | σ X Y | > 0 {\displaystyle |\sigma _{XY}|>0} , ovat satunnaismuuttuja riippuvia. Riippumattomuudelle sen sijaan ei riitä, että σ X Y = 0 , {\displaystyle \sigma _{XY}=0,} sillä tunnetaan tapauksia, jossa funktionaalinen riippuvuus aiheuttaa kovarianssille nolla-arvon. Kovarianssin arvon suuruus ei kerro, onko riippuvuus suurta vai pientä, sillä kovarianssin arvo riippuu myös satunnaismuuttujien varianssista. Riippuvuuden mittamiseen käytetäänkin korrelaatiota.

Korrelaatio

Pääartikkeli: Korrelaatio

Kovarianssin σ X Y {\displaystyle \sigma _{XY}} arvosta voidaan päätellä luotettavasti vain riippuvuuden suunta. Riippuvuuden määrä selviää, kun kovarianssin arvosta puhdistetaan kummankin satunnaismuuttujan keskihajonnan vaikutus. Keskihajonta σ X {\displaystyle \sigma _{X}} on arvoltaan varianssin σ X 2 {\displaystyle \sigma _{X}^{2}} neliöjuuri eli σ X = σ X 2 {\displaystyle \sigma _{X}={\sqrt {\sigma _{X}^{2}}}} . Korrelaation ρ X Y {\displaystyle \rho _{XY}} arvo lasketaan

ρ X Y = σ X Y σ X σ Y . {\displaystyle \rho _{XY}={\frac {\sigma _{XY}}{\sigma _{X}\sigma _{Y}}}.}

Korrelaation arvot vaihtelevat nyt suljetulla välillä 1 ρ X Y 1 , {\displaystyle -1\leq \rho _{XY}\leq 1,} eikä niillä ole mittayksikköä. Kun ρ X Y = ± 1 {\displaystyle \rho _{XY}=\pm 1} on riippuvuus lineaarista, kun | ρ X Y | < 1 {\displaystyle |\rho _{XY}|<1} voi riippuvuuden todeta olevan stokastista. Arvosta nolla ei taaskaan voi vetää johtopäätöksiä siitä, että satunnaismuuttujat ovat riippumattomia. Sen vaihtoehdon mahdollisuutta voi tarkistaa käyttäen ehdollista todennäköisyyslaskentaa.

Lähteet

  1. a b c d e f Koskenoja, Mika: Satunnaismuuttujien välinen riippuvuus, kurssin Johdatus todennäköisyyslaskentaan luentomuistiinpanoja, Helsingin yliopisto, 2013
  2. a b Mellin, Ilkka: Satunnaismuuttujat ja todennäköisyysjakaumat, s.3−10, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
  3. a b Alatupa, Sami et al.: Pitkä Sigma 6, s. 119−128. (lukion pitkän matematiikan oppikirja). Helsinki: Otava, 2010. ISBN 978-951-31-5343-4.
  4. a b c d Kivelä, Simo K.: Tapahtumien riippumattomuus, M niin kuin matematiikka, 10.8.2000
  5. a b c Apkarian, Naneh: Dependence and Independece of Random Variables (Arkistoitu – Internet Archive), San Diegon yliopisto, USA
  6. Emet, Stefan: Johdatus todennäköisyyslaskentaan ja tilastotieteeseen, Matematiikan ja tilastotieteen laitos, Turun Yliopisto, 2014
  7. Ruskeapää, Heikki: Todennäköisyyslaskenta I(luentomoniste), Turun Yliopisto, 2012
  8. a b George, Glyn: Testing for the independence of three events, s. 85−86, The Mathimatical Gazette
  9. a b Charikar, Moses: Random Variables (luento 21), Princetonin yliopisto, 2002
  10. a b Mellin, Ilkka: Satunnaismuuttujat ja todennäköisyysjakaumat, s.46−53, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007