Sannsynsfordeling

Sannsynsfordeling blir nytta innan sannsynsteori og statistikk for å skildre korleis stokastiske variable, til dømes tilfeldige utval, fordeler seg. Dei einskilde utfalla av ein tilfeldig variabel kan ikkje føreseiast, men sannsynsfordelinga vil skildre sannsynet for at kvart moglege utfall vil inntre, og korleis verdiane i eit større utval normalt vil fordele seg.

Desse tilhøva er ulike avhengig av den underliggande fysiske prosessen eller logiske mekanismen; Utfallet av eit terningkast, ein lotteritrekning, radioaktiv nedbryting, ein intelligenstest eller ventetider i ferjekø vil difor ha ulike sannsynsfordelingar.

Formell definisjon

endre

Ei sannsynsfordeling tildeler eit sannsyn til kvart intervall   av moglege reelle tal   slik at føresetnadene for den aktuelle fordelinga er ivaretatt.

Alle stokastiske variablar har ei sannsynsfordeling som inneheld den essensielle informasjonen om denne variabelen. Viss   er ein stokastisk variabel, vil sannsynfordelinga tildele ein sannsyn   til intervallet   som er sannsynet for at   har ein verdi i dette intervallet. Sannsynsfordelinga til   kan eintydig skildrast av den (kumulative) fordelingsfunksjonen   som er definert som:

 

Verdiane vil vere i området 0 (ingen sannsyn) til 1. Den deriverte til denne   vert kalla sannsynstettleiken til  . Kontinuerlege sannsynsfordelingar er fordelingar der sumfunksjonen òg er kontinuerleg; Dette tyder òg at   for alle verdiar   i  ; Frå ein grenseverdibetraktning: når mengda moglege verd for   går mot uendeleg må sannsynet for enkeltutfall   gå mot null. Sannsynet for at   er i intervallet   er:

 

Ein fordeling blir kalla diskret viss sumfunksjonen består av ei rekkje endelege sprang, som tyder at variabelen   er ein diskret stokastisk variabel;   kan berre ha verdiar frå eit endeleg, høgst numererbart sett. Diskrete fordelingar blir skildra ved summen av sannsynene for enkeltutfall:

  for  .
  • Støtta for ein fordeling er det minste lukka settet som har sannsyn 1. Ein fordeling har endeleg støtte der sannsyn 1 oppnåast med eit endeleg, høgst numererbart sett for  .
  • Sannsynsfordelinga for summen av to uavhengige stokastiske variable er konvolusjonen av deira fordelingar.
  • Sannsynsfordelinga for differansen mellom to uavhengige stokastiske variable er krysskorrelasjonen av deira fordelingar.

Viktige sannsynsfordelingar

endre

Diskrete fordelingar

endre

Endeleg støytte

endre
  • Bernoullis fordeling, som har verd 1 med sannsyn   og verd 0 med sannsyn  .
  • Rademachers fordeling, som har verd 1 med sannsyn   og verd   sannsyn  .
  • Binomisk fordeling som gjev mengder treff i ei rekkje uavhengige Ja/Nei testar.
  • Uniform fordeling der alle elementa i eit endeleg sett har same sannsyn. Tilnærma riktig for mynt og terningkast o.l.
  • Hypergeometrisk fordeling, skildrar sannsynet for treff i dei første   testar på ein serie   dersom vi veit at totalt mengde treff i   er  . Blir til dømes brukt for å vurdere test av produkt ved utval frå vareparti.

Uendeleg støytte

endre
  • Boltzmann fordeling, som blir brukt innan fysikk for å skildre diskrete energinivå i system i termisk likevekt.
  • Geometrisk fordeling er ein diskret stokastisk sannsynsfordeling kor han stokastiske variable skildrar mengder forsøk til første gongen eit gjeve treff skjer.
  • Poissonfordeling skildrar mengder treff i ein fast tidsperiode dersom treffa skjer med ein kjend gjennomsnittsverdi og er uavhengig av tida sidan siste hendinga. Kan til dømes nytta for brukt radioaktiv nedbryting, fødselssstatistikk og køberekningar.
  • Logaritmisk fordeling

Kontinuerlege fordelingar

endre

Støtte på eit ikkje-uendeleg intervall

endre

Støytte på halvt uendeleg intervall, vanlegvis  

endre
  • Kjikvadratfordeling, som er summen av kvadrat av   uavhengige Gaussiske stokastiske variable. Er ein bestemt variant av gammafordelinga som blir til brukt å mæle godheit i tilpassing til dømes ved minste kvadrats metode
  • Eksponentialfordeling skildrar tid mellom uavhengige på kvarandre følgjande stokstiske hendingar, til dømes driftsavbrot.
  • Gammafordelinga, skildre tid til   uavhengige på kvarandre følgjande stokastiske hendingar har inntreft.
  • log-normal fordeling skildrar variable som er sett saman av produktet av mange uavhengige positive variablar.
  • Weibull fordeling, der eksponentialfordeling er eit spesialtilfelle brukast for levetidsforventningsberekningar for utstyr (en: MTBF Mean time Between Failure).

Støytte for alle intervall

endre
  • Cauchy fordeling, er ein funksjon som ikkje har ein forventingsverdi eller varians; blir forbunde med system som energifordeling ved resonans.
  • Laplace fordeling Som er spissare ved forveningsverdien og har breiare skuldrer enn normalfordelinga.
  • Normalfordeling kallast òg Gaussfordeling. Gjeld for ei rekkje naturlege variasjonar rom fordeler seg rundt ein middelverdi i ein populasjon, til dømes høgd, intelligens naturleg variasjon i toleranse osb Modellert som ein sum av mange uavhengige variable og gjev ei velkjend klokkeforma kurve (eng. bell curve).

Sjå òg

endre

Kjelder

endre