Statistikk er vitskapen om innsamling, organisering, analyse og tolking av data. Statistisk teori kan reknast som ei grein av matematikken. Målet med statistikkfaget er å dra ut informasjon frå tilgjengelege data: på sett å vis å redusera mange tal (data) til få, meir forståelege tal. Det som gjeld eller kan skildrast av statistikk vert kalla statistisk.

Normalfordelinga er i statistikken den viktigaste av fleire sannsynsfordelingar
For statistikk over Wikipedia, sjå Wikipedia:Statistikk.

Statistikkfaget heng tett saman med sannsynsrekning, men det er viktige skilnader. I sannsynsrekninga startar ein med å vita korleis visse eigenskapar fordeler seg i heile populasjonen, og brukar denne kunnskapen til å seia noko kvalifisert om korleis det er sannsynleg at eigenskapane fordeler seg i eit mindre utval frå populasjonen. Innan statistikken byrjar ein gjerne i andre enden: me har kunnskapar om eit utval og nyttar denne kunnskapen til å seia noko kvalifisert om heile populasjonen. Med andre ord kan ein seia at ein deduserer innan sannsynsrekninga medan ein induserer innan statistikken.

Tydingar

endre

Ei tyding av statistikk er statistikkfaget, altså vitskapen som definert øvst i artikkelen.

Ei anna tyding av ordet siktar direkte til tala, og her er det ein viktig nyanseskilnad mellom det engelske statistics og det norske statistikk. Statistics er fleirtal av statistic, som er ein utrekna verdi, til dømes eit gjennomsnitt, eit standardavvik, ein t-verdi (eng. t-statistic) eller liknande. På norsk finst ordet ikkje i eintal, og det er neppe dette nordmenn flest meiner når dei snakkar om statistikk.

På norsk er det vanleg å nytta ordet statistikk som nemning på sjølve datamaterialet. Om dette er ei distinkt tyding frå tydinga over, eller berre ein nyanseskilnad, vil variera. Ofte er sjølve datamaterialet bearbeidd. Dataa kan til dømes vera sett saman av gjennomsnittsverdiar for barnehagane i ein heil kommune. Då er det statistikk også i engelsk tyding av ordet.

Populasjon og utval

endre

Når ein skal nytta statistiske metodar for å finna ulike storleikar og samanhengar, må ein først ha ein populasjon å utføra målingar eller studium på. Populasjonen er sett saman av alle dei einingane ein vil at statistikken skal omfatta. Dei storleikane eller eigenskapane som vert undersøkte, vert kalla variablar. Fordi populasjonen ofte er for stor til at det er mogleg eller fornuftig å undersøkja alle einingane, tek ein vanlegvis ut eit utval som ein måler på. Dette bør vera eit representativt utval, slik at funna ein gjer i utvalet i størst mogleg grad skal vera felles med heile populasjonen. Utvalet må i tillegg vera stort nok til at einskildverdiar i variabelen ikkje skal gjera for store utslag på totalverdien til utvalet.

Variabeltypar

endre

Kategoriske variablar er kvalitative variablar som ikkje har talverdi. Hårfarge og dyrerase er døme på kategoriske variablar.

Diskrete variablar er kvantitative variablar som har eit endeleg sett av moglege verdiar. Diskrete variablar endrar seg dermed stegvis frå verdi til verdi, og kan ikkje ha andre verdiar enn dei som er definerte. Døme på diskrete variablar kan vera tal på barn i ein familie, som berre kan ha verdiar som er naturlege tal. I nokre tilfelle, til dømes der det er svært mange moglege verdiar, vil det vera meir nyttig å handsama diskrete variablar som om dei var kontinuerlege.

Kontinuerlege variablar er kvantitative variablar som kan ha alle verdiar mellom minste og største moglege verdi. Fordi verdiane endrar seg kontinuerleg, må dei grupperast for å gje meining, sidan det er lite sannsynleg at ein verdi oppstår fleire gonger. I nokre samanhengar kan det vera fornuftig å handsama kontinuerlege verdiar som om dei var diskrete. Dette gjeld til dømes i tilfelle der det ikkje er vanleg eller naturleg å oppgje verdiar med desimalar. Når dei oppgjevne verdiane er heiltal, vil variabelen framstå som diskret. Døme på kontinuerlege variablar er fysiske storleikar.

Sentralmål

endre

Sentralmål er ein verdi som vert rekna ut for å finna ein typisk eller representativ verdi for eit utval. Det finst tre ulike sentralmål, modus, median og gjennomsnitt.

Modus er den verdien som finst flest gonger i utvalet. Modus er generelt lite brukt.

Gjennomsnittet er summen av alle verdiane i utvalet delt på talet på observasjonar. Gjennomsnitt er mykje brukt i daglegtalen, men er svært utsett for forstyrringar i form av veldig høge eller veldig låge einskildverdiar, og eignar seg difor best der måleverdiane er jamnt fordelte i området mellom største og minste verdi.

Medianen er den verdien som ligg i midten av utvalet når verdiane er sorterte. Dersom talet på observasjonar er eit partal, vert medianen gjennomsnittet av dei to verdiane i midten. Medianen er lite utsett for forstyrringar frå ekstremverdiar fordi han ikkje vert påverka av storleiken til dei største og dei minste verdiane.

  Denne matteartikkelen er ei spire. Du kan hjelpe Nynorsk Wikipedia gjennom å utvide han.