Klinisk Biokemi i Norden Nr 2, vol. 21, 2009 - page 26

| 2 | 2009

Klinisk Biokemi i Norden

seg kun på de observasjoner vi har sett, og risikerer

å være unøyaktig ved få observasjoner. Binomial-

fordelingen vil ha samme problem. Dette er et reelt

problem med RefVal, som ofte gir deg falsk for trange

konfidensintervaller for referanseintervaller når du

har få observasjoner. Med 27 personer vil 7 perso-

ner være under nedre kvartil, tilstrekkelig for å få et

passe estimat av nedre kvartil. Konfidensintervallet

vil dog strekke seg fra pasient nummer 3 til pasient

nummer 12 og det skal ikke så mye til for at slengere

eller undergrupper av pasienter skal påvirke konfi-

densintervallet. Med 193 personer vil vi ha 48 perso-

ner under nedre kvartil og dermed kan vi både gi et

trygt estimat og trygge konfidensintervaller. Hvis vi

isteden hadde ønsket å beregne 1%-persentilen for

D-vitamin, hadde også 193 personer vært for få . Jo

lenger bort fra medianen vi kommer, jo flere obser-

vasjoner trenger vi.

Ved få observasjoner bør en beregne konfidensin-

tervallet med hjelp av gjennomsnittsverdi og standar-

davvik. Denne metoden er dog avhengig av fordelin-

gen i utgangsmaterialet. Hvis denne er skjevfordelt, så

bør den transformeres til noe som er i nærheten av en

normalfordeling. Å logaritmere observasjonene er en

god ide. Vi skal nå beregne nedre kvartil for D-vita-

minkonsentrasjonene for gruppen med 27 pasienter.

Først logaritmerer vi D-vitaminkonsentrasjonene. Så

foretar vi 5000 trekninger som tidligere. Hvis obser-

vasjonene i utgangspunktet var relativt nær normal-

fordeling, vil også de 5000 trukne nedre kvartilene

være det (!). Estimatet er gjennomsnittet eller obser-

vasjon nr 2500 (siden materialet er normalfordelt er

median og gjennomsnitt omtrent det samme). Kon-

fidensintervallet beregner vi dog gjennom å gå 1,96

standardavvik opp og ned fra gjennomsnittet. Til sist

anti-logaritmerer vi oss tilbake til opprinnelige kon-

sentrasjonsnivåer. Denne fremgangsmåten er generelt

mer stabil ved små utvalg. Konfidensintervallet med

denne metoden ble 20,42 – 34,47 nmol/L, heldigvis

veldig likt konfidensintervallet med persentilme-

toden.

Trekningen må være foretatt med et program

som har en tilstrekkelig god generator av tilfel-

dige tall.

Riktigheten av bootstrap er direkte avhengig av kvali-

teten på de tilfeldige tall som brukes. Datamaskinen/

beregningsprogrammet er utstyrt med en generator

for tilfeldige tall, en såkalt ”Pseudo-Random Number

Generator” (PRNG). En av ulempene er at enhver

PRNG vil ha en innebygd ”periodisitet”, f.eks kan en

type PRNG etter å ha generert 12048 tilfeldige tall

starte på nytt igjen. For den som liker å telle kort i

Black Jack er det nok en god gjetning at det 12048-

nde tallet nok er det eneste tallet som ikke tidligere

har stått på listen. En stygg bivirkning av periodi-

siteten er også at statistiske beregninger som for

eksempel bootstrap vil bli feil om periodisiteten er

for kort. Hvis vi trekker 12 048 000 tilfeldige tall fra

PRNG ovenfor vil hvert tall forekomme eksakt 1000

ganger. Med ”ekte” tilfeldige tall hadde dette selvføl-

gelig variert. Jeg kan bare kort nevne at periodisiteten

i den PRNG som finnes i MS Excel er meget kort…

Statistisk programvare bør oppgi hvilken PRNG som

brukes, og PRNG bør være validert. Å validere en

PRNG er faktisk ikke så mye verre enn å teste hastig-

heten på bredbåndsforbindelsen. De mest populære

Foto: Henrik Alfthan

(Fortsat fra side 25)

SEO Version

Warning.

You are currently viewing the SEO version of !text.
It has a number of design and functionality limitations.

We recommend viewing the Flash version or the basic HTML version of this publication.

1...,16,17,18,19,20,21,22,23,24,25 27,28,29,30,31,32,33,34,35,36,...56