Klinisk Biokemi i Norden Nr 2, vol. 21, 2009 - page 26

26
| 2 | 2009
Klinisk Biokemi i Norden
seg kun på de observasjoner vi har sett, og risikerer
å være unøyaktig ved få observasjoner. Binomial-
fordelingen vil ha samme problem. Dette er et reelt
problem med RefVal, som ofte gir deg falsk for trange
konfidensintervaller for referanseintervaller når du
har få observasjoner. Med 27 personer vil 7 perso-
ner være under nedre kvartil, tilstrekkelig for å få et
passe estimat av nedre kvartil. Konfidensintervallet
vil dog strekke seg fra pasient nummer 3 til pasient
nummer 12 og det skal ikke så mye til for at slengere
eller undergrupper av pasienter skal påvirke konfi-
densintervallet. Med 193 personer vil vi ha 48 perso-
ner under nedre kvartil og dermed kan vi både gi et
trygt estimat og trygge konfidensintervaller. Hvis vi
isteden hadde ønsket å beregne 1%-persentilen for
D-vitamin, hadde også 193 personer vært for få . Jo
lenger bort fra medianen vi kommer, jo flere obser-
vasjoner trenger vi.
Ved få observasjoner bør en beregne konfidensin-
tervallet med hjelp av gjennomsnittsverdi og standar-
davvik. Denne metoden er dog avhengig av fordelin-
gen i utgangsmaterialet. Hvis denne er skjevfordelt, så
bør den transformeres til noe som er i nærheten av en
normalfordeling. Å logaritmere observasjonene er en
god ide. Vi skal nå beregne nedre kvartil for D-vita-
minkonsentrasjonene for gruppen med 27 pasienter.
Først logaritmerer vi D-vitaminkonsentrasjonene. Så
foretar vi 5000 trekninger som tidligere. Hvis obser-
vasjonene i utgangspunktet var relativt nær normal-
fordeling, vil også de 5000 trukne nedre kvartilene
være det (!). Estimatet er gjennomsnittet eller obser-
vasjon nr 2500 (siden materialet er normalfordelt er
median og gjennomsnitt omtrent det samme). Kon-
fidensintervallet beregner vi dog gjennom å gå 1,96
standardavvik opp og ned fra gjennomsnittet. Til sist
anti-logaritmerer vi oss tilbake til opprinnelige kon-
sentrasjonsnivåer. Denne fremgangsmåten er generelt
mer stabil ved små utvalg. Konfidensintervallet med
denne metoden ble 20,42 – 34,47 nmol/L, heldigvis
veldig likt konfidensintervallet med persentilme-
toden.
Trekningen må være foretatt med et program
som har en tilstrekkelig god generator av tilfel-
dige tall.
Riktigheten av bootstrap er direkte avhengig av kvali-
teten på de tilfeldige tall som brukes. Datamaskinen/
beregningsprogrammet er utstyrt med en generator
for tilfeldige tall, en såkalt ”Pseudo-Random Number
Generator” (PRNG). En av ulempene er at enhver
PRNG vil ha en innebygd ”periodisitet”, f.eks kan en
type PRNG etter å ha generert 12048 tilfeldige tall
starte på nytt igjen. For den som liker å telle kort i
Black Jack er det nok en god gjetning at det 12048-
nde tallet nok er det eneste tallet som ikke tidligere
har stått på listen. En stygg bivirkning av periodi-
siteten er også at statistiske beregninger som for
eksempel bootstrap vil bli feil om periodisiteten er
for kort. Hvis vi trekker 12 048 000 tilfeldige tall fra
PRNG ovenfor vil hvert tall forekomme eksakt 1000
ganger. Med ”ekte” tilfeldige tall hadde dette selvføl-
gelig variert. Jeg kan bare kort nevne at periodisiteten
i den PRNG som finnes i MS Excel er meget kort…
Statistisk programvare bør oppgi hvilken PRNG som
brukes, og PRNG bør være validert. Å validere en
PRNG er faktisk ikke så mye verre enn å teste hastig-
heten på bredbåndsforbindelsen. De mest populære
Foto: Henrik Alfthan
(Fortsat fra side 25)
1...,16,17,18,19,20,21,22,23,24,25 27,28,29,30,31,32,33,34,35,36,...56
Powered by FlippingBook