Klinisk Biokemi i Norden Nr 2, vol. 21, 2009 - page 24

24
| 2 | 2009
Klinisk Biokemi i Norden
Bootstrap er en statistisk metode som base-
rer seg på tilfeldig (på svensk ”slumpvis”) tre-
kning av dataobservasjoner (såkalt resamp-
ling). Ved å bruke bootstrap kan en lage kon-
fidensintervaller for komplekse beregninger,
som det ellers hadde vært umulig å lage
konfidensintervaller for. Artikkelen er tenkt
å gi en oversikt over bootstrap uten formler.
Fordelinger og estimatorer
Mange ganger har våre observasjoner en bestemt
fordeling, som f.eks. normalfordeling (albuminkon-
sentrasjonene i en populasjon), log-normalfordeling
(TSH-konsentrasjonene i en populasjon), poissonfor-
deling (antallet blodtransfusjoner per dag på sykehu-
set), eksponentialfordeling (tid mellom to prøvesvar)
eller cauchy-fordeling (usikkerheten i PSA-ratio). Selv
om vi kjenner mange fordelinger, er fordelingen mange
ganger dog ukjent. Mange ganger ønsker vi å beskrive
våre observasjoner med et tall, for å gjøre dem enklere
eller for å sammenlikne oss med andre. Et slikt tall
som er hentet fra et sett med observasjoner benevnes
estimator (på engelsk av og til ”statistic”). Vanlige esti-
matorer er gjennomsnitt og standardavvik, men det er
ikke sjelden at vi ønsker mer komplekse estimatorer:
• Prosent av prøvene besvart innen 60 minutter
• Antall pasienter med liggetid lenger enn ”garan-
titid”
• Nedre kvartil for D-vitaminkonsentrasjonen i
serum
Konfidensintervaller
Klassisk statistikk har verktøy for å lage konfidensin-
tervaller dersom fordelingen er kjent og estimatoren
enkel. Vi kan lage et konfidensintervall for gjennom-
snittet til en normalfordeling uten større vansker.
Hvis fordelingen er ukjent og estimatoren fortsatt
enkel, kan vi ofte bruke såkalt ikke-parametriske
metoder. Det finnes en del metoder for å lage konfi-
densintervaller på gjennomsnittet fra en ukjent forde-
ling. Hvis estimatoren er kompleks, f.eks nedre kvartil
eller et tall i prosent blir det mye vanskeligere å finne
klassiske metoder for å finne konfidensintervaller.
Hvis kombinasjonen er en kompleks estimator og en
ukjent fordeling, da må vi nok innrømme at klassiske
metoder har lite å gi.
Bootstrap
Bootstrap er en metode for å lage konfidensinterval-
ler som kan brukes i alle tilfeller, selv om fordelingen
er ukjent og estimatoren kompleks. I dette tilfelle har
vi målt D-vitaminkonsentrasjonen i serum hos 193
pasienter (Figur 1). Fordelingen av pasientresultatene
Bootstrap – slik fungerer det
Johan Bjerner, Fürst Medisinsk Laboratorium, Oslo
jbjerner@furst.no
1...,14,15,16,17,18,19,20,21,22,23 25,26,27,28,29,30,31,32,33,34,...56
Powered by FlippingBook