Klinisk Biokemi i Norden Nr 2, vol. 21, 2009 - page 27

27
| 2 | 2009
Klinisk Biokemi i Norden
valideringsprogrammene (gratis) er ”DieHard” og
”DieHarder” som er en samling av alle mulige statis-
tiske tester for tilfeldige tall.
Bagging (bootstrap aggregating)
En interessant bruk av bootstrap er for å undersøke
modellstabilitet. Medisinske studier er ofte utstyrt
med en p-verdi. Denne p-verdien er oftest generert
gjennom en statistisk test og står for sannsynlighet for
at resultatene kunne ha inntruffet tilfeldig, gitt at den
statistiske modellen er riktig og gitt at resultatene er
korrekt behandlet (”outliers”/slengere er identifisert
og fjernet, m.m.). Med andre ord sier vanligvis ikke
en p-verdi noe om hvorvidt jeg har valgt riktig statis-
tisk modell og hvorvidt min behandling av slengere
påvirker sluttresultatet. Bagging kan ikke vise hvor-
vidt en modell er riktig, men bagging kan vise at en
valgt modell er ustabil og resultatene derfor usikre.
Ved bagging trekker en observasjoner ved bootstrap
og gjentar deretter alt man har gjort, eliminasjon av
slengere, statistiske bearbeidinger for hver og en av
de 10000 datasettene. Bagging krever derfor en del
programmeringskunnskaper. Jeg skal gi et fiktivt
eksempel på bagging:
Vi studerer mannlige fertilitetshormoner, og lager
en multivariat modell hvor testosteron er utfalls-
variabel. De andre variablene er SHBG, albumin,
alder, røyking, alkohol, FSH, LH. Vi finner at FSH er
høysignifikant (p<0.001) og LH er ikke signifikant
(p=0.18). Det er lett å trekke den feilaktige konklus-
jonen: FSH er signifikant assosiert med testosteron,
men ikke LH… Ser du hvorfor den konklusjonen er
feil?
Vi må huske at disse p-verdiene gjelder gitt at
modellen er riktig og stabil. Vi vet jo at FSH og LH
er sterkt korrelert, dvs at høye FSH og LH oftest
forekommer sammen. Vi foretar ”bagging” og får et
relativt uventet resultat. I 72% av tilfellene kommer
FSH ut som høysignifikant (p<0.001) og LH som
ikke signifikant, og i 28% av tilfellene kommer LH
ut som høysignifikant (p<0.001) og FSH som usig-
nifikant. Vår modell er ustabil. Riktig konklusjon er
altså: Enten FSH eller LH er signifikant assosiert med
testosteron i en multivariat modell, men vi har ikke
nok data for å avgjøre hvilken av de to som er den sig-
nifikante og hvilken som er den usignifikante. Dette
er en variant av ”forskjellen mellom en signifikant og
en usignifikant variabel er ikke alltid signifikant”…
Hvordan kan jeg bruke bootstrap?
Du kan programmere selv, husk dog bruk av riktig
PRNG. Jeg vil dog ikke anbefale dette. Det beste er
å bruke en statistisk programvare eller programme-
ringsspråk som har innbygget funksjoner for boots-
trap. Jeg bruker R (eller S-plus) og som har en pakke
”boot” med funksjoner skrevet av Canty. En har da
tilgang til forskjellige varianter å trekke data på utover
ordinær bootstrapping og forskjellige måter å beregne
konfidensintervaller. RefVal bruker bootstrap for
beregning av konfidensintervaller for referanseinter-
valler, men den algoritme som brukes i RefVal har en
del svakheter. Jeg har satt opp en variant on-line (som
er den som er brukt i eksemplene oven), hvor en kan
bruke forskjellige måter å lage konfidensintervaller
på. Denne er tilgjengelig på www.sjcli.org. Prøv den
gjerne!
Takk til Pål Rustad, Fürst Medisinsk Laboratorium, for
kommentarer
Et lite utvalg referanser
Bjerner J, Theodorsson E, Hovig E and Kallner A.
Non-parametric estimation of reference intervals
in small Non-Gaussian sample sets. Accreditation
and Quality Assurance. In press.
Canty AJ. An S-Plus Library for Resampling
Methods. Computing Science and Statistics [Pro-
ceedings of the 30th Symposium on the Interface]
1998;236-241.
Henderson AR. The bootstrap: a technique for
data-driven statistics. Using computerintensive
analyses to explore experimental data. Clin Chim
Acta 2005;359:1-26.
Hesterberg T, Monaghan S, Moore DS, Clipston
A and Epstein R: Bootstrap Methods and Permu-
tation Tests. The Practice of Business Statistics,
WH Freeman and Company 2003.
Linnet K. Nonparametric estimation of reference
intervals by simple and bootstrapbased
procedures. Clin Chem 2000;46:867-9.
1...,17,18,19,20,21,22,23,24,25,26 28,29,30,31,32,33,34,35,36,37,...56
Powered by FlippingBook