Klinisk Biokemi i Norden Nr 3, vol. 17, 2005 - page 18

| 3 | 2005

Klinisk Biokemi i Norden

- A

). Man kunne lige så godt bruge værdierne (A

– B

), men hvis B er den nye metode og A den gamle

metode (eller eventuelt en referencemetode), så er

fortolkningen af d

mere umiddelbar: Værdier over

0 betyder at den nye metode giver højere værdier

end den gamle, og vice versa.

Figur 1 viser fx at Aeroset har en systematisk

tendens til at give lidt højere værdier end Hitachi

917 ved P-Albumin over 500 umol/L, mens der er

en bedre overensstemmelse mellem de to metoder

ved lavere koncentrationer.

Grænserne for overensstemmelse og middel-

værdien af differencerne

Figur 2 er mage til Figur 1, bortset fra at der er vist

3 vandrette linier:

Den midterste røde linie viser middelværdien af

differencerne, dvs. middel(d) =

∑

/n. Værdien er

8,6 umol/L med et 95% konfidensinterval fra 6,7 til

10,5 umol/L (ikke vist i figuren). Intervallet bereg-

nes som gennemsnittet(d) ± SE(d) x t

97.5

(n-1), hvor

SE(d) er standardfejlen på estimatet af middel(d) =

SD(d)/

√

n, og t

97.5

(n-1) er 97,5-percentilen i en t-for-

deling med n-1 frihedsgrader

. Da konfidensinter-

vallet ikke inkluderer 0 betyder det, at middel(d) er

statistisk signifikant forskellig fra 0, hvis man som

sædvanligt anvender et signifikansniveau på 5%.

De to grønne linier er 95% grænserne for overens-

stemmelse

(limits of agreement)

mellem metoderne,

dvs. de grænser indenfor hvilke i middel 95% af

værdierne af d

findes. Grænserne er estimeret som

gennemsnit(d) ± 1,96 x SD(d). Bemærk, at der

ikke

er tale om konfidensintervaller, men om grænser

der minder om referenceintervaller. Man kan even-

tuelt beregne konfidensintervaller for grænserne

men dette gøres sjældent i praksis.

Hvordan skal man nu fortolke disse resultater?

Et traditionelt udgangspunkt ville være at fokusere

på det resultat, at middel(d) er statistisk signifikant

større end 0 — og herudfra konkludere, at måle-

metode B giver højere værdier end målemetode A,

dvs. at man har et problem, hvis man udskifter A

med B.

Men er det en sufficient og faglig relevant for-

tolkning af resultaterne? Hvis man ser nærmere på

værdierne af differenserne og på 95% grænserne

for overensstemmelse, så er uoverensstemmelserne

forholdsvis beskedne.

Figur 3 viser den kumulerede fordeling af dif-

ferenserne i procent af de tilsvarende gennemsnit,

dvs. værdierne 100 x d

/gns

. Fordelingen er høj-

reforskudt i forhold til 0-linien, men ca. 95% af

differenserne findes alligevel indenfor intervallet

0 ± 5%.

Hvis dette er acceptabelt, set fra en faglig, klinisk

orienteret synsvinkel, så har man ikke noget prob-

lem. Og hér er en vigtig pointe, når man sammen-

ligner målemetoder — man kan ikke bruge p-værdier

eller andre aggregerede statistiske talstørrelser til at

afgøre, hvorvidt eventuelle forskelle er betydnings-

fulde eller ej. Vurderingen er ikke en opgave for

statistiker, men for en klinisk biokemiker!

(Fortsætter side 26

SEO Version

Warning.

You are currently viewing the SEO version of !text.
It has a number of design and functionality limitations.

We recommend viewing the Flash version or the basic HTML version of this publication.

1...,8,9,10,11,12,13,14,15,16,17 19,20,21,22,23,24,25,26,27,28,...31