Klinisk Biokemi i Norden Nr 3, vol. 17, 2005 - page 18

25
| 3 | 2005
Klinisk Biokemi i Norden
- A
i
). Man kunne lige så godt bruge værdierne (A
i
– B
i
), men hvis B er den nye metode og A den gamle
metode (eller eventuelt en referencemetode), så er
fortolkningen af d
i
mere umiddelbar: Værdier over
0 betyder at den nye metode giver højere værdier
end den gamle, og vice versa.
Figur 1 viser fx at Aeroset har en systematisk
tendens til at give lidt højere værdier end Hitachi
917 ved P-Albumin over 500 umol/L, mens der er
en bedre overensstemmelse mellem de to metoder
ved lavere koncentrationer.
Grænserne for overensstemmelse og middel-
værdien af differencerne
Figur 2 er mage til Figur 1, bortset fra at der er vist
3 vandrette linier:
Den midterste røde linie viser middelværdien af
differencerne, dvs. middel(d) =
d
i
/n. Værdien er
8,6 umol/L med et 95% konfidensinterval fra 6,7 til
10,5 umol/L (ikke vist i figuren). Intervallet bereg-
nes som gennemsnittet(d) ± SE(d) x t
97.5
(n-1), hvor
SE(d) er standardfejlen på estimatet af middel(d) =
SD(d)/
n, og t
97.5
(n-1) er 97,5-percentilen i en t-for-
deling med n-1 frihedsgrader
4
. Da konfidensinter-
vallet ikke inkluderer 0 betyder det, at middel(d) er
statistisk signifikant forskellig fra 0, hvis man som
sædvanligt anvender et signifikansniveau på 5%.
De to grønne linier er 95% grænserne for overens-
stemmelse
(limits of agreement)
mellem metoderne,
dvs. de grænser indenfor hvilke i middel 95% af
værdierne af d
i
findes. Grænserne er estimeret som
gennemsnit(d) ± 1,96 x SD(d). Bemærk, at der
ikke
er tale om konfidensintervaller, men om grænser
der minder om referenceintervaller. Man kan even-
tuelt beregne konfidensintervaller for grænserne
2
,
men dette gøres sjældent i praksis.
Hvordan skal man nu fortolke disse resultater?
Et traditionelt udgangspunkt ville være at fokusere
på det resultat, at middel(d) er statistisk signifikant
større end 0 — og herudfra konkludere, at måle-
metode B giver højere værdier end målemetode A,
dvs. at man har et problem, hvis man udskifter A
med B.
Men er det en sufficient og faglig relevant for-
tolkning af resultaterne? Hvis man ser nærmere på
værdierne af differenserne og på 95% grænserne
for overensstemmelse, så er uoverensstemmelserne
forholdsvis beskedne.
Figur 3 viser den kumulerede fordeling af dif-
ferenserne i procent af de tilsvarende gennemsnit,
dvs. værdierne 100 x d
i
/gns
i
. Fordelingen er høj-
reforskudt i forhold til 0-linien, men ca. 95% af
differenserne findes alligevel indenfor intervallet
0 ± 5%.
Hvis dette er acceptabelt, set fra en faglig, klinisk
orienteret synsvinkel, så har man ikke noget prob-
lem. Og hér er en vigtig pointe, når man sammen-
ligner målemetoder — man kan ikke bruge p-værdier
eller andre aggregerede statistiske talstørrelser til at
afgøre, hvorvidt eventuelle forskelle er betydnings-
fulde eller ej. Vurderingen er ikke en opgave for
statistiker, men for en klinisk biokemiker!
(Fortsætter side 26
1...,8,9,10,11,12,13,14,15,16,17 19,20,21,22,23,24,25,26,27,28,...31
Powered by FlippingBook