Klinisk Biokemi i Norden Nr 3, vol. 17, 2005 - page 19

26
| 3 | 2005
Klinisk Biokemi i Norden
(Fortsætter side 28)
Analyser af ‘skæve tal’
Figur 4 viser resultaterne af en anden analyse af
data, som er mere korrekt i det aktuelle tilfælde,
fordi der tydeligvis er en sammenhæng mellem dif-
ferencerne og gennemsnittene af måleværdierne for
de to metoder.
Det er gjort på følgende måde
2
:
Jeg har først estimeret parametrene
β
0
og
β
1
for den
lineære regressionsmodel:
forventet(d
i
) =
β
0
+
β
1
x gns
i
Resultatet svarer til den sorte linie i Figur 4. Herefter
har jeg beregnet residualerne for differencerne, dvs.
r
i
= d
i
– (
β
0
+
β
1
x gns
i
), og deres standardafvigelse,
SD(r).
Når man herefter beregner værdier for
β
0
+
β
1
x gns ± 1,96 x SD(r)
fås de grønne ’skrå’ grænser for overensstemmelse
i Figur 4.
Man kan godt teste hypotesen
β
1
= 0 som støtte
for en vurdering af, om det er nødvendigt at bruge
denne udvidede model, men som ovenfor er det i
sidste ende den kliniske biokemikers vurdering af
data der skal være afgørende.
Det er ikke helt sjældent, at differenserne spreder
mere (eller mindre) ved høje måleværdier end ved
lave værdier. Det kaldes variansheterogenecitet
og giver problemer i alle parametriske modeller,
hvis det er udtalt. Man kan i mange tilfælde dog
afhjælpe problemet på en simpel måde, nemlig ved
at logaritmere måleværdierne eller ved at bruge
relative differenser, dvs. d
i
/gns
i
.
Hvis talværdierne er mere uregerlige, kan man
bruge non-parametriske teknikker til karakteriserin-
gen af overensstemmelsen mellem metoderne
2
, men
bør samtidig spekulere over
hvorfor
talværdierne er
så uregerlige?
Hvor mange prøver skal man bruge til en
metodesammenligning?
Der findes formler til beregning af det nødvendige
antal, hvis man ønsker at kunne påvise en statistisk
signifikant forskel af en given størrelse med en
given statistisk styrke. Brugen forudsætter imidler-
tid at man har pålidelige estimater af metodernes
varianser, og at fordelingen af differencerne er for-
holdsvis enkel
5
. NCCLS anbefaler mindst 40 prøver,
dog uden at give nogen nærmere forklaring
6
.
Mit råd, baseret på simpel erfaring, er — brug
mange
, helst over 75, og sørg for at værdierne er
godt spredte i hele i måleområdet. Hvis man af øko-
nomiske eller andre grunde bruger under 25 prøver,
så risikerer man at få problemer med at afdække de
reelle forskelle mellem målemetoderne.
Da vi skulle sammenligne en lang række gængse
biokemiske analyser på en Hitachi 917 og en
Aeroset, valgte vi at køre alle analyserne på omkring
175 tilfældigt udvalgte patientprøver. Det var
rationelt, både med hensyn til analysearbejdet og
håndteringen af data (der kunne hentes som blokke
i instrumenternes computere), og strategien viste sig
at give gode spredninger på alle målinger. Risikoen
ved en sådan fremgangsmåde er dog, at man kun
får et øjebliksbillede af forskellene mellem instru-
menterne, dvs. ikke ser forskellene efter gentagne
kalibreringer etc.
Enkeltbestemmelser, dobbeltbestemmelser eller
flere?
Det anbefales at lave dobbeltbestemmelser eller flere,
og at anvende den ekstra information i metodesam-
menligningen
2
. Det centrale er, at grænserne for
hvor god en overensstemmelse der kan ses mellem to
metoder naturligvis afhænger af metodernes ”over-
ensstemmelse med sig selv”, dvs. deres præcision.
Skal man fjerne ’outliers’?
Nej, men hvis der findes datapunkter, som tydeligt
skiller sig ud fra de øvrige, bør man gentage data-
(Fortsat fra side 25)
1...,9,10,11,12,13,14,15,16,17,18 20,21,22,23,24,25,26,27,28,29,...31
Powered by FlippingBook