Klinisk Biokemi i Norden Nr 1, vol. 21, 2009 - page 20

20
| 1 | 2009
Klinisk Biokemi i Norden
(Fortsat fra side 19)
(Fortsætter side 22)
Bruk derfor heller punkter for hver observasjon,
såkalt ”stripchart”, figur 2a. Hvis det er forskjellig
antall observasjoner i gruppene eller så mange obser-
vasjoner at observasjonspunktene flyter sammen,
hvilket det er her, bør en dog foretrekke box-plot,
alternativt bean-plot eller violin-plot. Det vil for box-
plot fortsatt være slik at horisontale bokser med tekst
til venstre har bedre lesbarhet, slik at vi bør vri et box-
plot horisontalt, og gjerne samle flere box-plot under
hverandre. Ofte ønsker vi å gjengi resultater fra to
eller flere grupper av individer, f.eks mus som har fått
behandling A (10 mus) og mus som har fått behand-
ling B (23 mus). Siden det er flere mus i gruppe B er
det en god regel å gjøre boxplot B bredere, slik at en
intuitivt ser at det er flere mus i gruppe B. En vekter
vanligvis bredden proporsjonalt med kvadratroten
av antallet observasjoner, slik at dersom stabelen til
gruppe A er 1 cm bred, vil da stabelen til gruppe B
være 1,5 cm bred. Når vi uttrykker måledata, bør de
være normalfordelt i (midtstreken havner da midt i
boksen). Hvis data ikke er det, bruk gjerne en ”trans-
formering”, som log-transformasjon, og plott trans-
formerte data. For å gjøre plottet leselig, bør det stå
ikke-transformerte tall på aksene. Våre testosteron-
verdier for de forskjellige gruppene er gjengitt som
box-plot i Figur 2b og bredden av stablene er vektet
for antallet observasjoner i de forskjellige gruppene.
Av og til ønsker vi aktivt å gjengi usikkerheten i de
forskjellige gruppene. Dette kan gjøres ved et inn-
hugg, ”notch”, i boksen. I dette tilfellet ville det kun
ha gjort grafene vanskeligere å lese. Vi ser intuitivt at
det ikke er forskjell mellom gruppene.
Plotte to kontinuerlige observasjoner mot hver-
andre
I vår testosteronstudie har vi for hver pasient flere
observasjoner: testosteron, alder, SHBG, FSH og LH.
Naturlig tenker vi noen variabler som uavhengig og
noen variabler som avhengig. Alder er en typisk uav-
hengig variabel, og testosteron er en typisk avhengig
variabel. Vi tenker oss at testosteronverdiene synker
når pasienten blir eldre, men vi tror ikke at tiden går
fortere når testosteronverdiene faller. Uavhengige
variabler (som alder) plottes vanligvis på x-aksen,
avhengige variabler (som testosteron) på y-aksen
og hvis hver observasjon er et punkt, har vi et såkalt
”scatterplot”. Et scatterplott med testosteron og alder
er gjengitt i Figur 3a.
Scatterplott er ofte vanskelige å tolke med øyet.
Prøv med å legge til en linje/kurve som viser trend.
Slike linjer kan lages med lokal polynomisk regresjon
(loess eller lowess), alternativt lineær regresjon (bruk
høyere polynomer) eller spline. Noen ganger heter
de ”glatting” (smooth). En del grafprogrammer har
slike funksjoner tilgjengelig, andre ikke. Tilrådelig
er i hvert fall å bruke en form for algoritme som er
i stand til å lage en buet kurve, og ikke kun en rett
2
5
10
20
50
Unknown
Non−fasting
Fasting
No exerc bef sampling
Exerc bef sampling
Unknown
Alc last week
No alc last week
Unknown
Smoker
Non−smoker
Testosterone levels
Testosterone in nmol/L
Unknown
Non−fasting
Fasting
No exerc bef sampling
Exerc bef sampling
Unknown
Alc last week
No alc last week
Unknown
Smoker
Non−smoker
2
5
10
20
50
Testosterone levels
Testosterone in nmol/L
Fig. 2a
Fig. 2b
1...,10,11,12,13,14,15,16,17,18,19 21,22,23,24,25,26,27,28,29,30,...60
Powered by FlippingBook