Klinisk Biokemi i Norden Nr 3, vol. 15, 2003 - page 12

12
(leave-one out method) eller den kan vara större
än träningsmängden. Träningsmängden måste vara
tillräckligt stor. Inga exakta rekommendationer kan
ges om träningsmängdens minimala storlek; den
beror på antalet variabler, variabelvärdenas normal-
variation och hur komplexa förhållanden det finns
mellan variablerna. Vanligtvis behövs flera tiotal
patienter per variabel som inkluderas modellen.
För- och nackdelar med regressionsanalys och
neurala nätverk
Den enda klara fördelen med neurala nätverk jäm-
fört med logistisk regression är förmågan att iden-
tifiera olinjära och komplexa förhållanden mellan
variabler i en datamängd. Om sådana komplexa
förhållanden inte existerar kan regressionsmodeller
rekommenderas. I en regressionsmodell är samban-
det mellan de förklarande variablerna och utgångs-
variablerna lätt att tolka. Också regressionsmodeller
kan hantera vissa komplexa relationer mellan vari-
ablerna. Det förutsätter emellertid att den som utför
analysen medvetet sätter in interaktionstermer (pro-
dukter av två eller flera variabler) och undersöker
vilka interaktioner som förekommer i datamängden.
Med ett linjärt förhållande mellan förklarande vari-
abler och utgångsvariabeln menas t.ex. att risken
för prostatacancer ökar lika mycket när serum-PSA
ökar från 4 till 5
µ
g/l som när det ökar från 20 till
21
µ
g/l, ett antagande som sällan stämmer för
serummarkörer. Genom att transformera förklaran-
de variabler kan regressionsmodellen även hantera
olinjära förhållanden. Det här kräver förstås aktivi-
tet av den som utför analysen. Vid optimering av
neurala nätverk utförs den här delen av jobbet
automatiskt, vilket kan vara både bra och dåligt.
Forskaren lär sig knappast känna datamängden lika
bra, men det spar tid och neurala nätverk kan
ibland identifiera komplexa förhållanden som for-
skaren aldrig skulle hitta med regressionsanalys.
Sargent jämförde systematiskt regressionsanalys
och neurala nätverk i en litteraturöversikt.
11
I 28
studier hade en formell jämförelse mellan de två
teknikerna gjorts. Neurala nätverk var mer exakta
än regression i 10 studier, lika i 14 fall, och mindre
exakta i 4 studier. I de åtta största studierna, som
inkluderade mer än 5000 patienter, var de två meto-
derna lika i 7 fall, medan regression gav bättre
resultat i en studie. Sargent spekulerade att orsaken
kan vara snedvriden publicering: bara om patient-
materialet är stort nog kan resultat där neurala
nätverk inte övervinner regression publiceras. Inom
urologi hade både regressionsanalys och neurala
nätverk använts samtidigt i 14 studier före maj
2001.
12
I tre studier gav neurala nätverk bättre pre-
cision och i en studie sämre precision än regres-
sionsanalys. I fyra studier fungerade metoderna lika
bra, medan sex studier rapporterade att det neurala
nätverket var bättre än regressionsanalys utan att
testa detta statistiskt. Teoretiskt sett borde neurala
nätverk alltid ge minst lika god diagnostisk precisi-
on som regressionsmetoder. Om de två metoderna
klarar sig lika bra tyder det på att datamängden inte
innehåller sådana komplexa relationer som regres-
sionsmetoden inte kan identifiera. Om det neurala
nätverket ger sämre precision än regressionsmeto-
den är det skäl att misstänka överträning.
Kvalitetsproblem – varför fungerar algoritmen inte?
Det faktum att diagnostiska algoritmer fortfarande
inte har slagit igenom antyder att algoritmerna inte
fungerar tillfredställande. En orsak kan vara att den
omgivning där algoritmen tillämpas skiljer sig vä-
sentligt från träningsomgivningen. Den patientpo-
pulation som används för optimering av diagnostis-
ka algoritmer bör så långt som möjligt motsvara de
patienter vars information kommer att matas in i de
färdiga algoritmerna. Olika faktorer som plats, tid
och klinisk praxis kan göra att distributionen för en
del av de diagnostiska variablerna förändras. Ett
exempel är att algoritmen optimeras på patienter
som är mellan 40 och 50 år gamla, och tillämpas på
äldre patienter. Det kan påverka balansen mellan
specificitet och sensitivitet, och det kan också ändra
algoritmernas diagnostiska precision. Innan en
algoritm tas i bruk är det nödvändigt att försäkra
sig om att den fungerar som förväntat i den nya
omgivningen.
Neurala nätverk kunde tidigare konstrueras
enbart av programmeringskunniga. I dag finns det
många rätt användarvänliga program, som gör att
det går att skapa neurala nätverk utan desto mer
bakgrundskunskaper. Det här kan sänka kvaliteten
på algoritmerna. Schwarzer och medarbetare har
kritiskt granskat neurala nätverk inom onkologi och
urologi.
13,14
Så gott som alla studier var behäftade
med olika analysfel. Många av studierna var gjorda
| 3 | 2003
Klinisk Biokemi i Norden
(Fortsat fra side 11)
1...,2,3,4,5,6,7,8,9,10,11 13,14,15,16,17,18,19,20,21,22,...44
Powered by FlippingBook