11
visa optimeringsmetoder fastnar lätt i lokala felmi-
nima, och flera starter med nya slumpvisa parame-
tervärden måste göras innan ett globalt felminimum
hittas. På så vis skiljer sig MLP från regressionsa-
nalys, som alltid ger samma parametervärden.
Undvik överträning
Neurala nätverk kan lätt övertränas att diagnostisera
alla fall i träningsmängden korrekt. Ett övertränat
nätverk har förlorat förmågan att generalisera, dvs.
att identifiera nya fall korrekt. Det vanligaste sättet
att hantera överträning är att avsluta träningen tidigt
(early stopping) (Figur 5). En del av träningsmängden
avdelas till en skild valideringsmängd. Nätverks-
träningen stoppas när modellens precision börjar
minska (prediktionsfelens kvadrat summa ökar) i va-
lideringsmängden som tecken på överträning. Det
problematiska med tidigt avslutad träning är att den
optimala tiden för avslutning är svår att bestämma;
dessutom slösar metoden data då en del av tränings-
mängden måste användas för validering.
Andra metoder minskar överträning genom att
straffa stora modeller i optimeringsskedet. I stället
för att som vid ordinär neuralnätsträning enbart
minimera prediktionsfelen kan vissa metoder också
minimera både antalet parametrar och parametrar-
nas storlek. En liten modell med få parametrar pre-
mieras alltså i träningsprocessen.
1,10
En sådan
modell är mindre sannolikt övertränad och upp-
täcker inte sådana detaljer i träningsmängden som
inte är allmängiltiga.
En neuralnätsmodell bör alltid testas på helt osett
data. Med detta avses att testmängden ska använ-
das enbart för slutgiltig modelltestning. Vanliga fel
som ses i litteraturen är att testmängden används
för att utvärdera neuralnätsmodellens struktur; t.ex.
kan antalet dolda neuroner väljas utgående från
resultatet i testmängden. Termerna testmängd och
valideringsmängd används inte konsekvent i littera-
turen. Jag föredrar att kalla det data som används
för att validera träningsprocessen (t.ex. för att
bedöma tidig avslutning av träning) för validerings-
mängd. Testmängden används för slutgiltig model-
ltestning. Storleken på dessa datamängder kan
variera. Testmängden kan bestå av bara en patient
| 3 | 2003
Klinisk Biokemi i Norden
(Fortsætter side 12)
Figur 5