Klinisk Biokemi i Norden Nr 2, vol. 25, 2013 - page 33

Klinisk Biokemi i Norden · 2 2013
 | 33
Ungefärliga svar
Vi är faktisk oftast inte intresserade i ett ”exakt” svar,
utan kan nöja oss med ett ”ungefärligt” svar. Om vi
vill räkna ut hur mycket en analys kostar oss under
ett år är räcker det oftast med beloppet i hela kronor,
eventuellt i hela ören. Men, ett exakt svar (med sexton
decimaler) är inte intressant. För datorn gör det dock
stor skillnad. Tidigare i artikeln nämndes det att exakta
lösningar till många problem inte är linjära – det vill
säga att en dubbling av data ger mer än en dubbling av
datortiden. Många sådana exakta algoritmer kan dock
ersättas av en ungefärlig algoritm (där osäkerheten kan
sättas till ett så litet intervall att den inte har någon
praktisk betydelse). Vi kan alltså använda en betydligt
snabbare algoritm som beräknar medianen av våra
observationer med en osäkerhet på 0,01 % i stället för
den långsammare och mer exakta algoritmen.
Slumpvisa urval
Ett alternativ som också ger ”ungefärliga” svar är att
utföra beräkningarna på ett slumpvis urval av data.
Om vi har 300000 mätningar på kreatinin, kan vi spara
tid om vi beräknar medianen på ett slumpvis urval av
10000 mätningar. Självklart kan vi om vi vill spara tid
inte företa det slumpmässiga urvalet när vi utför beräk-
ningarna, utan det slumpvisa urvalet måste i så fall vara
lagrat på förhand. Vi kan alltså konstruera en tabell
som innehåller slumpvis utvalda resultat. Alternativt
kan vi använda ett index (se under Allmänna råd) som
är statistiskt obereoende av resultaten. Låt oss säga att
vi oftast söker på fullständiga norska personnummer.
Vi gör ett index som är den elfte och sista siffran i det
norska personnumret och sorterar våra data efter detta
index. När vi ber ommedianen beräknar vi medianen
endast för personer där den elfte siffran är fyra. Förut-
sättningen är givetvis att dessa personer inte på något
systematiskt sätt skiljer sig från andra person med
andra slutsiffror.
Mer effektiva algoritmer
Några av de största nyvinningarna i statistik de senaste
åren har varit snabbare exakta algoritmer för enklare
beräkningar. Varians (och standardavvikelse) beräknar
de flesta av oss på detta sätt:
1. Först räknar vi ut genomsnittet av observationerna
2. Så räknar vi ut kvadratsumman av skillnaden mellan
observationerna och genomsnittet
Foto: Henrik Alfthan.
1...,23,24,25,26,27,28,29,30,31,32 34,35,36,37,38,39,40,41,42,43,...52
Powered by FlippingBook