Sensitivitet, specificitet, positivt
och negativt prediktionsvärde
För att beräkna tillförlitligheten (validiteten) hos ett diagnostiskt test
eller en metod för riskbedömning används främst fyra olika mått: sen-
sitivitet, specificitet, positivt och negativt prediktionsvärde. Sensitivitet
anger den andel av de sjuka där testet är positivt och specificitet den
andel av de friska där testet är negativt. Motsvarande för riskbedöm-
ning är: sensitivitet anger den andel av dem som blev sjuka där testet är
positivt och specificitet den andel av dem som förblev friska där testet
är negativt. Positivt prediktionsvärde (PPV) beskriver sannolikheten
att patienten har karies/kommer att få karies om testet är positivt. Det
K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G
42
negativa prediktionsvärdet (NPV) beskriver sannolikheten för att patien-
ten inte har karies/kommer att få karies om testet är negativt. De olika
kombinationerna av sjukdomsförekomst och testresultat kan ställas upp
i en fyrfältstabell, se Faktaruta 1.3.
PPV och NPV beskriver testets egenskaper från ett kliniskt perspektiv.
Medan sensitivitet och specificitet anses vara stabila mått på ett tests
förmåga att diagnostisera (eller prediktera) sjukdom, är de prediktiva
värdena beroende av prevalensen av sjukdomen i populationen; ju lägre
kariesprevalensen är, desto mer sjunker PPV för en given sensitivitet och
specificitet.
Det negativa prediktionsvärdet påverkas inte nämnvärt av sjukdoms-
prevalensen utom vid höga prevalenser, då värdet sjunker. Faktaruta 1.4
illustrerar hur PPV och NPV uppför sig i relation till sjukdomsprevalen-
sen för en viss sensitivitet och specificitet.
Ett lågt PPV innebär samtidigt att andelen falska positiva fynd (falska
alarm) ökar vid låg sjukdomsprevalens. Hur påverkar det min diagnos-
tiska tillförlitlighet? Hur tillförlitligt är ett röntgenfynd, t ex en radio-
lucens som jag noterat på en approximalyta i yttre delen av dentinet
hos en patient? Hur stor är sannolikheten att mitt röntgenfynd är sant
positivt, att det verkligen motsvarar en dentinskada? Den sannolikheten
(PPV) är alltså beroende av prevalensen av sådana dentinskador i popu-
lationen. Om prevalensen dentinskador i mitt patientklientel är låg, blir
också PPV relativt lågt, och andelen falska positiva fynd relativt hög.
Även med höga värden på sensitivitet och specificitet kan andelen falska
positiva fynd bli hög i en population med låg sjukdomsprevalens. I Fakta-
ruta 1.4 illustreras hur sjukdomsprevalensen påverkar andelen falska
positiva diagnoser.
Ett positivt prediktionsvärde från en studie kan därför inte direkt över-
föras till en annan population, om inte sjukdomsprevalensen är jämför-
bar. Man måste alltså vara försiktig när man applicerar resultat avseende
det positiva prediktiva värdet från en studie till sitt eget patientklientel.
43
K A P I T E L 1 • I n L E d n I n g
Receiver operating characteristic (ROC)
ROC är ett grafiskt sätt att sammanfatta testresultat. Genom att lägga
in sensitivitet gentemot 1 minus specificitet för varje ”cut-off” (tröskel-
värde) i ett diagram och sedan förbinda punkterna får man en så kallad
ROC-kurva. ROC-analys är hämtad från forskning om mottagning av
radio- och radarsignaler, där signal–brusförhållande analyseras. Inom
odontologin används det ofta för att jämföra och värdera olika röntgeno-
logiska metoder. Fördelen med ROC-analys är att man kan analysera
en metods prestanda när man har flera möjliga nivåer för gränsdragning
mellan sjukt och friskt. ROC kan beskrivas som en funktion där ande-
len sant positiva (sensitivitet) sätts i relation till andelen falskt positiva
(1 minus specificitet). I Faktaruta 1.5 ges ett exempel på hur ROC kan
användas. Rent matematiskt är den optimala gränsdragningen mellan
sjukt och friskt i den punkt som ligger närmast diagrammets övre
vänstra hörn. Det bästa valet i en klinisk situation behöver dock inte
vara där. Beroende på situationen, kan man välja att prioritera en stor
andel sant positiva och acceptera att andelen falskt positiva blir relativt
stor eller välja en relativt låg andel sant positiva för att undvika en hög
andel falskt positiva.
Likelihood-kvot (sannolikhetskvot)
Det är en fördel att ha ett mått på ett tests prestanda, ett mått som sam-
manfattar sensitivitet och specificitet och som är oberoende av sjuk-
domsprevalensen. Likelihood-kvoten (LR) är ett sådant mått. En positiv
likelihood-kvot (LR+) beskriver sannolikheten att vara testpositiv om
man är sjuk dividerat med sannolikheten att vara testpositiv om man är
frisk (sensitivitet/1 minus specificitet). En negativ likelihood-kvot (LR–)
beskriver sannolikheten att vara testnegativ om man är sjuk dividerat
med sannolikheten att vara testnegativ om man är frisk (1 minus sen-
sitivitet/specificitet). En metods likelihood-kvot ger alltså oddset för
att sjukdom föreligger vid positivt testresultat respektive oddset för att
sjukdom föreligger vid ett negativt testresultat och ger därmed en enkel
överblick över hur värdefullt ett test är. Likelihood-kvoten kan ses som
en omräkningsfaktor och kan användas för att fastställa sannolikheten
för sjukdom efter positivt testutfall om man känner till sjukdomspre-
valensen i populationen. Positiv och negativ likelihood-kvot beskrivs
K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G
44
ytterligare i Faktaruta 1.6. Exempel på hur det så kallade nomogrammet
kan användas för att beräkna likehood-kvoter illustreras i Faktaruta 1.7.
Andra mått som används
i samband med riskbedömning
Relativ risk (RR)
Relativ risk är sannolikheten för att en händelse ska inträffa om man är
exponerad för en riskfaktor dividerat med sannolikheten för att händel-
sen ska inträffa om man inte är exponerad för riskfaktorn ifråga. Begrep-
pet används ibland för att jämföra riskerna för att få karies hos individer
med respektive utan en specifik riskfaktor (t ex hög sockerkonsumtion).
Relativ risk i det exemplet är kvoten mellan individer som får karies som
har hög sockerkonsumtion och individer som får karies som inte har hög
sockerkonsumtion. Beräkning av relativ risk illustreras i Faktaruta 1.8.
Oddskvot (”odds ratio”, OR)
Odds är sannolikheten för att en händelse ska inträffa dividerat med
sannolikheten för att händelsen inte ska inträffa. Begreppet oddskvot
används för att uttrycka den relativa risken för sjukdom för dem som är
exponerade för en riskfaktor i relation till dem som inte är exponerade
för riskfaktorn. Framför allt i studier som undersöker effekten av riskbe-
dömning där flera riskfaktorer ingår, används ofta oddskvot. Beräkning
av odds och oddskvot illustreras i Faktaruta 1.8.
45
K A P I T E L 1 • I n L E d n I n g
År
Ålder, år
3 6
1985
83
45
1990
91
60
1995
93
65
2000
94
70
2005
95
73
År
DFT
0
1
2
3
4
5–7
≥8
1985
17
10
11
12
19
21
10
1990
40
14
12
10
10
11
3
1995
49
15
12
9
8
6
1
2000
60
16
10
6
4
2
1
2005
58
17
11
6
4
3
1
År
DFT
0
1
2
3
4–6
7–9
≥10
1985
35
14
11
7
15
8
10
1990
50
14
10
7
11
4
4
1995
58
14
9
5
8
3
3
2000
59
14
9
5
8
3
3
2005
59
15
9
5
7
3
2
Tabell 1.1 Procentandel kariesfria av undersökta barn (folktandvården)
i det primära bettet (mjölktänder) från år 1985 till 2005.
Tabell 1.2 Procentuell fördelning av antalet karierade och fyllda tänder
(DFT = decayed, filled teeth) hos 12-åringar från år 1985 till 2005.
Tabell 1.3 Procentuell fördelning av antalet karierade och fyllda tänder
(DFT =decayed, filled teeth) hos 19-åringar från år 1985 till 2005.
K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G
46
Tabell 1.1 Procentandel kariesfria av undersökta barn (folktandvården)
i det primära bettet (mjölktänder) från år 1985 till 2005.
Tabell 1.2 Procentuell fördelning av antalet karierade och fyllda tänder
(DFT = decayed, filled teeth) hos 12-åringar från år 1985 till 2005.
Tabell 1.3 Procentuell fördelning av antalet karierade och fyllda tänder
(DFT =decayed, filled teeth) hos 19-åringar från år 1985 till 2005.
Figur 1.1 Figuren illustrerar hur faktorer på olika nivåer – från biologisk nivå
till samhällsnivå – är involverade i kariesprocessen. På den biologiska nivån
är balansen mellan remineralisering och demineralisering beroende av kost-
och munhygienvanor men också av faktorer som t ex tandens morfologi och
salivfunktion. Kost- och munhygienvanor styrs av individens livsstil och attityder
som i sin tur påverkas av sociodemografiska faktorer och välfärden i samhället.
Få syratoleranta och syra-
producerande bakterier.
Kortvariga pH-fall i biofilmen:
Remineralisering >
demineralisering
• Begränsat intag av
fermentabla kolhydrater
• God munhygien
• Tillräcklig fluortillförsel
• Frekvent intag av
fermentabla kolhydrater
• Dålig munhygien
• Otillräcklig fluortillförsel
Utbildning, kunskaper, livsstil, attityder, beteende
Ålder, tandmorfologi, tandyta,
salivfunktion, genetiska faktorer
Sociodemografi och välfärd
Samhällsnivå
Individnivå
Biologisk nivå
Tillväxt av syratoleranta och
syraproducerande bakterier.
Utdragna pH-fall i biofilmen:
Demineralisering >
remineralisering
47
K A P I T E L 1 • I n L E d n I n g
Kariesskadan synlig
för blotta ögat
Subklinisk:
Kariesskadan synlig
i mikroskop
Tid
Ökande förstörelse
av tandkronan
En kavitet
har bildats
Figur 1.2 Utveckling av en kariesskada från subklinisk nivå till ökande grad av
destruktion av tandvävnad. Tidsaxeln speglar inte det verkliga tidsförhållandet
mellan olika stadier i en kariesskadas utveckling.
Figur 1.3 Underkäkständer i höger käkhalva. Tändernas approximalytor
är de ytor som står i kontakt med andra tänders approximalytor
1
.
Approximalyta
Tuggyta
Approximalyta
1. LifeART copyright (2007) Wolters Kluwer Health, Inc. Lippincott Williams & Wilkins.
All rights reserved.
K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G
48
Faktaruta 1.1 Olika aspekter på validitet.
•
Kriterievaliditet (”criterion validity”) där testet jämförs
med en referensmetod (”gold standard”)*
•
Innehållsvaliditet (”content validity”) där testet baseras på all relevant
teoretisk och empirisk kunskap om det som mäts
•
Begreppsvaliditet (”construct validity”)** där testet är uppbyggt så att
mätningarna stämmer med vad andra har kommit fram till med andra
skalor med samma teoretiska definitioner.
Faktaruta 1.2 Beräkning av reliabilitet med ett hypotetiskt exempel:
röntgenbilder av 60 approximalytor tolkas av två undersökare med avseende på
förekomst av dentinkaries. Positiv = dentinkaries; negativ = ingen dentinkaries.
a) Resultatet av upprepad tolkning av röntgenbilder av 60 approximalytor
Första tolkningen
Andra tolkningen
Positiv
Negativ
Totalt
Positiv
Negativ
Totalt
11
3
14
11
35
46
22
38
60
* Den typ av validitet som denna rapport utvärderar.
** Ett exempel där ett test validerats med ”construct validity” är en studie där diagnoserna
aktiv eller inaktiv initial karies bestämdes med hjälp av visuell-taktil undersökning [20]. Dia-
gnoserna validerades efter en observationstid på tre år med utgångspunkt från ett teoretiskt
resonemang kring fluorens effekt på aktiva respektive inaktiva initiala kariesskador.
Faktarutan fortsätter på nästa sida
49
K A P I T E L 1 • I n L E d n I n g
Faktarutan fortsätter på nästa sida
b) det förväntade slumpmässiga resultatet om diagnoserna var oberoende av
varandra
Andra tolkningen
Första tolkningen
Positiv
Negativ
Totalt
Positiv
Negativ
Totalt
5,13
8,87
14,00
16,87
29,13
46,00
22,00
38,00
60,00
Resultatet från a): Vid första tolkningen hade 22 ytor dentinkaries och vid andra
tolkningen som gjordes ”blint” (ovetande om vad observatören kommit fram till
första gången) hade 14 ytor dentinkaries. 11 ytor var positiva båda gångerna och
35 ytor var negativa vid båda tillfällena. Den procentuella överensstämmelsen var
alltså (11+35)/60=0,77 eller 77%.
Detta mått på observatörsvariation är dock missledande, eftersom man ignorerar att
de två tolkningarna kan ge samma resultat beroende på slumpen. Om man tänker sig
att observatören andra gången slumpmässigt väljer 14 röntgenbilder och benämner
dem ”positiva”. Man kan då förvänta sig att 22 * 14/60 = 5,13 bilder kommer att bli
”positiva” vid båda tillfällena och att 38 * 46/60 = 29,13 kommer att bli ”negativa”
båda gångerna. Det förväntade resultatet beroende på slumpen är illustrerat i b).
Man kan alltså beräkna att det förväntade resultatet som beror på slumpen är (5,13
+ 29,13)/60 = 0,57 eller 57%. När man tar detta i betraktande, blir det observerade
procentuella överensstämmelsen på 77% mindre imponerande.
Det är detta problem som formaliserats i den så kallade kappastatistiken, som
relaterar den observerade överensstämmelsen till den överensstämmelse som kan
bero på slumpen. I det beskrivna exemplet är kappavärdet 47%, vilket betyder att
skillnaden mellan den observerade överensstämmelsen och den slumpberoende
överensstämmelsen (77–57%) endast är 47% av skillnaden mellan perfekt överens-
stämmelse och slumpmässig överensstämmelse (100–57%). Detta kan illustreras
med en figur:
A______________________B________C__________D
0
57
77
100
ÖVERENSSTÄMMELSE (%)
A = total brist på överensstämmelse; B = den förväntade överensstämmelsen pga
slumpen; C = den observerade överensstämmelsen; D = perfekt överensstäm-
melse. Figuren härleder till a) och b) ovan.
Kappa = (C–B)/(D–B) = (77–57)/(100–57) = 0,47 eller 47%.
Faktaruta 1.2 fortsättning
K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G
50
Faktaruta 1.3 Fyrfältstabell med kombinationer av testresultat och
sjukdomsförekomst samt beräkning av sensitivitet, specificitet, positivt och
negativt prediktionsvärde och exempel som illlustrerar hur sjukdomsprevalensen
påverkar andelen falska positiva diagnoser.
Nya testet visar:
Referensmetoden visar att:
Sjukdom finns
Sjukdom saknas
Positivt testresultat
a = sant positiv
Fastställer korrekt
b = falskt positiv
”Falskt alarm”
Negativt testresultat
c = falskt negativ
”Fall missas”
d = sant negativ
Utesluter korrekt
Sensitivitet = a/a+c
Specificitet = d/b+d
Positivt prediktionsvärde (PPV) = a/a+b
Negativt prediktionsvärde (NPV) = d/c+d
Sensitivitet och specificitet kan vardera anta värden mellan 0 och 1. Ju närmare 1
desto bättre är det diagnostiska/prognostiska testet. Om summan av sensitivitet
och specificitet är 2, är testet perfekt. Om sensitivitet och specificitet vardera är
≤0,5, är testet värdelöst, dvs det är inte bättre än slumpen. Värden för sensitivitet
och specificitet multipliceras ofta med 100 och uttrycks i procent.
Faktarutan fortsätter på nästa sida
51
K A P I T E L 1 • I n L E d n I n g
Två exempel som illustrerar hur sjukdomsprevalensen påverkar andelen
falska positiva diagnoser (FP). I båda exemplen är sensitiviteten = 90% och
specificiteten = 99%.
1. Sjukdomsprevalens = 30%
Sjukdom finns
Sjukdom finns inte
Totalt
Positivt
testresultat
270
7 (FP)
277
Negativt
testresultat
30
693
723
Totalt
300
700
1 000
Andelen falska positiva diagnoser: 7/277 x 100 = 2,5%
2. Sjukdomsprevalens = 5%
Sjukdom finns
Sjukdom finns inte
Totalt
Positivt
testresultat
45
10 (FP)
55
Negativt
testresultat
5
940
945
Totalt
50
950
1 000
Andelen falska positiva diagnoser: 10/55 x 100 = 18%
Faktaruta 1.3 fortsättning
K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G
52
Faktaruta 1.4 Diagram som illustrerar hur det positiva och negativa
prediktionsvärdet påverkas av sjukdomsprevalensen. I exemplet är andelen
sanna positiva 0,6 och andelen sanna negativa 0,9. Vid en sjukdomsprevalens
på 10 procent blir det positiva prediktionsvärdet (PPV) 0,40 medan det negativa
prediktionsvärdet (NPV) blir 0,95. Om sjukdomsprevalensen är 50 procent, ökar
PPV till 0,85, medan NPV sjunker till 0,70.
Pr
ediktivt vär
de
Prevalens
NPV
PPV
Andelen sant
positiva = 0,6
Andelen sant
negativa = 0,9
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,1
0,2
0,3
0,4
0,5
0,6 0,7
0,8 0,9
1,0
1,1
1,2
PPV = 0,40
NPV = 0,95
PPV = 0,85
NPV = 0,70
53
K A P I T E L 1 • I n L E d n I n g
Faktaruta 1.5 ”Receiver operating characteristic” (ROC) med sanna positiva
värden (sensitivitet) på y-axeln och falska positiva värden (1 – specificitet) på
x-axeln. Kurvorna visar sambandet mellan sanna positiva värden och falska
positiva värden för dentinkaries på approximal- och tuggytor. Exemplet är
från en in vitro-studie med extraherade tänder (”gold standard” = histologisk
verifikation), där undersökare fick ange graden av säkerhet för dentinkaries
på röntgenbilden på en skala från 0 = ”säkert ingen dentinkaries” till 5 =
”helt säkert dentinkaries”. Från Espelid 2001 [21].
Sensitivitet
1 – Specificitet
Approximalkaries
Ocklusalkaries
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,1
0,2
0,3
0,4
0,5
0,6 0,7
0,8 0,9
1,0
K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G
54
Dostları ilə paylaş: |