Sbu • Statens beredning för medicinsk utvärdering The Swedish Council on Technology Assessment in Health Care

Sensitivitet, specificitet, positivt

Yüklə 4,3 Mb.

Pdf görüntüsü

səhifə	4/42
tarix	15.03.2017
ölçüsü	4,3 Mb.
	#11507

1 2 3 4 5 6 7 8 9 ... 42

Sensitivitet, specificitet, positivt

och negativt prediktionsvärde

För att beräkna tillförlitligheten (validiteten) hos ett diagnostiskt test

eller en metod för riskbedömning används främst fyra olika mått: sen-

sitivitet, specificitet, positivt och negativt prediktionsvärde. Sensitivitet

anger den andel av de sjuka där testet är positivt och specificitet den

andel av de friska där testet är negativt. Motsvarande för riskbedöm-

ning är: sensitivitet anger den andel av dem som blev sjuka där testet är

positivt och specificitet den andel av dem som förblev friska där testet

är negativt. Positivt prediktionsvärde (PPV) beskriver sannolikheten

att patienten har karies/kommer att få karies om testet är positivt. Det

K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G

negativa prediktionsvärdet (NPV) beskriver sannolikheten för att patien-

ten inte har karies/kommer att få karies om testet är negativt. De olika

kombinationerna av sjukdomsförekomst och testresultat kan ställas upp

i en fyrfältstabell, se Faktaruta 1.3.

PPV och NPV beskriver testets egenskaper från ett kliniskt perspektiv.

Medan sensitivitet och specificitet anses vara stabila mått på ett tests

förmåga att diagnostisera (eller prediktera) sjukdom, är de prediktiva

värdena beroende av prevalensen av sjukdomen i populationen; ju lägre

kariesprevalensen är, desto mer sjunker PPV för en given sensitivitet och

specificitet.

Det negativa prediktionsvärdet påverkas inte nämnvärt av sjukdoms-

prevalensen utom vid höga prevalenser, då värdet sjunker. Faktaruta 1.4

illustrerar hur PPV och NPV uppför sig i relation till sjukdomsprevalen-

sen för en viss sensitivitet och specificitet.

Ett lågt PPV innebär samtidigt att andelen falska positiva fynd (falska

alarm) ökar vid låg sjukdomsprevalens. Hur påverkar det min diagnos-

tiska tillförlitlighet? Hur tillförlitligt är ett röntgenfynd, t ex en radio-

lucens som jag noterat på en approximalyta i yttre delen av dentinet

hos en patient? Hur stor är sannolikheten att mitt röntgenfynd är sant

positivt, att det verkligen motsvarar en dentinskada? Den sannolikheten

(PPV) är alltså beroende av prevalensen av sådana dentinskador i popu-

lationen. Om prevalensen dentinskador i mitt patientklientel är låg, blir

också PPV relativt lågt, och andelen falska positiva fynd relativt hög.

Även med höga värden på sensitivitet och specificitet kan andelen falska

positiva fynd bli hög i en population med låg sjukdomsprevalens. I Fakta-

ruta 1.4 illustreras hur sjukdomsprevalensen påverkar andelen falska

positiva diagnoser.

Ett positivt prediktionsvärde från en studie kan därför inte direkt över-

föras till en annan population, om inte sjukdomsprevalensen är jämför-

bar. Man måste alltså vara försiktig när man applicerar resultat avseende

det positiva prediktiva värdet från en studie till sitt eget patientklientel.

K A P I T E L 1 • I n L E d n I n g

Receiver operating characteristic (ROC)

ROC är ett grafiskt sätt att sammanfatta testresultat. Genom att lägga

in sensitivitet gentemot 1 minus specificitet för varje ”cut-off” (tröskel-

värde) i ett diagram och sedan förbinda punkterna får man en så kallad

ROC-kurva. ROC-analys är hämtad från forskning om mottagning av

radio- och radarsignaler, där signal–brusförhållande analyseras. Inom

odontologin används det ofta för att jämföra och värdera olika röntgeno-

logiska metoder. Fördelen med ROC-analys är att man kan analysera

en metods prestanda när man har flera möjliga nivåer för gränsdragning

mellan sjukt och friskt. ROC kan beskrivas som en funktion där ande-

len sant positiva (sensitivitet) sätts i relation till andelen falskt positiva

(1 minus specificitet). I Faktaruta 1.5 ges ett exempel på hur ROC kan

användas. Rent matematiskt är den optimala gränsdragningen mellan

sjukt och friskt i den punkt som ligger närmast diagrammets övre

vänstra hörn. Det bästa valet i en klinisk situation behöver dock inte

vara där. Beroende på situationen, kan man välja att prioritera en stor

andel sant positiva och acceptera att andelen falskt positiva blir relativt

stor eller välja en relativt låg andel sant positiva för att undvika en hög

andel falskt positiva.

Likelihood-kvot (sannolikhetskvot)

Det är en fördel att ha ett mått på ett tests prestanda, ett mått som sam-

manfattar sensitivitet och specificitet och som är oberoende av sjuk-

domsprevalensen. Likelihood-kvoten (LR) är ett sådant mått. En positiv

likelihood-kvot (LR+) beskriver sannolikheten att vara testpositiv om

man är sjuk dividerat med sannolikheten att vara testpositiv om man är

frisk (sensitivitet/1 minus specificitet). En negativ likelihood-kvot (LR–)

beskriver sannolikheten att vara testnegativ om man är sjuk dividerat

med sannolikheten att vara testnegativ om man är frisk (1 minus sen-

sitivitet/specificitet). En metods likelihood-kvot ger alltså oddset för

att sjukdom föreligger vid positivt testresultat respektive oddset för att

sjukdom föreligger vid ett negativt testresultat och ger därmed en enkel

överblick över hur värdefullt ett test är. Likelihood-kvoten kan ses som

en omräkningsfaktor och kan användas för att fastställa sannolikheten

för sjukdom efter positivt testutfall om man känner till sjukdomspre-

valensen i populationen. Positiv och negativ likelihood-kvot beskrivs

K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G

ytterligare i Faktaruta 1.6. Exempel på hur det så kallade nomogrammet

kan användas för att beräkna likehood-kvoter illustreras i Faktaruta 1.7.

Andra mått som används

i samband med riskbedömning

Relativ risk (RR)

Relativ risk är sannolikheten för att en händelse ska inträffa om man är

exponerad för en riskfaktor dividerat med sannolikheten för att händel-

sen ska inträffa om man inte är exponerad för riskfaktorn ifråga. Begrep-

pet används ibland för att jämföra riskerna för att få karies hos individer

med respektive utan en specifik riskfaktor (t ex hög sockerkonsumtion).

Relativ risk i det exemplet är kvoten mellan individer som får karies som

har hög sockerkonsumtion och individer som får karies som inte har hög

sockerkonsumtion. Beräkning av relativ risk illustreras i Faktaruta 1.8.

Oddskvot (”odds ratio”, OR)

Odds är sannolikheten för att en händelse ska inträffa dividerat med

sannolikheten för att händelsen inte ska inträffa. Begreppet oddskvot

används för att uttrycka den relativa risken för sjukdom för dem som är

exponerade för en riskfaktor i relation till dem som inte är exponerade

för riskfaktorn. Framför allt i studier som undersöker effekten av riskbe-

dömning där flera riskfaktorer ingår, används ofta oddskvot. Beräkning

av odds och oddskvot illustreras i Faktaruta 1.8.

K A P I T E L 1 • I n L E d n I n g

År

Ålder, år

3 6

1985

1990

1995

2000

2005

73

År

DFT

0

1

2

3

4

5–7

≥8

1985

17

10

1990

1995

2000

2005

1

År

DFT

0

1

2

3

4–6

7–9

≥10

1985

35

14

1990

1995

2000

2005

2

Tabell 1.1 Procentandel kariesfria av undersökta barn (folktandvården)

i det primära bettet (mjölktänder) från år 1985 till 2005.

Tabell 1.2 Procentuell fördelning av antalet karierade och fyllda tänder

(DFT = decayed, filled teeth) hos 12-åringar från år 1985 till 2005.

Tabell 1.3 Procentuell fördelning av antalet karierade och fyllda tänder

(DFT =decayed, filled teeth) hos 19-åringar från år 1985 till 2005.

K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G

46

Tabell 1.1 Procentandel kariesfria av undersökta barn (folktandvården)

i det primära bettet (mjölktänder) från år 1985 till 2005.

Tabell 1.2 Procentuell fördelning av antalet karierade och fyllda tänder

(DFT = decayed, filled teeth) hos 12-åringar från år 1985 till 2005.

Tabell 1.3 Procentuell fördelning av antalet karierade och fyllda tänder

(DFT =decayed, filled teeth) hos 19-åringar från år 1985 till 2005.

Figur 1.1 Figuren illustrerar hur faktorer på olika nivåer – från biologisk nivå

till samhällsnivå – är involverade i kariesprocessen. På den biologiska nivån

är balansen mellan remineralisering och demineralisering beroende av kost-

och munhygienvanor men också av faktorer som t ex tandens morfologi och

salivfunktion. Kost- och munhygienvanor styrs av individens livsstil och attityder

som i sin tur påverkas av sociodemografiska faktorer och välfärden i samhället.

Få syratoleranta och syra-

producerande bakterier.

Kortvariga pH-fall i biofilmen:

Remineralisering >

demineralisering

• Begränsat intag av

fermentabla kolhydrater

• God munhygien

• Tillräcklig fluortillförsel

• Frekvent intag av

fermentabla kolhydrater

• Dålig munhygien

• Otillräcklig fluortillförsel

Utbildning, kunskaper, livsstil, attityder, beteende

Ålder, tandmorfologi, tandyta,

salivfunktion, genetiska faktorer

Sociodemografi och välfärd

Samhällsnivå

Individnivå

Biologisk nivå

Tillväxt av syratoleranta och

syraproducerande bakterier.

Utdragna pH-fall i biofilmen:

Demineralisering >

remineralisering

K A P I T E L 1 • I n L E d n I n g

Kariesskadan synlig

för blotta ögat

Subklinisk:

Kariesskadan synlig

i mikroskop

Tid

Ökande förstörelse

av tandkronan

En kavitet

har bildats

Figur 1.2 Utveckling av en kariesskada från subklinisk nivå till ökande grad av

destruktion av tandvävnad. Tidsaxeln speglar inte det verkliga tidsförhållandet

mellan olika stadier i en kariesskadas utveckling.

Figur 1.3 Underkäkständer i höger käkhalva. Tändernas approximalytor

är de ytor som står i kontakt med andra tänders approximalytor

1

.

Approximalyta

Tuggyta

Approximalyta

1. LifeART copyright (2007) Wolters Kluwer Health, Inc. Lippincott Williams & Wilkins.

K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G

48

Faktaruta 1.1 Olika aspekter på validitet.

•

Kriterievaliditet (”criterion validity”) där testet jämförs

med en referensmetod (”gold standard”)*

•

Innehållsvaliditet (”content validity”) där testet baseras på all relevant

teoretisk och empirisk kunskap om det som mäts

•

Begreppsvaliditet (”construct validity”)** där testet är uppbyggt så att

mätningarna stämmer med vad andra har kommit fram till med andra

skalor med samma teoretiska definitioner.

Faktaruta 1.2 Beräkning av reliabilitet med ett hypotetiskt exempel:

röntgenbilder av 60 approximalytor tolkas av två undersökare med avseende på

förekomst av dentinkaries. Positiv = dentinkaries; negativ = ingen dentinkaries.

a) Resultatet av upprepad tolkning av röntgenbilder av 60 approximalytor

Första tolkningen

Andra tolkningen

Positiv

Negativ

Totalt

Positiv

Negativ

Totalt

* Den typ av validitet som denna rapport utvärderar.

** Ett exempel där ett test validerats med ”construct validity” är en studie där diagnoserna

aktiv eller inaktiv initial karies bestämdes med hjälp av visuell-taktil undersökning [20]. Dia-

gnoserna validerades efter en observationstid på tre år med utgångspunkt från ett teoretiskt

resonemang kring fluorens effekt på aktiva respektive inaktiva initiala kariesskador.

Faktarutan fortsätter på nästa sida

K A P I T E L 1 • I n L E d n I n g

Faktarutan fortsätter på nästa sida

b) det förväntade slumpmässiga resultatet om diagnoserna var oberoende av

varandra

Andra tolkningen

Första tolkningen

Positiv

Negativ

Totalt

Positiv

Negativ

Totalt

5,13

8,87

14,00

16,87

29,13

46,00

22,00

38,00

60,00

Resultatet från a): Vid första tolkningen hade 22 ytor dentinkaries och vid andra

tolkningen som gjordes ”blint” (ovetande om vad observatören kommit fram till

första gången) hade 14 ytor dentinkaries. 11 ytor var positiva båda gångerna och

35 ytor var negativa vid båda tillfällena. Den procentuella överensstämmelsen var

alltså (11+35)/60=0,77 eller 77%.

Detta mått på observatörsvariation är dock missledande, eftersom man ignorerar att

de två tolkningarna kan ge samma resultat beroende på slumpen. Om man tänker sig

att observatören andra gången slumpmässigt väljer 14 röntgenbilder och benämner

dem ”positiva”. Man kan då förvänta sig att 22 * 14/60 = 5,13 bilder kommer att bli

”positiva” vid båda tillfällena och att 38 * 46/60 = 29,13 kommer att bli ”negativa”

båda gångerna. Det förväntade resultatet beroende på slumpen är illustrerat i b).

Man kan alltså beräkna att det förväntade resultatet som beror på slumpen är (5,13

+ 29,13)/60 = 0,57 eller 57%. När man tar detta i betraktande, blir det observerade

procentuella överensstämmelsen på 77% mindre imponerande.

Det är detta problem som formaliserats i den så kallade kappastatistiken, som

relaterar den observerade överensstämmelsen till den överensstämmelse som kan

bero på slumpen. I det beskrivna exemplet är kappavärdet 47%, vilket betyder att

skillnaden mellan den observerade överensstämmelsen och den slumpberoende

överensstämmelsen (77–57%) endast är 47% av skillnaden mellan perfekt överens-

stämmelse och slumpmässig överensstämmelse (100–57%). Detta kan illustreras

med en figur:

A______________________B________C__________D

100

ÖVERENSSTÄMMELSE (%)

A = total brist på överensstämmelse; B = den förväntade överensstämmelsen pga

slumpen; C = den observerade överensstämmelsen; D = perfekt överensstäm-

melse. Figuren härleder till a) och b) ovan.

Kappa = (C–B)/(D–B) = (77–57)/(100–57) = 0,47 eller 47%.

Faktaruta 1.2 fortsättning

K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G

Faktaruta 1.3 Fyrfältstabell med kombinationer av testresultat och

sjukdomsförekomst samt beräkning av sensitivitet, specificitet, positivt och

negativt prediktionsvärde och exempel som illlustrerar hur sjukdomsprevalensen

påverkar andelen falska positiva diagnoser.

Nya testet visar:

Referensmetoden visar att:

Sjukdom finns

Sjukdom saknas

Positivt testresultat

a = sant positiv

Fastställer korrekt

b = falskt positiv

”Falskt alarm”

Negativt testresultat

c = falskt negativ

”Fall missas”

d = sant negativ

Utesluter korrekt

Sensitivitet = a/a+c

Specificitet = d/b+d

Positivt prediktionsvärde (PPV) = a/a+b

Negativt prediktionsvärde (NPV) = d/c+d

Sensitivitet och specificitet kan vardera anta värden mellan 0 och 1. Ju närmare 1

desto bättre är det diagnostiska/prognostiska testet. Om summan av sensitivitet

och specificitet är 2, är testet perfekt. Om sensitivitet och specificitet vardera är

≤0,5, är testet värdelöst, dvs det är inte bättre än slumpen. Värden för sensitivitet

och specificitet multipliceras ofta med 100 och uttrycks i procent.

Faktarutan fortsätter på nästa sida

K A P I T E L 1 • I n L E d n I n g

Två exempel som illustrerar hur sjukdomsprevalensen påverkar andelen

falska positiva diagnoser (FP). I båda exemplen är sensitiviteten = 90% och

specificiteten = 99%.

1. Sjukdomsprevalens = 30%

Sjukdom finns

Sjukdom finns inte

Totalt

Positivt

testresultat

270

7 (FP)

277

Negativt

testresultat

693

723

Totalt

300

700

1 000

Andelen falska positiva diagnoser: 7/277 x 100 = 2,5%

2. Sjukdomsprevalens = 5%

Sjukdom finns

Sjukdom finns inte

Totalt

Positivt

testresultat

10 (FP)

55

Negativt

testresultat

940

945

Totalt

950

1 000

Andelen falska positiva diagnoser: 10/55 x 100 = 18%

Faktaruta 1.3 fortsättning

K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G

52

Faktaruta 1.4 Diagram som illustrerar hur det positiva och negativa

prediktionsvärdet påverkas av sjukdomsprevalensen. I exemplet är andelen

sanna positiva 0,6 och andelen sanna negativa 0,9. Vid en sjukdomsprevalens

på 10 procent blir det positiva prediktionsvärdet (PPV) 0,40 medan det negativa

prediktionsvärdet (NPV) blir 0,95. Om sjukdomsprevalensen är 50 procent, ökar

PPV till 0,85, medan NPV sjunker till 0,70.

Pr

ediktivt vär

de

Prevalens

NPV

PPV

Andelen sant

positiva = 0,6

Andelen sant

negativa = 0,9

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0,1

0,2

0,3

0,4

0,5

0,6 0,7

0,8 0,9

1,0

1,1

1,2

PPV = 0,40

NPV = 0,95

PPV = 0,85

NPV = 0,70

K A P I T E L 1 • I n L E d n I n g

Faktaruta 1.5 ”Receiver operating characteristic” (ROC) med sanna positiva

värden (sensitivitet) på y-axeln och falska positiva värden (1 – specificitet) på

x-axeln. Kurvorna visar sambandet mellan sanna positiva värden och falska

positiva värden för dentinkaries på approximal- och tuggytor. Exemplet är

från en in vitro-studie med extraherade tänder (”gold standard” = histologisk

verifikation), där undersökare fick ange graden av säkerhet för dentinkaries

på röntgenbilden på en skala från 0 = ”säkert ingen dentinkaries” till 5 =

”helt säkert dentinkaries”. Från Espelid 2001 [21].

Sensitivitet

1 – Specificitet

Approximalkaries

Ocklusalkaries

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0,1

0,2

0,3

0,4

0,5

0,6 0,7

0,8 0,9

1,0

K A R I E S – d I A G N O S T I K , R I S K B E d ö M N I N G O C H I C K E - I N vA S I v B E H A N d L I N G

Yüklə 4,3 Mb.

Dostları ilə paylaş:

1 2 3 4 5 6 7 8 9 ... 42