Evaluatie van de testuitslagen

Hoe interpreteert u de testuitslagen?

 

De belangrijkste basisbegrippen voor het interpreteren van een uitslag in auto-immuniteitsdiagnostiek zijn

  1. Sensitiviteit en specificiteit
  2. ROC-curve
  3. Positief en negatief voorspellende waarde
  4. Positieve en negatieve aannemelijkheidsverhouding

 

1. Sensitiviteit en specificiteit

Definitie:

Sensitiviteit is het aantal echt-positieve uitslagen.

 

TP

 

Aantal echt-positieven

Sensitiviteit =

----------

=

-------------------------------------

 

TP + FN

 

Aantal patiënten met deze ziekte

(TP = echt-positieven, FN = fout-negatieven)

Specificiteit is het aantal negatieve uitslagen bij mensen die de ziekte niet hebben (echt-negatieve uitslagen in controlepersonen).

 

TN

 

Aantal echt-negatieven

Specificiteit =

----------

=

-------------------------------------

 

TN + FP

 

Aantal controlepersonen

(TN = echt-negatieven, FP = fout-positieven)

De controlegroep moet bestaan uit een populatie van gezonde individuen. Om de specificiteit van een test realistisch te kunnen evalueren, dient de controlepopulatie echter te bestaan uit patiënten met ziekten die van belang zijn in de differentiële diagnose. De specificiteit van een test op coeliakie dient bijvoorbeeld te worden geëvalueerd met een patiëntpopulatie met andere maag-darmaandoeningen, zoals darmontstekingen, maag-darminfecties enz.

Voorbeeld:

De prevalentie van reumatoïde artritis (RA) in de geteste populatie is 2%. Dat betekent dat 100 van de 5.000 geteste individuen reumatoïde artritis zullen hebben. 4.900 personen zijn gezond of hebben een andere ziekte, maar in ieder geval geen reumatoïde artritis.

Met de test uit dit voorbeeld waren 73 van de 100 RA-patiënten positief (echt-positieven). Bij 27 werd niets gevonden (fout-negatieven). In de controlegroep van 4.900 personen die geen RA hebben, waren 73 positief (fout-positieven) en 4.827 negatief (echt-negatieven).

  Test positief Test negatief Totaal
RA 73 27 100
Geen RA 73 4.827 4.900
Totaal 146 4.854 5.000

De sensitiviteit van deze test is 0,73 of 73% (aantal echt-positieven = 73 / aantal patiënten = 100) en de specificiteit is 0,985 of 98,5% (aantal echt-negatieven = 4.827 / aantal controlepersonen = 4.900).

Relevantie van specificiteit

In het voorbeeld hierboven zouden 73 van de 5.000 personen fout-positief testen. Dit staat gelijk aan 73 personen die worden doorverwezen naar een specialist of, in het ergste geval, met een toxische medicatie worden behandeld.

Als de test een lagere specificiteit had van bijvoorbeeld 92% (wat nog steeds redelijk is) zouden de fout-positieve uitslagen dramatisch toenemen.

  Test positief Test negatief Totaal
RA 73 27 100
Geen RA 392 4.508 4.900
Totaal 465 4.535 5.000

392 personen lopen de kans verkeerd te worden gediagnosticeerd met RA - ruim 5 keer meer dan bij een specificiteit van 98,5%.

Terug naar boven 

 

2. ROC-curve

De sensitiviteit van een test is hoger als een lage cut-off wordt gekozen. Een lage cut-off leidt direct tot een lagere specificiteit. Bij de cut-off van auto-immuniteitstests moet altijd worden gebalanceerd tussen sensitiviteit en specificiteit. Deze beide waarden correleren omgekeerd evenredig en tegenover iedere sensitiviteitwaarde staat een specificiteitwaarde. Deze relatie kan worden geïllustreerd in een ROC-curve.

Definitie:

In de signaaldetectietheorie is een 'receiver operating characteristic' (ROC) of ROC-curve een grafiek van de gevoeligheid (sensitiviteit) of echt-positieven, uitgezet tegen (1 - specificiteit) of fout-positieven.

Voorbeeld:

In een studie van Bizzarro et al. (Clin Chem 2007; 53:1527-33) zijn 11 tests vergeleken voor de opsporing van antistoffen die worden geassocieerd met reumatoïde artritis. Met het door het panel geteste serum was de volgende ROC-curve echt voor EliA CCP:

ROC CCP

De optimale cut-off voor een test wordt daar gelegd waar sensitiviteit en specificiteit zo hoog mogelijk zijn. De optimale cut-off voor EliA CCP heeft een specificiteit van 98,5% en een sensitiviteit van 73%.

ROC RF

In dezelfde studie met dezelfde sera is ook een klassieke RF-test vergeleken. Met de aangeraden cut-off waren de sensitiviteit en specificiteit 54% resp. 86,1%.

Om verschillende tests zo goed mogelijk te kunnen vergelijken, kan de specificiteit worden vastgezet op een specifieke waarde en kunnen de respectievelijke sensitiviteiten worden berekend met behulp van een ROC-curve. In dit voorbeeld zijn de respectievelijke sensitiviteiten vergeleken bij een vastgestelde specificiteit van 99%, 98% en 97%.

Test sens. bij aangeraden cut-off spec. bij aangeraden cut-off sens. bij spec. van 99% sens. bij spec. van 98 % sens. bij spec. van 97 %
EliA CCP 73% 98,5% 69% 74% 74%
RF 54% 86,1% 13% 17% 17%

Terug naar boven

 

3. Positief en negatief voorspellende waarde

Definitie:

De positief voorspellende waarde (PPV) is het deel van de patiënten met een positieve testuitslag dat de ziekte ook daadwerkelijk heeft. De voorspellende waarde is gerelateerd aan de sensitiviteit en specificiteit van de test of onderzoeksmethode.

 

TP

 

Aantal positieve patiënten

PPV =

----------

=

-------------------------------------

 

TP + FP

 

Aantal positieve uitslagen

(TP = echt-positieven, FP = fout-positieven)

De negatief voorspellende waarde (PPV) is het deel van de controlepatiënten met een negatieve testuitslag dat correct is gediagnosticeerd.

 

TN

 

Aantal negatieve controlepatiënten

NPV =

----------

=

-------------------------------------

 

 TN + FN

 

Aantal negatieve uitslagen

(TN = echt-negatieven, FN = fout-negatieven)

Voorbeeld:

  Test positief Test negatief Totaal
RA 73 27 100
Geen RA 73 4.827 4.900
Totaal 146 4.854 5.000

Uitgaande van het voorbeeld van de test naar reumatoïde artrose (RA) in de paragraaf over sensitiviteit en specificiteit (zie hierboven) (RA) is de PPV 50% (73 TP / 146 P). De NPV is 99% (4.827 TN / 4.854 N).

Met deze populatie moet een arts zich ervan bewust zijn, dat de helft van de positieve uitslagen personen zijn die geen RA hebben. Een positieve uitslag voorspelt de ziekte met een waarschijnlijkheid van 50%. Daar staat tegenover dat een negatieve uitslag met 99% voorspelt dat de aandoening niet aanwezig is.

Afhankelijkheid van de voorafkans

De voorspellende waarde is grotendeels afhankelijk van de voorafkans (de pretestwaarschijnlijkheid van ziekte), die in dit voorbeeld 2% is, wat vrij klein is. Bij een voorafkans van 10% (bijv. omdat het een gespecialiseerd reumalab is), zouden de uitslagen ook anders worden:

  Test positief Test negatief Totaal
RA 370 130 500
Geen RA 60 3.940 4.000
Totaal 430 4.570 5.000

De prestatie van de test of de klinische kenmerken van de marker veranderen niet met de voorafkans. Om die reden staan de sensitiviteit en de specificiteit van de test relatief vast. De positieve voorspellende waarde neemt bij een 5 keer hogere voorafkans echter toe van 50% tot 86% (370 TP / 430 P) en de negatieve voorspellende waarde neemt af van 99% tot 86% (3.940 TN / 4.570 N).

Terug naar boven

 

4. Positieve en negatieve aannemelijkheidsverhouding

Definitie:

De aannemelijkheidsverhouding omvat zowel de sensitiviteit als de specificiteit van de test en levert een directe schatting op in hoeverre een testuitslag de kans op het hebben van een ziekte verandert.

De aannemelijkheidsverhouding voor een positieve uitslag (positieve LR) vertelt u hoeveel de kans op ziekte toeneemt bij een positieve test.

 

TP / (TP + FN)

 

Sensitiviteit

pos LR =

-----------------

=

---------------

 

FP / (FP + TN)

 

1 - Specificiteit

(TP = echt-positieven, TN = echt-negatieven, FP = fout-positieven, FN = fout-negatieven)

De aannemelijkheidsverhouding voor een negatieve uitslag (negatieve LR) vertelt u hoeveel de kans op ziekte afneemt bij een negatieve test.

 

FN / (TP + FN)

 

1 - Sensitiviteit

neg LR =

-----------------

=

-------------------

 

TN / (FP + TN)

 

Specificiteit

(TP = echt-positieven, TN = echt-negatieven, FP = fout-positieven, FN = fout-negatieven)

Voorbeeld:

  Test positief Test negatief Totaal
RA 73 27 100
Geen RA 73 4.827 4.900
Totaal 146 4.854 5.000

Uitgaande van het voorbeeld van de test naar reumatoïde artrose (RA) in de vorige paragrafen (zie hierboven) is de positieve LR zeer hoog met (73 / 100) / (73 / 4.900) = 50. Als de patiënt een positieve testuitslag heeft, is de waarschijnlijkheid dat hij RA heeft, heel groot. De negatieve LR is (27 /100) / (4.827 / 4.900) = 0,27.

Interpretatie van de aannemelijkheidsverhouding:

  Negatieve LR Positieve LR
geen klinische waarde 1 1
klein verschil dat relevant kan zijn 0,2-0,5 2-5
gemiddeld, maar aanzienlijk verschil 0,1-0,2 5-10
klinisch belangrijk verschil <0,1> >10

 

De marker in het voorbeeld hierboven heeft een zeer hoge positieve LR van 50. Om die reden geeft een positief resultaat aan dat ziekteaanwezigheid zeer aannemelijk is. Een negatief resultaat sluit ziekte echter niet uit. Met een negatieve LR van 0,27 is de klinische bruikbaarheid nihil.

Terug naar boven