Wie ist ein Testergebnis zu interpretieren?

Ein Autoimmunitäts-Testergebnis umfasst mehrere Werte. Die wichtigsten Leistungswerte für die Interpretation bei der Autoimmun-Diagnostik sind:

1.  Sensitivität und Spezifität

2.  ROC-Kurve

3.  Positive und negative Vorhersagewerte

4.  Positive und negative Likelihood-Ratio

 

1. Sensitivität und Spezifität

Sensitivität ist die Anzahl der wahr positiven Ergebnisse.

 

WP

 

Anzahl der wahr positiven Testergebnisse

Sensitivität =

----------

=

-------------------------------------

 

WP + FN

 

alle Patienten mit Erkrankung

(WP = wahr positive Ergebnisse, FN = falsch negative Ergebnisse)

 

Spezifität ist die Anzahl der negativen Ergebnisse bei Personen, die diese Erkrankung nicht aufweisen (wahr negative Ergebnisse bei Kontrollen).

 

WN

 

Anzahl der wahr negativen Testergebnisse

Spezifität =

----------

=

-------------------------------------

 

WN + FP

 

alle Patienten ohne Erkrankung

(WN = wahr negative Ergebnisse, FP = falsch positive Ergebnisse)

Die Kontrollgruppe kann eine Population mit gesunden Personen sein. Um die Spezifität eines Tests jedoch realistisch bewerten zu können, muss die Kontrollpopulation aus Patienten mit Erkrankungen bestehen, die für die Differentialdiagnose wichtig sind. Beispielsweise sollte die Spezifität eines Tests auf Zöliakie mit einer Population von Patienten bewertet werden, die an anderen Magen-Darm-Erkrankungen leiden, z.B. entzündlichen Darmerkrankungen, Magen-Darm-Infektionen etc.

Beispiel:

Die Prävalenz der rheumatoiden Arthritis (RA) liegt in der getesteten Population bei 2 %. Somit haben 100 der 5.000 getesteten Personen eine rheumatoide Arthritis. 4.900 Personen sind gesund oder haben eine andere Erkrankung als rheumatoide Arthritis.

Bei dem Test in diesem Beispiel zeigten 73 von 100 RA-Patienten ein positives Testergebnis (wahr positiv). 27 wurden nicht erkannt und zeigten daher ein negatives Testergebnis (falsch negativ). In der Kontrollgruppe von 4.900 Personen, die keine RA haben, waren 73 positiv (falsch positiv) und 4.827 negativ (wahr negativ).

 Test positivTest negativGesamt
RA 73 27 100
Keine RA 73 4.827 4.900
Gesamt 146 4.854 5.000

Die Sensitivität dieses Tests liegt bei 0,73 oder 73 % (Anzahl der wahr positiven Ergebnisse = 73 / Anzahl der Patienten = 100), und die Spezifität liegt bei 0,985 oder 98,5 % (Anzahl der wahr negativen Ergebnisse = 4.827 / Anzahl der Kontrollen = 4.900).

Bedeutung der Spezifität

In dem vorstehenden Beispiel wurden 73 von 5.000 Personen falsch positiv getestet. Dies bedeutet, dass diese 73 Personen an einen Facharzt überwiesen werden oder im schlimmsten Fall mit einer toxischen Medikation behandelt werden.

Wenn der Test eine geringere Spezifität hätte, z.B. 92 % (was immer noch ein sehr annehmbarer Wert ist), würden die falsch positiven Ergebnisse dramatisch ansteigen.

 Test positivTest negativGesamt
RA 73 27 100
Keine RA 392 4.508 4.900
Gesamt 465 4.535 5.000

Es besteht das Risiko einer falschen Diagnose von RA bei 392 Personen, d.h. die 5-fache Zahl von Personen im Vergleich zu einer Spezifität von 98,5 %.

Nach oben 

 

2. ROC-Kurve

Die Sensitivität eines Tests ist höher, wenn ein geringer Cut-off gewählt wird. Ein geringer Cut-off führt direkt zu einer geringeren Spezifität. Der Cut-off bei Autoimmuntests ist immer eine Balance zwischen Sensitivität und Spezifität. Diese beiden Werte korrelieren invers miteinander und für jede Sensitivitätswert gibt es einen entsprechenden Spezifitätswert. Dieser Zusammenhang kann in einer ROC-Kurve dargestellt werden.

Definition:

In der Signalerkennungstheorie ist eine Receiver Operating Characteristic (ROC), oder einfach nur ROC-Kurve, eine grafische Darstellung der Sensitivität oder der wahr positiven Werte vs. (1 - Spezifität), oder der falsch positiven Werte.

Beispiel:

In einer Studie von Bizzarro et al. (Clin Chem 2007; 53:1527-33) wurden 11 Tests zur Erkennung von Antikörpern in Zusammenhang mit rheumatoider Arthritis verglichen. Mit dem getesteten Serumpanel war die folgende ROC-Kurve wahr für EliA CCP:

ROC CCP

Ein optimaler Cut-off für einen Test ist dann gewählt, wenn Sensitivität und Spezifität so hoch wie möglich sind. Für EliA CCP zeigt der optimale Cut-off eine Spezifität von 98,5 % und eine Sensitivität von 73 %.

ROC RF

In der gleichen Studie wurde mit den gleichen Sera auch ein klassischer RF-Test verglichen. Unter Verwendung des empfohlenen Cut-offs lagen Sensitivität und Spezifität bei 54 % bzw. 86,1 %.

Für eine optimale Vergleichbarkeit der unterschiedlichen Tests kann die Spezifität auf einen spezifischen Wert gesetzt werden, und die entsprechenden Sensitivitäten können mit Hilfe einer ROC-Kurve berechnet werden. In diesem Beispiel wurden die entsprechenden Sensitivitäten bei festgelegten Spezifitäten von 99 %, 98 % und 97 % verglichen.

TestSens. bei empfohlenem Cut-offSpez. bei empfohlenem Cut-offSens. bei 99 % Spez.Sens. bei 98 % Spez.Sens. bei 97 % Spez.
EliA CCP 73 % 98,5 % 69 % 74 % 74 %
RF 54 % 86,1 % 13 % 17 % 17 %

 

Nach oben

 

3. Positive und negative Vorhersagewerte

Definition:

Der positive Vorhersagewert (PPV) bzw. die Präzisionsrate oder die Posttestwahrscheinlichkeit der Erkrankung ist der Anteil der Patienten mit positiven Testergebnissen, die auch an der Erkrankung leiden. Der Vorhersagewert ist mit der Sensitivität und Spezifität des Tests oder Screening-Methode verbunden.

 

WP

 

Anzahl der positiven Patienten

PPV =

----------

=

-------------------------------------

 

 WP+FP

 

alle positiven Ergebnisse

(WP = wahr positive Ergebnisse, FP = falsch positive Ergebnisse)

 

Der negative Vorhersagewert (NPV) ist der Anteil der Kontrollpatienten mit negativen Testergebnissen, die korrekt diagnostiziert wurden.

 

WN

 

Anzahl der negativen Kontrollen

NPV =

----------

=

-------------------------------------

 

 WN+FN

 

alle negativen Ergebnisse

(WN = wahr negative Ergebnisse, FN = falsch negative Ergebnisse)

Beispiel:

 Test positivTest negativGesamt
RA 73 27 100
Keine RA 73 4.827 4.900
Gesamt 146 4.854 5.000

Unter Verwendung des gleichen Beispiels wie im Absatz zu Sensitivität und Spezifität (siehe vorstehend) für einen Test zu rheumatoider Arthritis (RA) liegt der PPV bei 50 % (73 WP / 146 P). Der NPV beträgt 99 %  (4.827 WN / 4,854 N).

Bei dieser Population muss ein Klinikarzt darauf achten, dass die Hälfte der positiven Ergebnisse Einzelpersonen darstellt, die keine RA haben. Ein positives Ergebnis sagt die Erkrankung mit einer Wahrscheinlichkeit von 50 % vorher. Andererseits sagt ein negatives Ergebnis mit 99-prozentiger Sicherheit vorher, dass keine Erkrankung vorhanden ist.

Abhängigkeit von der Prätestwahrscheinlichkeit

Die Vorhersagewerte sind stark von der Prätestwahrscheinlichkeit abhängig, die mit den 2 % in diesem Beispiel eher gering ausfällt. Wenn die Prätestwahrscheinlichkeit 10 % wäre (z.B. weil es ein spezialisiertes Rheumalabor ist), dann würden sich die Daten entsprechend ändern: 

 Test positivTest negativGesamt
RA 370 130 500
Keine RA 60 3.940 4.000
Gesamt 430 4.570 5.000

Die Leistung des Tests oder die klinischen Eigenschaften des Markers ändern sich nicht mit der Prätestwahrscheinlichkeit. Daher sind Sensitivität und Spezifität des Tests relativ fix. Der positive Vorhersagewert steigt jedoch bei der 5-fachen Prätestwahrscheinlichkeit von 50 % auf 86% (370 WP / 430 P), und der negative Vorhersagewert sinkt von 99 % auf 86 % (3.940 WN / 4.570 N).

Nach oben

 

4. Positive und negative Likelihood-Ratio

Definition:

Die Likelihood-Ratio umfasst Sensitivität und Spezifität des Tests und bietet einen direkten Schätzwert dazu, wie stark ein Testergebnis die Wahrscheinlichkeit ändert, die Erkrankung zu haben.

Die Likelihood-Ratio für ein positives Ergebnis (positive LR) sagt Ihnen, wie stark die Wahrscheinlichkeit für die Erkrankung steigt, wenn ein Test positiv ist.

 

WP / (WP + FN)

 

Empfindlichkeit

pos LR =

-----------------

=

---------------

 

FP / (FP + WN)

 

1 - Spezifität

(WP = wahr positive Ergebnisse, WN = wahr negative Ergebnisse, FP = falsch positive Ergebnisse, FN = falsch negative Ergebnisse)

Die Likelihood-Ratio für ein negatives Ergebnis (negative LR) sagt Ihnen, wie stark die Wahrscheinlichkeit für die Erkrankung sinkt, wenn ein Test negativ ist.

 

FN / (WP + FN)

 

1 - Sensitivität

neg LR =

-----------------

=

-------------------

 

WN / (FP + WN)

 

Spezifität

(WP = wahr positive Ergebnisse, WN = wahr negative Ergebnisse, FP = falsch positive Ergebnisse, FN = falsch negative Ergebnisse)

Beispiel:

 Test positivTest negativGesamt
RA 73 27 100
Keine RA 73 4.827 4.900
Gesamt 146 4.854 5.000

Unter Verwendung des gleichen Beispiels wie im oberen Absatz (siehe vorstehend) für einen Test zu rheumatoider Arthritis (RA) liegt die positive LR sehr hoch bei (73 / 100) / (73 / 4.900) = 50. Wenn der Patient ein positives Testergebnis zeigt, dann ist die Wahrscheinlichkeit sehr hoch, dass er RA hat. Die negative LR beträgt (27 /100) / (4.827 / 4.900) = 0,27.

Interpretation der Likelihood-Ratio:

 Negative LRPositive LR
kein klinischer Wert = Testqualität ist nicht hilfreich 1 1
kleiner Unterschied, der relevant sein kann 0,2 - 0,5 2 - 5
mäßiger, aber wesentlicher Unterschied 0,1 - 0,2 5 - 10
klinisch wichtiger Unterschied = Testqualität ist sehr hilfreich <0,1> >10

 

Der Marker im vorstehenden Beispiel hat eine sehr hohe positive LR von 50. Daher zeigt ein positives Ergebnis eine hohe Wahrscheinlichkeit der Erkrankung an. Ein negatives Ergebnis schließt die Erkrankung jedoch nicht aus. Mit einer negativen LR von 0,27 ist der klinische Nutzen nur gering.

Nach oben