Obszary pod krzywymi ROC mogą być także skonstruowane za pomocą klinicznych zasad przewidywania.

Metodolog - statystyczna analiza data minig

Obszar pod krzywą ROC

pole pod krzywą roc graf pokazuje trzy krzywe ROC odpowiadające znakomitemu, dobremu i beznadziejnemu testowi wykreślonym na tym samym grafie

Powyższy graf pokazuje trzy krzywe ROC odpowiadające znakomitemu, dobremu i beznadziejnemu testowi wykreślonym na tym samym grafie. Precyzyjność testu zależy od tego jak dobrze test oddziela testowane grupy na te z i bez przypadłości w pytaniu. Precyzja jest mierzona przez obszar pod krzywą ROC. Obszar 1 reprezentuje perfekcyjny test; obszar 0.5 reprezentuje bezwartościowy test.

Przybliżonym przewodnikiem do klasyfikowania precyzji diagnostycznego testu jest tradycyjny system szkolny:

  • 90-1 = wyśmienicie (A)
  • 80-0.90 = dobrze (B)
  • 70-0.80 = dostatecznie (C)
  • 60-0.70 = słabo (D)
  • 50-0.60 = niedostatecznie (F)

Odwołajmy się do danych z T4 z poprzedniej sekcji. Obszar poniżej krzywej ROC na T4 to 0.86. Więc T4 będzie uznawane za „dobrze” oddzielające pacjentów z niedoczynnością tarczycy od tych z eutyreozą (tarczycą bez niewydolnośći).

r

porównywanie pól pod krzywymi ROC

Powyższy graf pochodzi z badań nad tym jak kliniczne ustalenia przewidują zapalenie gardła (Wigton RS, Connor JL, Centor RM. Transportability of a decision rule for the diagnosis of streptococcal pharyngitis. Arch Intern Med. 1986;146:81-83). W tych badaniach, obecność wydzieliny z migdałków, gorączki, powiększenia węzłów chłonnych i brak kaszlu przewidziały zapalenie. Krzywe zostały skonstruowane przez wyliczenie wrażliwości i specyfiki powiększającej się liczby klicznych znalezisk (od 0 do 4) w przewidywaniu zapalenia. Badanie porównało pacjentów z Virginni i Nebraski i odkryto, że zasada bardziej się sprawdza w Virginii (obszar pod krzywą = 0.78) w porównaniu z Nebraską (obszar pod krzywą = 0.73). Jednakże te różnice nie okazały się istotne statystycznie.

W tym momencie, być może zastanawiasz się co liczba tego obszaru tak naprawdę znaczy i jak jest wyliczana. Obszar mierzy dyskriminację, czyli, zdolność testu do poprawnego klasyfikowania tych z chorobą i bez niej. Rozważmy sytuację, w której pacjenci są już poprawnie zaklasyfikowani do dwóch grup. Losowo wybierasz jednego z grupy chorobowej i jednego z grupy zdrowych i przeprowadzasz test na obu. Pacjent z bardziej nieprawidłowymi wynikami testu powinien być tym z grupy chorych. Obszar pod krzywą jest odsetkiem z losowo wybranych par, dla których jest to prawdą (czyli, test prawidłowo klasyfikuje dwójkę pacjentów w losowej parze).

Wyliczanie obszaru jest bardziej skomplikowane i trudne do wyjaśnienia, znajduje się poza zakresem tego materiału wprowadzającego. Dwie metody są powszechnie używane: nieparametryczna metoda opierająca się na konstruowaniu trapezów pod krzywą jako przybliżone obliczenie obszaru i metoda parametryczna wykorzystująca maksymalne prawdopodobieństwo estymatora do wpasowania gładkiej krzywej do punktów danych. Obie metody są dostępne jako programy komputerowe i pozwalają oszacować obszar i błąd standardowy, co może zostać użyte do porównania różnych testów lub takich samych testów w różnych populacjach pacjentów.

Wieńcząca notka dla zainteresowanych historią

Możecie się zastanawiać skąd wzięła się nazwa „Reciever Operating Characteristic”. Analiza ROC jest częścią dziedziny nazywanej „Teorią detekcji sygnałów” rozwijanej w czasie II Wojny Światowej do analizowania obrazów z radaru. Operatorzy radarów musieli zadecydować czy punkcik na ekranie to wrogi obiekt, sojuszniczy statek czy po prostu hałas. Teoria detekcji sygnałów mierzy zdolność operatorów odbierających sygnały z radaru do dokonywania tych istotnych rozróżnień. Ich zdolność do tego została nazwana Recievier Operating Charakteristics. W latach 70. stwierdzono, że ta teoria detekcji sygnałów może znaleźć zastosowanie w interpretacji wyników testów medycznych.