Περίληψη: | Σκοπός της διδακτορικής διατριβής ήταν η αξιολόγηση ενός αυτόματου συστήματος ποσοτικοποίησης της έκτασης της διάμεσης νόσου με απεικονιστικά κριτήρια, όπως την σύγκριση με την ημιποσοτική αξιολόγηση των ακτινολόγων και με την συνεχή αξιολόγηση από ακτινολόγους βασιζόμενη στον χειρωνακτικό σχεδιασμό των παθολογικών περιοχών.
Τα αποτελέσματα του αυτοματοποιημένου συστήματος συγκρίθηκαν και με την υποβοηθηση από το σύστημα. Για την οπτικοποίηση της διασύγκρισης των συστημάτων μεταξύ τους χρησιμοποιήθηκαν οι καμπύλες συμφωνίας. Τέλος, μελετήθηκε η συσχέτιση του συστήματος και των ημιποσοτικών εκτιμήσεων των ακτινολόγων με εργαστηριακούς απεικονιστικούς δείκτες, τις πνευμονικές δοκιμασίες.
Υλικά και Μέθοδοι
Για την εκπόνηση της διατριβής χρησιμοποιήθηκε μια δεξαμενή 47 περιστατικών με νόσο του κολλαγόνου και 4 φυσιολογικών ασθενών. Από αυτήν 14 περιστατικά χρησιμοποιήθηκαν για την ανάπτυξη και εκπαίδευση του συστήματος και 37 περιστατικά επελέγησαν για την αξιολόγηση του συστήματος, με απεικονιστικά πρότυπα θαμβής υάλου (ggo) και δικτυωτού προτύπου (reticular). Το πρωτόκολλο σάρωσης ήταν χαμηλής δόσης απεικόνιση με MDCT 16 ανιχνευτών, που επέτρεπε την λήψη τρισδιάστατων δεδομένων.
Αρχικά αναπτύχθηκε το αυτόματο σύστημα σε γλώσσα προγραμματισμού MATLAB (ΜΑΤLAB 7.5 R 2007b) και εκπαιδεύτηκε από τους ακτινολόγους ως προς τα διάφορα στάδια ολοκλήρωσης: (1) Προεπεξεργασία (preprocessing): Τμηματοποίηση πνευμονικών πεδίων και αφαίρεση αγγειακού δέντρου, (2) Ταξινόμηση-Αναγνώριση και χαρακτηρισμός προτύπων διάμεσου ιστού. Το σύστημα αξιολογήθηκε σε δείγμα διαφορετικό από της εκπαίδευσης από την πρώτη δεξαμενή περιστατικών με δείκτες απόδοσης Volume Overlap, ΤPF, FPF.
Κατόπιν, το τρισδιάστατο (3D) σύστημα αξιολογήθηκε στο κλινικό δείγμα 37 ασθενών με τις 3D ημιποσοτικές αξιολογήσεις δύο ακτινολόγων (Α΄ Κύκλος Πειραματικού σχεδιασμού). Στην αξιολόγηση αυτή συσχετίστηκαν τα τρισδιάστατα αποτελέσματα ποσοτικοποίησης του CAD ως προς την συνολική έκταση νόσου, την έκταση του ground glass και του reticular προτύπου με τις εκτιμήσεις από δύο ξεχωριστούς έμπειρους ακτινολόγους και του μέσου όρου αυτών ημιποσοτικά στους όγκους των σαρώσεων (περίπου 250 τομές ανά σάρωση ασθενούς) με στατιστική μέθοδο Spearman rank order. Επίσης μελετήθηκαν οι διαφορές μεταξύ των εκτιμήσεων, αναλύθηκαν με Blant –Altman διαγράμματα και boxplots (R1vs. CAD, R2vs.CAD, Rmvs.CAD, R1 vs.R2, R1 vs.R1s). Μετρήθηκε επίσης η συμφωνία ενδο κα μεταξύ των ακτινολόγων.
Για τον B΄ κύκλο πειραματικού σχεδιασμού αξιολογήθηκε το 2D σύστημα σε 185 εγκάρσιες τομές (37 σαρώσεις ασθενών) για το ποσοστό της συνολικής έκτασης και της έκτασης του ground glass και του reticular προτύπου. Σαν βάση αναφοράς χρησιμοποιήθηκε η consensus αξιολόγηση δύο έμπειρων ακτινολόγων με σχεδιασμό των παθολογικών περιοχών σε μια τράπεζα σχεδιασμού (Wacom Intuos 3 Tokyo, Japan) με τη βοήθεια μιας γραφικής επιφάνειας διεπαφής (GUI). Επίσης αναλύθηκαν οι ίδιες τομές και αξιολογήθηκαν ημιποσοτικά in consensus από τους ακτινολόγους. Τέλος αξιολογήθηκε στο ίδιο δείγμα το υποβοηθούμενο CAD ως προς την βάση αναφοράς.
Συσχετίστηκαν οι 2D εκτιμήσεις του συστήματος και των ακτινολόγων in consensus (1) ημιποσοτικά (CADvsSQRcons) και (2) ποσοτικά με σχεδιασμό των παθολογικών περιοχών pixel-wise (CADvsRref). Οι συσχετίσεις πραγματοποιήθηκαν με Intraclass Correlation Coefficient (ICC) και τα αντίστοιχα 95% Confidence Intervals (CI). Μετρήθηκε επίσης η συμφωνία ενδο κα μεταξύ των ακτινολόγων.
Οι διαφορές στην έκταση της νόσου για τις διαφορετικές αξιολογήσεις (CAD - Rref, CAD+Rcons-Rref και SQRcons - Rref) απεικονίστηκαν με Bland-Altman ανάλυση για την συνολική έκταση της νόσου και για τα επιμέρους πρότυπα: το ggo και το reticular. Επίσης υπολογίστηκε η μέση διαφορά (mean difference MD) και το 95% των διαφορών (μέση τιμή±1.96SD), που ονομάζεται όρια συμφωνίας (limits of agreement (LoA95). Για να οπτικοποιηθούν τα αποτελέσματα των αξιολογήσεων της έκτασης νόσου και να διευκολυνθεί η διασύγκριση μεταξύ τους , δημιουργήθηκε μια απεικόνιση με καμπύλες συμφωνίας για κάθε σύστημα αξιολόγησης σε συνάρτηση με την βάση αναφοράς
Τέλος συσχετίστηκαν οι τρισδιάστατοι όγκοι των 37 ασθενών σε ότι αφορά (1) την συνολική έκταση της νόσου (2) την έκταση του ggo και (3) την έκταση του reticular όπως εκτιμώνται από το 3DCAD και με την ημιποσοτική αξιολόγηση των ακτινολόγων 3DSQRconsRcons με τις φυσιολογικές παραμέτρους σπειρομέτρησης. ατόπιν συσχετίστηκαν τα 2D δεδομένα στις 185 εγκάρσιες τομές (μέσες τιμές των 5 τομών ανά σάρωση από τους 37 ασθενείς ) για το 2D CAD και την αντίστοιχη ημιποσοτική αξιολόγηση σε 2D SQ . Συγκρίθηκαν οι συσχετίσεις 2DCADvs2DCAD και 3DSQvs2DSQ. με δείκτες συσχέτισης Pearson correlation coefficient (R).
Αποτελέσματα
Η στατιστική ανάλυση της απόδοσης του συστήματος για την τμηματοποίηση των πνευμονικών πεδίων εκτιμάται ως εξής: (1) Volume overlap: 0.954±0.023, (2)d mean: 1.080±0.364 (3) drms: 1.407±0.735 (4) d max : 4.944±3.492.
Η στατιστική ανάλυση της απόδοσης του συστήματος για την τμηματοποίηση του αγγειακού δέντρου και στα δύο πνευμονικά πεδία εκτιμάται ως εξής: (1) Volume overlap: 0.931±0.027, (2 ) ΤPF:0.935±0.036 (3) FPF:0.074±0.03.
Η απόδοση του συστήματος στην αναγνώριση και χαρακτηρισμό των παθολογικών προτύπων της διάμεσης νόσου στα περιστατικά που χρησιμοποιήθηκαν για την εκπαίδευση είναι: Για το πρότυπο ground glass: (1) Volume overlap : 0.794±0.038, (2) ΤPF:0.812±0.045, (3) FPF: 0.163±0.017. Για το reticular πρότυπο οι δείκτες απόδοσης είναι: 1) Volume overlap: 0.883±0.037, (2) ΤPF:0.972±0.013 (3) FPF :0.0971±0.012.
Οι ανάλογοι δείκτες για την συμφωνία των ακτινολόγων ενδο και μεταξύ- έχουν ως εξής: Για την συμφωνία των ακτινολόγων (ενδο-): Για το πρότυπο ground glass: (1) Volume overlap: 0.47±0.20, (2) ΤPF :0.972±0.01, (3) FPF : 0.0971±0.012. Για το reticular πρότυπο οι δείκτες απόδοσης είναι: (1) Volume overlap : 0.53±0.19, (2)ΤPF: 0.715±0.20, (3)FPF: 1.72±1.05. Για την συνολική έκταση της νόσου, οι αντίστοιχες τιμές είναι: (1) Volume overlap: 0.54 ± 0.18, (2) ΤPF : 0.74 ± 0.18,(3) FPF :1.19±1.85. Για την συμφωνία των ακτινολόγων (μεταξύ-): Για το πρότυπο ground glass: (1) Volume overlap: 0.33±0.22, (2) ΤPF: 0.58±0.27, (3)FPF: 2.48±2,74. Για το reticular πρότυπο οι δείκτες απόδοσης είναι: (1)Volume overlap: 0.51±0.11, (2)ΤPF: 0.72±0.19, (3) FPF:1.36±1.33. Για την συνολική έκταση της νόσου, οι αντίστοιχες τιμές είναι: (1)Volume overlap: 0.51±0.21, (2)ΤPF: 0.69±0.22, (3) FPF: 1.21±0.89.
Για τον Α΄ κύκλο πειραματικού σχεδιασμού σε 3D, τα αποτελέσματα δείχνουν στατιστικά σημαντική συσχέτιση της ποσοτικοποίησης του CAD και των ημιποσοτικών εκτιμήσεων των ακτινολόγων (ως βάση αναφοράς), σε ότι αφορά στην συνολική έκταση της νόσου και την έκταση του reticular προτύπου (R=0.949, p=<0.0001, R= 0.915, p=<0.0001, αντίστοιχα), ενώ μέτρια ήταν η συσχέτιση για το ggo πρότυπο (0.806, p=0.0009).
Οι ανάλογοι δείκτες για την συμφωνία των ακτινολόγων ενδο και μεταξύ- έχουν ως εξής: Για την συμφωνία των ακτινολόγων (ενδο-): Συνολική έκταση της νόσου: R=0.903, p=<0.0001, έκταση του reticular προτύπου: R= 0.966, p=<0.0001 και έκταση του ggo προτύπου: 0.766, p=<0.0001. Για την συμφωνία των ακτινολόγων (μεταξύ-): Συνολική έκταση της νόσου: 0.838, p=0.0018, έκταση του reticular προτύπου: R= 0.895, p=0.0006 και έκταση του ggo προτύπου: R= 0. 655, p=0.0017.
Από την μελέτη των διαφορών όπως απεικονίζονται από τις αναλύσεις Blant Altman και boxplots, οι διαφορές στην έκταση της νόσου μεταξύ ακτινολόγων και CAD (R1 vs.CAD, R2vsCAD, RmvsCAD) και ακτινολόγων μεταξύ τους (R1 vs. R2, R1 vs. R1s) δεν ήταν στατιστικά σημαντικές (two-tailed Wilcoxon signed-rank test, p>0.05). Το εύρος της συσχέτισης κυμαίνεται εντός της μεταβλητής ένδο- και μεταξύ- παρατηρητών, καταδεικνύοντας ένα αξιόπιστο αυτόματο σύστημα ποσοτικοποίησης της διάμεσης νόσου με παρόμοια απόδοση με τους ακτινολόγους. Ωστόσο, η συμπεριφορά των διαφορών CAD vs. R1, CAD vs. R2, CAD vs Rm σε σύγκριση τις διαφορές R1 vs. R2 και R1 vs. R1’ μελετώντας τις median and IQR τιμές δεν είναι όμοια, καταδεικνύοντας ένα αυτόματο σύστημα συμπεριφέρεται με διαφορετικό τρόπο συγκριτικά με την ημιποσοτική εκτίμηση. Οι μέγιστες median and IQR τιμές (3.6% και 32.6%, αντιστοίχως), εμφανίζονται μεταξύ CAD and R2, και αποδίδονται πρωτίστως στην διαφορετική εμπειρία των ακτινολόγων. Τέλος, από τα διαγράμματα Blant Altman παρατηρείται ότι σε όλα τα ζεύγη διαφορών CADvs. R1, CADvsR2, CADvsRm, R1vsR2, R1 vsR1’ οι μεγαλύτερες διαφορές προκύπτουν καθώς αυξάνεται η έκταση της νόσου, ιδίως για έκταση νόσου >20%.
Από τα δύο πρότυπα, το reticular πρότυπο παρουσιάζει την μεγαλύτερη μεταβλητότητα της μέσης τιμής.
Λαμβάνοντας υπόψιν την διαφρορετική συμπεριφορα στην ποσοτικοποίηση της έκτασης της νόσου μεταξύ του συστήματος CAD και της ημιποσοτικής μεθόδου, αναζητήθηκε μια ακριβέστερη βάση αναφοράς , που στηρίχτηκε στον χειρωνακτικό σχεδιασμό των παθολογικών περιοχών οδηγώντας στον Β’ κύκλο του πειραματικού σχεδιασμού.
Για τον B΄ κύκλο πειραματικού σχεδιασμού της διατριβής, το σύστημα παρουσιάζει τόσο με τις ημιποσοτικές όσο και με τις ποσοτικές μετρήσεις, με καλύτερη την συσχέτιση με τις ποσοτικές μετρήσεις που χρησιμοποιήθηκε στην φάση αυτή της διατριβής σαν βάση αναφοράς (ICC =0.809 [0.599-0.894] , 0.851 [0.795-0.891]). Για τα επιμέρους πρότυπα η ποσοτικοποίηση του ground glass από το σύστημα συσχετίζεται λιγότερο με τις εκτιμήσεις των ακτινολόγων ( και με τις δύο μεθόδους, ημιποσοτικά και ποσοτικά) από το reticular. Σε κάθε περίπτωση η ποσοτική αξιολόγηση των ακτινολόγων που θεωρητικά αποτελεί καλύτερη βάση αναφοράς συσχετίζεται σταθερά καλύτερα με το CAD για όλα τα πρότυπα. Η συμφωνία μεταξύ ακτινολόγων είναι παρόμοια και για τις δύο μεθόδους (ICC =0.856 [0.811-0.891], 0.856 [0.806-0.893]). Η ίδια τάση παρατηρείται και για τα δυο πρότυπα (reticular και ground glass).
Από την μελέτη των διαφορών όπως απεικονίζονται από τις αναλύσεις Blant Altman, το σύστημα παρουσιάζει ένα μικρό βαθμό υπερεκτίμησης της έκτασης νόσου συγκριτικά με την βάση αναφοράς: Συνολική έκταση νόσου (MD: 2.5%; LoA95: -14.3%, 19.3%), έκταση ground glass: (MD: 1.3%; LoA95: -10.9%, 13.5%) έκταση reticular: (MD: 1.2%; LoA95: -12.7%, 15.1%) και σημαντική συμφωνία με την νέα βάση αναφοράς: 86.5%, 75.1% και 81.6% αντίστοιχα. Οι ημιποσοτικές μετρήσεις παρουσιάζει μεγαλύτερη υπερεκτίμηση με τη βάση αναφοράς: Συνολική έκταση νόσου MD: 9.2%; LoA95: -12.8%, 31.2%, έκταση ground glass: MD: 4.6%; LoA95: -9.8%, 19.0% και έκταση reticular: MD: 4.6%; LoA95: -10.0%, 19.3% και σαφώς μικρότερη συμφωνία με την βάση αναφοράς (69.2%, 70.8%, 70.3%, αντίστοιχα).
Τέλος η συμφωνία με την βάση αναφοράς βελτιώνεται ελάχιστα με την χρήση υποβοηθούμενου CAD σε σύγκριση με το CAD σύστημα μόνο του, ιδίως για το ground glass πρότυπο (88.1%, 78.4% and 81.6%, αντίστοιχα).
Προτείνεται επίσης στην παρούσα διατριβή η χρήση των καμπυλών συμφωνίας, όπου οπτικοποιείται η διασύγκριση μεταξύ τους, αποδεικνύοντας το υποβοηθούμενο CAD ως το βέλτιστο σύστημα, ακολουθούμενο με μικρή διαφορά από το CAD , ενώ η ημιποσοτικές μετρήσεις διαφέρουν σημαντικά από τα άλλα δύο και από την χειρωνακτική βάση αναφοράς. Oι καμπύλες τονίζουν επίσης την διάσταση των δυο διαφορετικών μεθόδων αξιολόγησης από τους ακτινολόγους ημιποσοτικής-χειρωνακτικού σχεδιασμού, επιβεβαιώνοντας τα αποτελέσματα της πρώτης φάσης της διατριβής. Η εφαρμογή διαφορετικών διαστημάτων διαφορών ±5% ή ±25 % σε συνάφεια με το βήμα ±5% της ημιποσοτικής κλίμακας κατά Desai ή 25% της κλίμακας Likert στην εκτίμηση της έκτασης της νόσου, δείχνουν τα εξής: ‘Οσο πιο λεπτομερές(±5%) είναι το βήμα της ποσοτικοποίησης τόσο μεγαλύτερα τα σφάλματα ποσοτικοποίησης και ιδίως με την ημιποσοτική μέθοδο. Αντίθετα, ενώ για αδρό βήμα 25% οι διαφορετικές μέθοδοι ποσοτικοποίησης συμφωνούν μεταξύ τους και οι μεταξύ τους διαφορές δεν είναι αντιληπτές.
Τέλος, το 3D σύστημα συσχετίζεται αρνητικά με όλους τους πνευμονικούς δείκτες για την συνολική έκταση νόσου με με καλύτερη την συσχέτιση με τους δείκτες FEV1. και DLCO ( R=-0.545 p=<0.0001, R=-0.567 p=<0.0001, αντίστοιχα). Για το reticular η συσχέτιση ήταν μέτρια για όλους τους δείκτες με καλύτερη την συσχέτιση FEV1, TLC και DLCO (R=-0.602p=<0.0001, R=-0.615 p=<0.0001 αντίστοιχα), ενώ για το ggo το σύστημα παρουσιάζει μη στατιστικά σημαντική συσχέτιση για όλους τους δείκτες. Tο 2D σύστημα παρουσιάζει μέτρια αρνητική συσχέτιση με τις πνευμονικές δοκιμασίες για την συνολική έκταση νόσου και το reticular πρότυπο, με καλύτερη την μέτρια αρνητική συσχέτιση με τον DLCΟ (R=-0.485, p= 0.002, R=-0.601 p=<0.001 αντίστοιχα). Για το ggo πρότυπο, το 2D σύστημα παρουσιάζει επίσης μη στατιστικά σημαντική συσχέτιση για όλους τους δείκτες, όπως και το 3D σύστημα.
Οι ημιποσοτικές μετρήσεις των ακτινολόγων για την συνολική έκταση νόσου 3DSQRconsRcons και 2DSQ παρουσιάζουν στατιστικά σημαντική συσχέτιση, ωστόσο ασθενή μόνο με τον δείκτη DLCO (R=-0.382, p= 0.020, R=-0.398,p=<0.02 αντίστοιχα).
Για την 3DSQRcons εκτίμηση στο reticular πρότυπο παρατηρείται στατιστικά σημαντική ασθενής συσχέτιση για όλους τους δείκτες εκτός από τον TLC (FVC: R=-0.331, p= 0.045, FEV1: R=-0.393, p=0.016, DLCO : R=-0.392, p= 0.016).
Για την 2DSQ εκτίμηση στο reticular πρότυπο παρατηρείται στατιστικά σημαντική ασθενής έως μέτρια συσχέτιση για όλους τους δείκτες (FVC: R=-0.360, p= 0.029, FEV1: R=-0.411, p=0.012, TLC : R=-0.326, p= 0.049, DLCO : R=-0.485, p= 0.002). Για το ground glass η συσχέτιση είναι μη στατιστικά σημαντική για όλους τους πνευμονικούς δείκτες τόσο για την 3DSQRcons όσο και για την 2DSQ εκτίμηση.
Συμπεράσματα
Αξιολογήθηκε ένα σύστημα ποσοτικοποίησης της διάμεσης νόσου από CT θώρακος, που βασίζεται σε μεθόδους ανάλυσης υφής, το οποίο ποσοτικοποιεί τα βασικά απεικονιστικά πρότυπα της νόσου, το ggo και το reticular πρότυπο. Αρχικά αξιολογήθηκε σε κάθε βήμα από δύο έμπειρους ακτινολόγους με ικανοποιητική απόδοση. Στη συνέχεια, εφαρμόστηκε ο 3D αλγόριθμος ποσοτικοποίησης σε διαφορετικό κλινικό δείγμα 37 ασθενών, προκειμένου να γίνει και κλινική αξιολόγηση της απόδοσης του με βάση ημιποσοτικές κλίμακες ποσοτικοποίησης, που χρησιμοποιούνται στην βιβλιογραφία, με πολύ καλή συσχέτιση. Με αναλυτικότερη μελέτη προέκυψε μια μεγαλύτερη απόκλιση των τιμών CAD και ημιποσοτικών αξιολογήσεων από τις ημιποσοτικές αξιολογήσεις μεταξύ τους. Το γεγονός αυτό οδήγηση στην περαιτέρω αξιολόγηση του CAD συστήματος με μια χειρωνακτική βάση αναφοράς σε 2D επίπεδο και σύγκριση με τις ημιποσοτικές μετρήσεις. Το σύστημα παρουσίαζε σημαντική συσχέτιση με την βάση αναφοράς και με τις ημιποσοτικές μετρήσεις. Ωστόσο επιβεβαιώθηκε ότι οι ημιποσοτικές μετρήσεις υπολείπονται συγκριτικά με την χειρωνακτική βάση αναφοράς από τους ακτινολόγους στην αξιολόγηση του CAD, όπως είναι φανερό και από τις καμπύλες διασύγκρισης των συστημάτων. Από τη διατριβή αυτή προκύπτει επίσης ένας αριθμός δευτερογενών συμπερασμάτων: Πρώτον, η ποσοτικοποίηση της διάμεσης νόσου παρουσιάζει αυξημένη μεταβλητότητα για όλα τα συστήματα αξιολόγησης , όσο αυξάνεται η έκταση της νόσου. Δεύτερον, από τα δύο πρότυπα, η ποσοτικοποίηση του ggo προτύπου παρουσίαζε τις μεγαλύτερες δυσκολίες. Τρίτον, η αξιολόγηση με υποβοηθηση CAD βελτιώνει ελάχιστα το αποτέλεσμα του συστήματος, και κυρίως διορθώνει το ggo πρότυπο. Τέταρτον, το σύστημα συσχετίζεται με τις πνευμονικές δοκιμασίες, περισσότερο από τις ημιποσοτικές εκτιμήσεις των ακτινολόγων. Ιδίως το reticular πρότυπο μπορεί να χρησιμοποιηθεί από μόνο του ως δείκτης πνευμονικής δυσλειτουργίας.
Συνοψίζοντας, το σύστημα CAD που αναπτύχθηκε είναι ένα αξιόπιστο εργαλείο ποσοτικοποίησης, το οποίο μπορεί να χρησιμοποιηθεί ως βιολογικός δείκτης σταδιοποίησης της διάμεσης νόσου.
|