Ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων με χρήση ML Apache Spark

Στις μέρες μας, οι καθυστερήσεις και οι ακυρώσεις των αεροπορικών πτήσεων αποτελούν ένα σημαντικό πρόβλημα, το οποίο έχει αρκετές αρνητικές επιπτώσεις, κυρίως οικονομικές, είτε στους ταξιδιώτες είτε στις αεροπορικές εταιρείες είτε στους αερολιμένες. Αξιοσημείωτοι παράγοντες που οδηγούν στις καθυστερ...

Full description

Bibliographic Details
Main Author: Χριστόπουλος, Αλέξανδρος
Other Authors: Christopoulos, Alexandros
Language:Greek
Published: 2021
Subjects:
Online Access:http://hdl.handle.net/10889/14912
Description
Summary:Στις μέρες μας, οι καθυστερήσεις και οι ακυρώσεις των αεροπορικών πτήσεων αποτελούν ένα σημαντικό πρόβλημα, το οποίο έχει αρκετές αρνητικές επιπτώσεις, κυρίως οικονομικές, είτε στους ταξιδιώτες είτε στις αεροπορικές εταιρείες είτε στους αερολιμένες. Αξιοσημείωτοι παράγοντες που οδηγούν στις καθυστερήσεις ή ακόμα και τις ακυρώσεις πτήσεων είναι οι δυσμενείς καιρικές συνθήκες και η συμφόρηση της εναέριας κυκλοφορίας. Δεδομένου αυτών των παραγόντων και του γεγονότος ότι στις μέρες μας υπάρχει ραγδαία αύξηση των αερογραμμών και του πλήθους των πτήσεων μεταξύ των αερολιμένων, δημιουργήθηκε μία μεγάλη ανάγκη για την πρόβλεψη των καθυστερήσεων και των ακυρώσεων των αεροπορικών πτήσεων. Η επιστήμη των υπολογιστών έρχεται να δώσει μία λύση σε αυτό το πρόβλημα μέσω του τομέα της μηχανικής μάθησης. Στόχος της παρούσας διπλωματικής εργασίας είναι: 1) η έρευνα για την δημιουργία ενός αποδοτικού μοντέλου επιβλεπόμενης μηχανικής μάθησης για την πρόβλεψη καθυστερήσεων και ακυρώσεων των πτήσεων, 2) η εύρεση κατάλληλων πρακτικών για την ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων και 3) η υλοποίηση ενός τέτοιου μοντέλου πρόβλεψης με χρήση του κατανεμημένου συστήματος υπολογισμού Apache Spark με την βιβλιοθήκη Spark ML που προσφέρει εργαλεία και υλοποιημένους αλγορίθμους μηχανικής μάθησης.