Ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων με χρήση ML Apache Spark
Στις μέρες μας, οι καθυστερήσεις και οι ακυρώσεις των αεροπορικών πτήσεων αποτελούν ένα σημαντικό πρόβλημα, το οποίο έχει αρκετές αρνητικές επιπτώσεις, κυρίως οικονομικές, είτε στους ταξιδιώτες είτε στις αεροπορικές εταιρείες είτε στους αερολιμένες. Αξιοσημείωτοι παράγοντες που οδηγούν στις καθυστερ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2021
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/14912 |
id |
nemertes-10889-14912 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-149122022-09-05T06:57:30Z Ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων με χρήση ML Apache Spark Large volume data analysis of air flights data using ML Apache Spark Χριστόπουλος, Αλέξανδρος Christopoulos, Alexandros Αεροπορικές πτήσεις Μηχανική μάθηση Air flights Machine learning Apache Spark Scala Στις μέρες μας, οι καθυστερήσεις και οι ακυρώσεις των αεροπορικών πτήσεων αποτελούν ένα σημαντικό πρόβλημα, το οποίο έχει αρκετές αρνητικές επιπτώσεις, κυρίως οικονομικές, είτε στους ταξιδιώτες είτε στις αεροπορικές εταιρείες είτε στους αερολιμένες. Αξιοσημείωτοι παράγοντες που οδηγούν στις καθυστερήσεις ή ακόμα και τις ακυρώσεις πτήσεων είναι οι δυσμενείς καιρικές συνθήκες και η συμφόρηση της εναέριας κυκλοφορίας. Δεδομένου αυτών των παραγόντων και του γεγονότος ότι στις μέρες μας υπάρχει ραγδαία αύξηση των αερογραμμών και του πλήθους των πτήσεων μεταξύ των αερολιμένων, δημιουργήθηκε μία μεγάλη ανάγκη για την πρόβλεψη των καθυστερήσεων και των ακυρώσεων των αεροπορικών πτήσεων. Η επιστήμη των υπολογιστών έρχεται να δώσει μία λύση σε αυτό το πρόβλημα μέσω του τομέα της μηχανικής μάθησης. Στόχος της παρούσας διπλωματικής εργασίας είναι: 1) η έρευνα για την δημιουργία ενός αποδοτικού μοντέλου επιβλεπόμενης μηχανικής μάθησης για την πρόβλεψη καθυστερήσεων και ακυρώσεων των πτήσεων, 2) η εύρεση κατάλληλων πρακτικών για την ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων και 3) η υλοποίηση ενός τέτοιου μοντέλου πρόβλεψης με χρήση του κατανεμημένου συστήματος υπολογισμού Apache Spark με την βιβλιοθήκη Spark ML που προσφέρει εργαλεία και υλοποιημένους αλγορίθμους μηχανικής μάθησης. Flight cancellations and delays is a major problem which has many negative impacts, mainly economic, on either the air flight travelers or the air flight carriers or the airports. Notable factors that play a major role in cancellations and delays are the adverse weather conditions and the air flights congestion. Given those notable factors and the fact that in our days there is a huge increase in the number of airlines and the number of air flights between airports, a great need for predicting delays and cancellations has been created. Computer Science gives a solution to this problem with the field of machine learning. Purpose of this particular Thesis is to: 1) research and create an efficient prediction model using supervised machine learning that will predict flights cancelation and delays effectively, 2) find an effective method for large volume air flights data analysis and 3) implement such a prediction model as mentioned in 1 using the distributed computing system of Apache Spark with the use of the Spark ML library that offers tools and implemented algorithms for machine learning. 2021-07-05T11:27:49Z 2021-07-05T11:27:49Z 2020-07-06 http://hdl.handle.net/10889/14912 gr application/pdf application/octet-stream |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Αεροπορικές πτήσεις Μηχανική μάθηση Air flights Machine learning Apache Spark Scala |
spellingShingle |
Αεροπορικές πτήσεις Μηχανική μάθηση Air flights Machine learning Apache Spark Scala Χριστόπουλος, Αλέξανδρος Ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων με χρήση ML Apache Spark |
description |
Στις μέρες μας, οι καθυστερήσεις και οι ακυρώσεις των αεροπορικών πτήσεων αποτελούν ένα σημαντικό πρόβλημα, το οποίο έχει αρκετές αρνητικές επιπτώσεις, κυρίως οικονομικές, είτε στους ταξιδιώτες είτε στις αεροπορικές εταιρείες είτε στους αερολιμένες. Αξιοσημείωτοι παράγοντες που οδηγούν στις καθυστερήσεις ή ακόμα και τις ακυρώσεις πτήσεων είναι οι δυσμενείς καιρικές συνθήκες και η συμφόρηση της εναέριας κυκλοφορίας. Δεδομένου αυτών των παραγόντων και του γεγονότος ότι στις μέρες μας υπάρχει ραγδαία αύξηση των αερογραμμών και του πλήθους των πτήσεων μεταξύ των αερολιμένων, δημιουργήθηκε μία μεγάλη ανάγκη για την πρόβλεψη των καθυστερήσεων και των ακυρώσεων των αεροπορικών πτήσεων. Η επιστήμη των υπολογιστών έρχεται να δώσει μία λύση σε αυτό το πρόβλημα μέσω του τομέα της μηχανικής μάθησης. Στόχος της παρούσας διπλωματικής εργασίας είναι: 1) η έρευνα για την δημιουργία ενός αποδοτικού μοντέλου επιβλεπόμενης μηχανικής μάθησης για την πρόβλεψη καθυστερήσεων και ακυρώσεων των πτήσεων, 2) η εύρεση κατάλληλων πρακτικών για την ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων και 3) η υλοποίηση ενός τέτοιου μοντέλου πρόβλεψης με χρήση του κατανεμημένου συστήματος υπολογισμού Apache Spark με την βιβλιοθήκη Spark ML που προσφέρει εργαλεία και υλοποιημένους αλγορίθμους μηχανικής μάθησης. |
author2 |
Christopoulos, Alexandros |
author_facet |
Christopoulos, Alexandros Χριστόπουλος, Αλέξανδρος |
author |
Χριστόπουλος, Αλέξανδρος |
author_sort |
Χριστόπουλος, Αλέξανδρος |
title |
Ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων με χρήση ML Apache Spark |
title_short |
Ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων με χρήση ML Apache Spark |
title_full |
Ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων με χρήση ML Apache Spark |
title_fullStr |
Ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων με χρήση ML Apache Spark |
title_full_unstemmed |
Ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων με χρήση ML Apache Spark |
title_sort |
ανάλυση μεγάλου όγκου δεδομένων αεροπορικών πτήσεων με χρήση ml apache spark |
publishDate |
2021 |
url |
http://hdl.handle.net/10889/14912 |
work_keys_str_mv |
AT christopoulosalexandros analysēmegalouonkoudedomenōnaeroporikōnptēseōnmechrēsēmlapachespark AT christopoulosalexandros largevolumedataanalysisofairflightsdatausingmlapachespark |
_version_ |
1771297166747238400 |