Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark

Η διπλωματική εργασία εστιάζει στην αξιολόγηση τριών διαφορετικών μοντέλων μηχανικής μάθησης: Decision Tree, Random Forest και Linear Regression, για την πρόβλεψη δεδομένων σχετικά με την αλιεία. Αναλύονται οι αποδόσεις των μοντέλων μέσω των μετρικών Mean Squared Error (MSE), R-squared (R2), και Roo...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Γκίκας, Μάριος
Άλλοι συγγραφείς: Gkikas, Marios
Γλώσσα:Greek
Έκδοση: 2024
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/26548
id nemertes-10889-26548
record_format dspace
spelling nemertes-10889-265482024-02-20T05:06:36Z Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark Applying machine learning to fisheries data analysis : a case study with Apache Spark Γκίκας, Μάριος Gkikas, Marios Δένδρα απόφασης Γραμμική παλινδρόμηση Αλιεία Decision trees Fisheries Aquaculture Η διπλωματική εργασία εστιάζει στην αξιολόγηση τριών διαφορετικών μοντέλων μηχανικής μάθησης: Decision Tree, Random Forest και Linear Regression, για την πρόβλεψη δεδομένων σχετικά με την αλιεία. Αναλύονται οι αποδόσεις των μοντέλων μέσω των μετρικών Mean Squared Error (MSE), R-squared (R2), και Root Mean Squared Error (RMSE), με το Random Forest να εμφανίζει την καλύτερη απόδοση, ακολουθούμενο από τη γραμμική παλινδρόμηση και τέλος το Decision Tree. Στο διάγραμμα διασποράς της γραμμικής παλινδρόμησης παρατηρείται καλή ακρίβεια σε μεσαίες τιμές, αλλά και σημαντικές αποκλίσεις για ακραίες τιμές. Το διάγραμμα μπάρας των συντελεστών αναδεικνύει τις μεταβλητές με μεγαλύτερη επίδραση στις προβλέψεις, υποδεικνύοντας πιθανές περιοχές βελτίωσης και δίνοντας ερμηνευτικότητα στο μοντέλο. Η μελλοντική εργασία μπορεί να εστιάσει στη βελτίωση των μοντέλων για ακραίες τιμές, με την εξερεύνηση μη γραμμικών μοντέλων, τεχνικών μηχανικής χαρακτηριστικών και βαθύτερης έρευνας στις λιγότερο επηρεαστικές μεταβλητές. Τα ευρήματα της εργασίας έχουν σημαντικές επιπτώσεις σε τομείς όπως η διαχείριση της αλιείας, η πολιτική λήψη αποφάσεων και οι λειτουργικές στρατηγικές, παρέχοντας πολύτιμες πληροφορίες για τους ενδιαφερόμενους και τους λήπτες αποφάσεων. The thesis focuses on evaluating three different machine learning models: Decision Tree, Random Forest, and Linear Regression, for predicting fisheries-related data. The performances of these models are analyzed using metrics such as Mean Squared Error (MSE), R-squared (R2), and Root Mean Squared Error (RMSE). The Random Forest model shows the best performance with the lowest MSE and the highest R2 value, followed by Linear Regression and then Decision Tree, which exhibits the weakest performance. In the scatter plot of Linear Regression, a good accuracy is observed for mid-range values, but significant deviations are noted for extreme values. The bar chart of coefficients highlights variables with the most significant impact on the model's predictions, suggesting potential areas for improvement and providing interpretability to the model. Future work could focus on improving model performance for extreme values, exploring non-linear models, applying feature engineering techniques, and conducting a deeper investigation into less influential variables. The findings have broader implications for areas such as fisheries management, policy-making, and operational strategies, offering valuable information for stakeholders and decision-makers. 2024-02-19T09:49:12Z 2024-02-19T09:49:12Z 2024-02-05 https://hdl.handle.net/10889/26548 el Attribution-NonCommercial-NoDerivs 3.0 United States http://creativecommons.org/licenses/by-nc-nd/3.0/us/ application/pdf
institution UPatras
collection Nemertes
language Greek
topic Δένδρα απόφασης
Γραμμική παλινδρόμηση
Αλιεία
Decision trees
Fisheries
Aquaculture
spellingShingle Δένδρα απόφασης
Γραμμική παλινδρόμηση
Αλιεία
Decision trees
Fisheries
Aquaculture
Γκίκας, Μάριος
Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark
description Η διπλωματική εργασία εστιάζει στην αξιολόγηση τριών διαφορετικών μοντέλων μηχανικής μάθησης: Decision Tree, Random Forest και Linear Regression, για την πρόβλεψη δεδομένων σχετικά με την αλιεία. Αναλύονται οι αποδόσεις των μοντέλων μέσω των μετρικών Mean Squared Error (MSE), R-squared (R2), και Root Mean Squared Error (RMSE), με το Random Forest να εμφανίζει την καλύτερη απόδοση, ακολουθούμενο από τη γραμμική παλινδρόμηση και τέλος το Decision Tree. Στο διάγραμμα διασποράς της γραμμικής παλινδρόμησης παρατηρείται καλή ακρίβεια σε μεσαίες τιμές, αλλά και σημαντικές αποκλίσεις για ακραίες τιμές. Το διάγραμμα μπάρας των συντελεστών αναδεικνύει τις μεταβλητές με μεγαλύτερη επίδραση στις προβλέψεις, υποδεικνύοντας πιθανές περιοχές βελτίωσης και δίνοντας ερμηνευτικότητα στο μοντέλο. Η μελλοντική εργασία μπορεί να εστιάσει στη βελτίωση των μοντέλων για ακραίες τιμές, με την εξερεύνηση μη γραμμικών μοντέλων, τεχνικών μηχανικής χαρακτηριστικών και βαθύτερης έρευνας στις λιγότερο επηρεαστικές μεταβλητές. Τα ευρήματα της εργασίας έχουν σημαντικές επιπτώσεις σε τομείς όπως η διαχείριση της αλιείας, η πολιτική λήψη αποφάσεων και οι λειτουργικές στρατηγικές, παρέχοντας πολύτιμες πληροφορίες για τους ενδιαφερόμενους και τους λήπτες αποφάσεων.
author2 Gkikas, Marios
author_facet Gkikas, Marios
Γκίκας, Μάριος
author Γκίκας, Μάριος
author_sort Γκίκας, Μάριος
title Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark
title_short Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark
title_full Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark
title_fullStr Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark
title_full_unstemmed Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark
title_sort εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με apache spark
publishDate 2024
url https://hdl.handle.net/10889/26548
work_keys_str_mv AT nkikasmarios epharmogēmēchanikēsmathēsēsstēnanalysēdedomenōnalieiasmeletēperiptōsēsmeapachespark
AT nkikasmarios applyingmachinelearningtofisheriesdataanalysisacasestudywithapachespark
_version_ 1799945004933709824