Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark
Η διπλωματική εργασία εστιάζει στην αξιολόγηση τριών διαφορετικών μοντέλων μηχανικής μάθησης: Decision Tree, Random Forest και Linear Regression, για την πρόβλεψη δεδομένων σχετικά με την αλιεία. Αναλύονται οι αποδόσεις των μοντέλων μέσω των μετρικών Mean Squared Error (MSE), R-squared (R2), και Roo...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2024
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/26548 |
id |
nemertes-10889-26548 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-265482024-02-20T05:06:36Z Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark Applying machine learning to fisheries data analysis : a case study with Apache Spark Γκίκας, Μάριος Gkikas, Marios Δένδρα απόφασης Γραμμική παλινδρόμηση Αλιεία Decision trees Fisheries Aquaculture Η διπλωματική εργασία εστιάζει στην αξιολόγηση τριών διαφορετικών μοντέλων μηχανικής μάθησης: Decision Tree, Random Forest και Linear Regression, για την πρόβλεψη δεδομένων σχετικά με την αλιεία. Αναλύονται οι αποδόσεις των μοντέλων μέσω των μετρικών Mean Squared Error (MSE), R-squared (R2), και Root Mean Squared Error (RMSE), με το Random Forest να εμφανίζει την καλύτερη απόδοση, ακολουθούμενο από τη γραμμική παλινδρόμηση και τέλος το Decision Tree. Στο διάγραμμα διασποράς της γραμμικής παλινδρόμησης παρατηρείται καλή ακρίβεια σε μεσαίες τιμές, αλλά και σημαντικές αποκλίσεις για ακραίες τιμές. Το διάγραμμα μπάρας των συντελεστών αναδεικνύει τις μεταβλητές με μεγαλύτερη επίδραση στις προβλέψεις, υποδεικνύοντας πιθανές περιοχές βελτίωσης και δίνοντας ερμηνευτικότητα στο μοντέλο. Η μελλοντική εργασία μπορεί να εστιάσει στη βελτίωση των μοντέλων για ακραίες τιμές, με την εξερεύνηση μη γραμμικών μοντέλων, τεχνικών μηχανικής χαρακτηριστικών και βαθύτερης έρευνας στις λιγότερο επηρεαστικές μεταβλητές. Τα ευρήματα της εργασίας έχουν σημαντικές επιπτώσεις σε τομείς όπως η διαχείριση της αλιείας, η πολιτική λήψη αποφάσεων και οι λειτουργικές στρατηγικές, παρέχοντας πολύτιμες πληροφορίες για τους ενδιαφερόμενους και τους λήπτες αποφάσεων. The thesis focuses on evaluating three different machine learning models: Decision Tree, Random Forest, and Linear Regression, for predicting fisheries-related data. The performances of these models are analyzed using metrics such as Mean Squared Error (MSE), R-squared (R2), and Root Mean Squared Error (RMSE). The Random Forest model shows the best performance with the lowest MSE and the highest R2 value, followed by Linear Regression and then Decision Tree, which exhibits the weakest performance. In the scatter plot of Linear Regression, a good accuracy is observed for mid-range values, but significant deviations are noted for extreme values. The bar chart of coefficients highlights variables with the most significant impact on the model's predictions, suggesting potential areas for improvement and providing interpretability to the model. Future work could focus on improving model performance for extreme values, exploring non-linear models, applying feature engineering techniques, and conducting a deeper investigation into less influential variables. The findings have broader implications for areas such as fisheries management, policy-making, and operational strategies, offering valuable information for stakeholders and decision-makers. 2024-02-19T09:49:12Z 2024-02-19T09:49:12Z 2024-02-05 https://hdl.handle.net/10889/26548 el Attribution-NonCommercial-NoDerivs 3.0 United States http://creativecommons.org/licenses/by-nc-nd/3.0/us/ application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Δένδρα απόφασης Γραμμική παλινδρόμηση Αλιεία Decision trees Fisheries Aquaculture |
spellingShingle |
Δένδρα απόφασης Γραμμική παλινδρόμηση Αλιεία Decision trees Fisheries Aquaculture Γκίκας, Μάριος Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark |
description |
Η διπλωματική εργασία εστιάζει στην αξιολόγηση τριών διαφορετικών μοντέλων μηχανικής μάθησης: Decision Tree, Random Forest και Linear Regression, για την πρόβλεψη δεδομένων σχετικά με την αλιεία. Αναλύονται οι αποδόσεις των μοντέλων μέσω των μετρικών Mean Squared Error (MSE), R-squared (R2), και Root Mean Squared Error (RMSE), με το Random Forest να εμφανίζει την καλύτερη απόδοση, ακολουθούμενο από τη γραμμική παλινδρόμηση και τέλος το Decision Tree.
Στο διάγραμμα διασποράς της γραμμικής παλινδρόμησης παρατηρείται καλή ακρίβεια σε μεσαίες τιμές, αλλά και σημαντικές αποκλίσεις για ακραίες τιμές. Το διάγραμμα μπάρας των συντελεστών αναδεικνύει τις μεταβλητές με μεγαλύτερη επίδραση στις προβλέψεις, υποδεικνύοντας πιθανές περιοχές βελτίωσης και δίνοντας ερμηνευτικότητα στο μοντέλο.
Η μελλοντική εργασία μπορεί να εστιάσει στη βελτίωση των μοντέλων για ακραίες τιμές, με την εξερεύνηση μη γραμμικών μοντέλων, τεχνικών μηχανικής χαρακτηριστικών και βαθύτερης έρευνας στις λιγότερο επηρεαστικές μεταβλητές.
Τα ευρήματα της εργασίας έχουν σημαντικές επιπτώσεις σε τομείς όπως η διαχείριση της αλιείας, η πολιτική λήψη αποφάσεων και οι λειτουργικές στρατηγικές, παρέχοντας πολύτιμες πληροφορίες για τους ενδιαφερόμενους και τους λήπτες αποφάσεων. |
author2 |
Gkikas, Marios |
author_facet |
Gkikas, Marios Γκίκας, Μάριος |
author |
Γκίκας, Μάριος |
author_sort |
Γκίκας, Μάριος |
title |
Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark |
title_short |
Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark |
title_full |
Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark |
title_fullStr |
Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark |
title_full_unstemmed |
Εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με Apache Spark |
title_sort |
εφαρμογή μηχανικής μάθησης στην ανάλυση δεδομένων αλιείας : μελέτη περίπτωσης με apache spark |
publishDate |
2024 |
url |
https://hdl.handle.net/10889/26548 |
work_keys_str_mv |
AT nkikasmarios epharmogēmēchanikēsmathēsēsstēnanalysēdedomenōnalieiasmeletēperiptōsēsmeapachespark AT nkikasmarios applyingmachinelearningtofisheriesdataanalysisacasestudywithapachespark |
_version_ |
1799945004933709824 |