Αυτόματη αναγνώριση μουσικού οργάνου με χρήση τεχνικών μηχανικής μάθησης

Η παρούσα εργασία έχει στόχο την αυτόματη αναγνώριση μουσικού οργάνου. Αυτή επιτυγχάνεται μέσω διαφορετικών αλγορίθμων μηχανικής μάθησης. Συγκεκριμένα, μελετήθηκαν και υλοποιήθηκαν τρεις διαφορετικοί αλγόριθμοι (Μηχανές Διανυσμάτων Υποστήριξης, Τεχνητά Νευρωνικά Δίκτυα, Συνελικτικά Νευρωνικά Δίκτυα)...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αρβανίτης, Νικόλαος
Άλλοι συγγραφείς: Ψαράκης, Εμμανουήλ
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13160
Περιγραφή
Περίληψη:Η παρούσα εργασία έχει στόχο την αυτόματη αναγνώριση μουσικού οργάνου. Αυτή επιτυγχάνεται μέσω διαφορετικών αλγορίθμων μηχανικής μάθησης. Συγκεκριμένα, μελετήθηκαν και υλοποιήθηκαν τρεις διαφορετικοί αλγόριθμοι (Μηχανές Διανυσμάτων Υποστήριξης, Τεχνητά Νευρωνικά Δίκτυα, Συνελικτικά Νευρωνικά Δίκτυα) οι οποίοι δέχτηκαν ως είσοδο κάθε φορά ένα από τα έξι ηχητικά χαρακτηριστικά που εξήχθησαν (Σπεκτρόγραμμα, Mel-Σπεκτρόγραμμα, Συντελεστές MFCC, Χρωματόγραμμα, Χρωματόγραμμα Σταθεράς-Q, Φασματικό Κεντροειδές) με σκοπό την ανάλυση της συμπεριφοράς και την σύγκριση των αποτελεσμάτων τόσο των ηχητικών χαρακτηριστικών όσο και των αλγορίθμων μηχανικής μάθησης. Είναι παραδεκτό πως ο ήχος πολλών μουσικών οργάνων δεν είναι εύκολα αναγνωρίσιμος από άλλα. Βέβαια στην αναγνώριση παίζει σημαντικό ρόλο και το ακουστικό σύστημα του εκάστοτε δέκτη και για τον λόγο αυτό, το πρώτο κεφάλαιο ξεκινάει αναλύοντας το ανθρώπινο ακουστικό σύστημα. Στη συνέχεια, δεύτερο και τρίτο κεφάλαιο, η εργασία κάνει μία σύντομη αναδρομή στο μετασχηματισμό Fourier, αφού αυτόν έχουν ως βάση τους όλα τα ηχητικά χαρακτηριστικά που χρησιμοποιήθηκαν. Παρουσιάζει αναλυτικά τα έξι ηχητικά χαρακτηριστικά, όντας άλλα πιο συναφή και άλλα λιγότερο, ως προς τα ποιοτικά χαρακτηριστικά που επιτρέπουν την αναγνώριση του μουσικού οργάνου. Έπειτα αναλύονται γενικότερα ζητήματα μηχανικής μάθησης όσον αφορά το τι είναι και πως χρησιμοποιείται η οικογένεια αυτή αλγορίθμων. Βέβαια μεγαλύτερη βαρύτητα δίνεται στους τρεις αλγορίθμους που χρησιμοποιήθηκαν στην εργασία. Το τελευταίο κεφάλαιο της εργασίας παρουσιάζει την υλοποίηση αυτής. Πραγματοποιήθηκαν τρία διαφορετικά πειράματα (αναγνώριση κατηγορίας μουσικού οργάνου, αναγνώριση μουσικού οργάνου μεταξύ οργάνων ίδιας κατηγορίας, αναγνώριση μουσικού οργάνου μεταξύ 12 οργάνων). Κλείνοντας, τα αποτελέσματα των πειραμάτων για κάθε αλγόριθμο και κάθε χαρακτηριστικό σχολιάζονται και συγκρίνονται. Διατυπώνονται κάποιες τελευταίες σκέψεις όσον αφορά την βελτίωση των αποτελεσμάτων και πιθανούς εναλλακτικούς αλγόριθμους για πιο σίγουρη αναγνώριση.