Περίληψη: | Η ανάκτηση μουσικής πληροφορίας (MIR) χρησιμοποιεί υπολογιστικές μεθόδους για να βελτιώσει τον τρόπο αναζήτησης ενός χρήστη σε μια μουσική συλλογή. Ένα από τα προβλήματα της MIR είναι ο διαχωρισμός πηγών που σκοπεύει στην εξαγωγή των σημάτων ορισμένων πηγών (μουσικών οργάνων, φωνής) από ένα σήμα μίξης. Το αποτέλεσμα του διαχωρισμού μπορεί να χρησιμοποιηθεί ως έχει από τον χρήστη ή να υποστεί περαιτέρω επεξεργασία από κάποιο σύστημα προκειμένου να βελτιώσει τα αποτελέσματα του τελευταίου. Ο διαχωρισμός ηχητικών πηγών από στερεοφωνικές μίξεις επαγγελματικής παραγωγής αποτελεί ένα πρόβλημα πρόκληση, καθώς υπάρχει μεγάλη ποικιλία στα χαρακτηριστικά των σημάτων των μουσικών πηγών. Τα τελευταία χρόνια, μέθοδοι επιβλεπόμενης μάθησης εφαρμόζονται στο πρόβλημα του διαχωρισμού μουσικών πηγών με μεγάλη επιτυχία. Τα μοντέλα μη‐αρνητικης παραγοντοποίησης μητρώων (NMF) και νευρωνικών δικτύων (NN) έχουν δείξει ενθαρρυντικά αποτελέσματα όσον αφορά την αξιοποίηση ενός συνόλου δεδομένων εκπαίδευσης για να πετύχουν βελτιωμένα αποτελέσματα διαχωρισμού σε σχέση με μεθόδους τυφλού διαχωρισμού. Αυτή η εργασία παρουσιάζει μια σύγκριση μεταξύ δύο σύγχρονων μεθόδων βασισμένες σε μοντέλο NMF και νευρωνικού δικτύου, από την σκοπιά του προβλήματος διαχωρισμού φωνητικών και συνοδείας, προκειμένου να αξιολογήσει την ποιότητα των αποτελεσμάτων, να αναδείξει διαφορετικούς τρόπους διαχείρισης του συνόλου δεδομένων και να αποτιμήσει το χρονικό κόστος της εκπαίδευσης και του διαχωρισμού των δύο μεθόδων.
|