Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης

Η ανάκτηση μουσικής πληροφορίας (MIR) χρησιμοποιεί υπολογιστικές μεθόδους για να βελτιώσει τον τρόπο αναζήτησης ενός χρήστη σε μια μουσική συλλογή. Ένα από τα προβλήματα της MIR είναι ο διαχωρισμός πηγών που σκοπεύει στην εξαγωγή των σημάτων ορισμένων πηγών (μουσικών οργάνων, φωνής) από ένα σήμα μίξ...

Full description

Bibliographic Details
Main Author: Τζούπης, Γεώργιος
Other Authors: Tzoupis, George
Language:Greek
Published: 2021
Subjects:
Online Access:http://hdl.handle.net/10889/14610
id nemertes-10889-14610
record_format dspace
spelling nemertes-10889-146102022-09-06T05:13:44Z Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης Music source separation with unsupervised learning methods Τζούπης, Γεώργιος Tzoupis, George Επιβλεπόμενη μάθηση Διαχωρισμός πηγών Επεξεργασία σημάτων Επεξεργασία ήχου Μουσικές πηγές Νευρωνικά δίκτυα Supervised learning Source separation Signal processing Audio processing Music sources Neural networks Non‐negative matrix factorization (NMF) Η ανάκτηση μουσικής πληροφορίας (MIR) χρησιμοποιεί υπολογιστικές μεθόδους για να βελτιώσει τον τρόπο αναζήτησης ενός χρήστη σε μια μουσική συλλογή. Ένα από τα προβλήματα της MIR είναι ο διαχωρισμός πηγών που σκοπεύει στην εξαγωγή των σημάτων ορισμένων πηγών (μουσικών οργάνων, φωνής) από ένα σήμα μίξης. Το αποτέλεσμα του διαχωρισμού μπορεί να χρησιμοποιηθεί ως έχει από τον χρήστη ή να υποστεί περαιτέρω επεξεργασία από κάποιο σύστημα προκειμένου να βελτιώσει τα αποτελέσματα του τελευταίου. Ο διαχωρισμός ηχητικών πηγών από στερεοφωνικές μίξεις επαγγελματικής παραγωγής αποτελεί ένα πρόβλημα πρόκληση, καθώς υπάρχει μεγάλη ποικιλία στα χαρακτηριστικά των σημάτων των μουσικών πηγών. Τα τελευταία χρόνια, μέθοδοι επιβλεπόμενης μάθησης εφαρμόζονται στο πρόβλημα του διαχωρισμού μουσικών πηγών με μεγάλη επιτυχία. Τα μοντέλα μη‐αρνητικης παραγοντοποίησης μητρώων (NMF) και νευρωνικών δικτύων (NN) έχουν δείξει ενθαρρυντικά αποτελέσματα όσον αφορά την αξιοποίηση ενός συνόλου δεδομένων εκπαίδευσης για να πετύχουν βελτιωμένα αποτελέσματα διαχωρισμού σε σχέση με μεθόδους τυφλού διαχωρισμού. Αυτή η εργασία παρουσιάζει μια σύγκριση μεταξύ δύο σύγχρονων μεθόδων βασισμένες σε μοντέλο NMF και νευρωνικού δικτύου, από την σκοπιά του προβλήματος διαχωρισμού φωνητικών και συνοδείας, προκειμένου να αξιολογήσει την ποιότητα των αποτελεσμάτων, να αναδείξει διαφορετικούς τρόπους διαχείρισης του συνόλου δεδομένων και να αποτιμήσει το χρονικό κόστος της εκπαίδευσης και του διαχωρισμού των δύο μεθόδων. Music information retrieval (MIR) uses computational methods to improve the way a user interacts with a music collection. One of MIR's problems is source separation in which we aim to extract the signals of individual sources (musical instruments, vocals) from a mixture signal. The resulting source signals can be used as is by the user or introduce further processing by another system in order to improve the results of the latter. Source separation from professionally produced stereo mixtures is a challenging problem, because there is a great variety in the characteristics of musical source signals. In recent years, supervised learning methods are being applied to the problem of music source separation with great success. Non‐negative matrix factorization (NMF) and neural network (NN) models have shown positive results in utilizing a training dataset to achieve improved separation performance compared to blind separation methods. This work presents a comparison between two modern methods based on NMF and neural network models, in the context of vocals and accompaniment separation, aiming to evaluate the quality of separation results, show the various available ways of handling the contents of the dataset and assess the time cost for training and separation of the two methods. 2021-03-05T17:15:33Z 2021-03-05T17:15:33Z 2021-03-05 http://hdl.handle.net/10889/14610 gr winzip/winrar application/pdf
institution UPatras
collection Nemertes
language Greek
topic Επιβλεπόμενη μάθηση
Διαχωρισμός πηγών
Επεξεργασία σημάτων
Επεξεργασία ήχου
Μουσικές πηγές
Νευρωνικά δίκτυα
Supervised learning
Source separation
Signal processing
Audio processing
Music sources
Neural networks
Non‐negative matrix factorization (NMF)
spellingShingle Επιβλεπόμενη μάθηση
Διαχωρισμός πηγών
Επεξεργασία σημάτων
Επεξεργασία ήχου
Μουσικές πηγές
Νευρωνικά δίκτυα
Supervised learning
Source separation
Signal processing
Audio processing
Music sources
Neural networks
Non‐negative matrix factorization (NMF)
Τζούπης, Γεώργιος
Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης
description Η ανάκτηση μουσικής πληροφορίας (MIR) χρησιμοποιεί υπολογιστικές μεθόδους για να βελτιώσει τον τρόπο αναζήτησης ενός χρήστη σε μια μουσική συλλογή. Ένα από τα προβλήματα της MIR είναι ο διαχωρισμός πηγών που σκοπεύει στην εξαγωγή των σημάτων ορισμένων πηγών (μουσικών οργάνων, φωνής) από ένα σήμα μίξης. Το αποτέλεσμα του διαχωρισμού μπορεί να χρησιμοποιηθεί ως έχει από τον χρήστη ή να υποστεί περαιτέρω επεξεργασία από κάποιο σύστημα προκειμένου να βελτιώσει τα αποτελέσματα του τελευταίου. Ο διαχωρισμός ηχητικών πηγών από στερεοφωνικές μίξεις επαγγελματικής παραγωγής αποτελεί ένα πρόβλημα πρόκληση, καθώς υπάρχει μεγάλη ποικιλία στα χαρακτηριστικά των σημάτων των μουσικών πηγών. Τα τελευταία χρόνια, μέθοδοι επιβλεπόμενης μάθησης εφαρμόζονται στο πρόβλημα του διαχωρισμού μουσικών πηγών με μεγάλη επιτυχία. Τα μοντέλα μη‐αρνητικης παραγοντοποίησης μητρώων (NMF) και νευρωνικών δικτύων (NN) έχουν δείξει ενθαρρυντικά αποτελέσματα όσον αφορά την αξιοποίηση ενός συνόλου δεδομένων εκπαίδευσης για να πετύχουν βελτιωμένα αποτελέσματα διαχωρισμού σε σχέση με μεθόδους τυφλού διαχωρισμού. Αυτή η εργασία παρουσιάζει μια σύγκριση μεταξύ δύο σύγχρονων μεθόδων βασισμένες σε μοντέλο NMF και νευρωνικού δικτύου, από την σκοπιά του προβλήματος διαχωρισμού φωνητικών και συνοδείας, προκειμένου να αξιολογήσει την ποιότητα των αποτελεσμάτων, να αναδείξει διαφορετικούς τρόπους διαχείρισης του συνόλου δεδομένων και να αποτιμήσει το χρονικό κόστος της εκπαίδευσης και του διαχωρισμού των δύο μεθόδων.
author2 Tzoupis, George
author_facet Tzoupis, George
Τζούπης, Γεώργιος
author Τζούπης, Γεώργιος
author_sort Τζούπης, Γεώργιος
title Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης
title_short Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης
title_full Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης
title_fullStr Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης
title_full_unstemmed Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης
title_sort διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης
publishDate 2021
url http://hdl.handle.net/10889/14610
work_keys_str_mv AT tzoupēsgeōrgios diachōrismosmousikōnpēgōnmetechnikesepiblepomenēsmathēsēs
AT tzoupēsgeōrgios musicsourceseparationwithunsupervisedlearningmethods
_version_ 1799945011581681664