Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης
Η ανάκτηση μουσικής πληροφορίας (MIR) χρησιμοποιεί υπολογιστικές μεθόδους για να βελτιώσει τον τρόπο αναζήτησης ενός χρήστη σε μια μουσική συλλογή. Ένα από τα προβλήματα της MIR είναι ο διαχωρισμός πηγών που σκοπεύει στην εξαγωγή των σημάτων ορισμένων πηγών (μουσικών οργάνων, φωνής) από ένα σήμα μίξ...
Main Author: | |
---|---|
Other Authors: | |
Language: | Greek |
Published: |
2021
|
Subjects: | |
Online Access: | http://hdl.handle.net/10889/14610 |
id |
nemertes-10889-14610 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-146102022-09-06T05:13:44Z Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης Music source separation with unsupervised learning methods Τζούπης, Γεώργιος Tzoupis, George Επιβλεπόμενη μάθηση Διαχωρισμός πηγών Επεξεργασία σημάτων Επεξεργασία ήχου Μουσικές πηγές Νευρωνικά δίκτυα Supervised learning Source separation Signal processing Audio processing Music sources Neural networks Non‐negative matrix factorization (NMF) Η ανάκτηση μουσικής πληροφορίας (MIR) χρησιμοποιεί υπολογιστικές μεθόδους για να βελτιώσει τον τρόπο αναζήτησης ενός χρήστη σε μια μουσική συλλογή. Ένα από τα προβλήματα της MIR είναι ο διαχωρισμός πηγών που σκοπεύει στην εξαγωγή των σημάτων ορισμένων πηγών (μουσικών οργάνων, φωνής) από ένα σήμα μίξης. Το αποτέλεσμα του διαχωρισμού μπορεί να χρησιμοποιηθεί ως έχει από τον χρήστη ή να υποστεί περαιτέρω επεξεργασία από κάποιο σύστημα προκειμένου να βελτιώσει τα αποτελέσματα του τελευταίου. Ο διαχωρισμός ηχητικών πηγών από στερεοφωνικές μίξεις επαγγελματικής παραγωγής αποτελεί ένα πρόβλημα πρόκληση, καθώς υπάρχει μεγάλη ποικιλία στα χαρακτηριστικά των σημάτων των μουσικών πηγών. Τα τελευταία χρόνια, μέθοδοι επιβλεπόμενης μάθησης εφαρμόζονται στο πρόβλημα του διαχωρισμού μουσικών πηγών με μεγάλη επιτυχία. Τα μοντέλα μη‐αρνητικης παραγοντοποίησης μητρώων (NMF) και νευρωνικών δικτύων (NN) έχουν δείξει ενθαρρυντικά αποτελέσματα όσον αφορά την αξιοποίηση ενός συνόλου δεδομένων εκπαίδευσης για να πετύχουν βελτιωμένα αποτελέσματα διαχωρισμού σε σχέση με μεθόδους τυφλού διαχωρισμού. Αυτή η εργασία παρουσιάζει μια σύγκριση μεταξύ δύο σύγχρονων μεθόδων βασισμένες σε μοντέλο NMF και νευρωνικού δικτύου, από την σκοπιά του προβλήματος διαχωρισμού φωνητικών και συνοδείας, προκειμένου να αξιολογήσει την ποιότητα των αποτελεσμάτων, να αναδείξει διαφορετικούς τρόπους διαχείρισης του συνόλου δεδομένων και να αποτιμήσει το χρονικό κόστος της εκπαίδευσης και του διαχωρισμού των δύο μεθόδων. Music information retrieval (MIR) uses computational methods to improve the way a user interacts with a music collection. One of MIR's problems is source separation in which we aim to extract the signals of individual sources (musical instruments, vocals) from a mixture signal. The resulting source signals can be used as is by the user or introduce further processing by another system in order to improve the results of the latter. Source separation from professionally produced stereo mixtures is a challenging problem, because there is a great variety in the characteristics of musical source signals. In recent years, supervised learning methods are being applied to the problem of music source separation with great success. Non‐negative matrix factorization (NMF) and neural network (NN) models have shown positive results in utilizing a training dataset to achieve improved separation performance compared to blind separation methods. This work presents a comparison between two modern methods based on NMF and neural network models, in the context of vocals and accompaniment separation, aiming to evaluate the quality of separation results, show the various available ways of handling the contents of the dataset and assess the time cost for training and separation of the two methods. 2021-03-05T17:15:33Z 2021-03-05T17:15:33Z 2021-03-05 http://hdl.handle.net/10889/14610 gr winzip/winrar application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Επιβλεπόμενη μάθηση Διαχωρισμός πηγών Επεξεργασία σημάτων Επεξεργασία ήχου Μουσικές πηγές Νευρωνικά δίκτυα Supervised learning Source separation Signal processing Audio processing Music sources Neural networks Non‐negative matrix factorization (NMF) |
spellingShingle |
Επιβλεπόμενη μάθηση Διαχωρισμός πηγών Επεξεργασία σημάτων Επεξεργασία ήχου Μουσικές πηγές Νευρωνικά δίκτυα Supervised learning Source separation Signal processing Audio processing Music sources Neural networks Non‐negative matrix factorization (NMF) Τζούπης, Γεώργιος Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης |
description |
Η ανάκτηση μουσικής πληροφορίας (MIR) χρησιμοποιεί υπολογιστικές μεθόδους για να βελτιώσει τον τρόπο αναζήτησης ενός χρήστη σε μια μουσική συλλογή. Ένα από τα προβλήματα της MIR είναι ο διαχωρισμός πηγών που σκοπεύει στην εξαγωγή των σημάτων ορισμένων πηγών (μουσικών οργάνων, φωνής) από ένα σήμα μίξης. Το αποτέλεσμα του διαχωρισμού μπορεί να χρησιμοποιηθεί ως έχει από τον χρήστη ή να υποστεί περαιτέρω επεξεργασία από κάποιο σύστημα προκειμένου να βελτιώσει τα αποτελέσματα του τελευταίου. Ο διαχωρισμός ηχητικών πηγών από στερεοφωνικές μίξεις επαγγελματικής παραγωγής αποτελεί ένα πρόβλημα πρόκληση, καθώς υπάρχει μεγάλη ποικιλία στα χαρακτηριστικά των σημάτων των μουσικών πηγών. Τα τελευταία χρόνια, μέθοδοι επιβλεπόμενης μάθησης εφαρμόζονται στο πρόβλημα του διαχωρισμού μουσικών πηγών με μεγάλη επιτυχία. Τα μοντέλα μη‐αρνητικης παραγοντοποίησης μητρώων (NMF) και νευρωνικών δικτύων (NN) έχουν δείξει ενθαρρυντικά αποτελέσματα όσον αφορά την αξιοποίηση ενός συνόλου δεδομένων εκπαίδευσης για να πετύχουν βελτιωμένα αποτελέσματα διαχωρισμού σε σχέση με μεθόδους τυφλού διαχωρισμού. Αυτή η εργασία παρουσιάζει μια σύγκριση μεταξύ δύο σύγχρονων μεθόδων βασισμένες σε μοντέλο NMF και νευρωνικού δικτύου, από την σκοπιά του προβλήματος διαχωρισμού φωνητικών και συνοδείας, προκειμένου να αξιολογήσει την ποιότητα των αποτελεσμάτων, να αναδείξει διαφορετικούς τρόπους διαχείρισης του συνόλου δεδομένων και να αποτιμήσει το χρονικό κόστος της εκπαίδευσης και του διαχωρισμού των δύο μεθόδων. |
author2 |
Tzoupis, George |
author_facet |
Tzoupis, George Τζούπης, Γεώργιος |
author |
Τζούπης, Γεώργιος |
author_sort |
Τζούπης, Γεώργιος |
title |
Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης |
title_short |
Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης |
title_full |
Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης |
title_fullStr |
Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης |
title_full_unstemmed |
Διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης |
title_sort |
διαχωρισμός μουσικών πηγών με τεχνικές επιβλεπόμενης μάθησης |
publishDate |
2021 |
url |
http://hdl.handle.net/10889/14610 |
work_keys_str_mv |
AT tzoupēsgeōrgios diachōrismosmousikōnpēgōnmetechnikesepiblepomenēsmathēsēs AT tzoupēsgeōrgios musicsourceseparationwithunsupervisedlearningmethods |
_version_ |
1799945011581681664 |