Ανάκτηση φάσης για διαχωρισμό ηχητικών πηγών

Το πρόβλημα του διαχωρισμού πηγών είναι η εύρεση σημάτων δεδομένου ενός σήματος που αποτελεί τη μίξη τους. Προσεγγίζεται με επεξεργασία στο πεδίο του χρόνου ή το χρόνο-συχνοτικό πεδίο. Οι συχνοτικές παράμετροι που περιλαμβάνονται σε κάθε σχήμα διαχωρισμού είναι το πλάτος και η φάση του μετασχηματισμ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Ρουφογάλης, Γεώργιος
Άλλοι συγγραφείς: Roufogalis, Georgios
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14708
id nemertes-10889-14708
record_format dspace
spelling nemertes-10889-147082022-09-05T20:13:55Z Ανάκτηση φάσης για διαχωρισμό ηχητικών πηγών Phase retrieval for music source seperation Ρουφογάλης, Γεώργιος Roufogalis, Georgios Διαχωρισμός πηγών Φάση μετασχηματισμού Source seperation Το πρόβλημα του διαχωρισμού πηγών είναι η εύρεση σημάτων δεδομένου ενός σήματος που αποτελεί τη μίξη τους. Προσεγγίζεται με επεξεργασία στο πεδίο του χρόνου ή το χρόνο-συχνοτικό πεδίο. Οι συχνοτικές παράμετροι που περιλαμβάνονται σε κάθε σχήμα διαχωρισμού είναι το πλάτος και η φάση του μετασχηματισμού Short Time Fourier Transform. Η παρούσα Διπλωματική Εργασία επικεντρώνεται στο πρόβλημα της ανάκτησης φάσης για τον διαχωρισμό πηγών θεωρώντας ότι το πλάτος είναι γνωστό ή ότι υπάρχει κάποια εκτίμηση γι αυτό, με τεχνικές που στηρίζονται στην ιδιότητα του Consistency του Short Time Fourier Transform. Στο πρώτο κεφάλαιο γίνεται μια παρουσίαση των ηχητικών πηγών και των ιδιοτήτων τους στο πεδίο του χρόνου και το χρόνο-συχνοτικό πεδίο. Στη συνέχεια γίνεται μια εισαγωγή στο πρόβλημα του διαχωρισμού πηγών και στις σημαντικότερες κατηγορίες του. Τέλος γίνεται μια παρουσίαση των μετρικών που αξιολογούν την ποιότητα διαχωρισμού πηγών στις εφαρμογές. Στο δεύτερο κεφάλαιο παρουσιάζεται ένα γενικό σύστημα διαχωρισμού πηγών και αναφέρονται κάποια βασικά στοιχεία των σταδίων που περιλαμβάνει. Αναφέρονται οι βασικότερες τεχνικές για το στάδιο του διαχωρισμού (Wiener Filtering, Binary Masks) και το στάδιο της εκτίμησης παραμέτρων (NMF, DNNs). Στη συνέχεια ορίζεται μαθηματικά το πρόβλημα την ανάκτησης φάσης στο διαχωρισμό πηγών και παρουσιάζονται οι κυριότερες Model-Based τεχνικές (Phase Unwarping, PhaseNet) και Consistency-Based τεχνικές (Griffin-Lim, FGLA, ADMM, MISI). Στο τρίτο κεφάλαιο γίνεται η διατύπωση μιας νέας μεθόδου εναλλασσόμενων προβολών για το πρόβλημα της ανάκτησης φάσης συνδυάζοντας προηγούμενες Consistency-Based τεχνικές. Στη συνέχεια παρουσιάζεται μια παραλλαγή της μεθόδου με την προσθήκη μιας επιπλέον παραμέτρου. Στο τέταρτο κεφάλαιο γίνεται η πειραματική αξιολόγηση των μεθόδων βάσει των μετρικών SDR, SIR, SAR για δύο, τρεις και τέσσερις πηγές σε ιδανικό και ενθόρυβο σενάριο για το σύνολο δεδομένων Music-Delta του MusDB. This thesis addresses the subject of phase retrieval in the context of Blind Audio Source Seperation. The basic temporal and spectral characteristics of audio signals are presented along with an analysis on the concept of spectrogram consistency. A review on the most common source seperation techniques follows, including Non-negative Matrix Factorization and DNN approaches for source seperation and paremeter estimation. For the problem of phase retrieval, consistency based methods (Griffin-Lim Algorithm, Fast Griffin-Lim Algorithm, Alternating Direction Method of Multipliers) and sinusoidal modeling methods (Phase Unwarping, PhaseNet) are presented. A new consistency based method is introduced by combining mechanics of the previous. Finally the FGLA, PU, ADMM, MISI and proposed method are evaluated experimentally on samples from the MusDB database in oracle and noisy case for different amounts of noise using SDR, SAR and SIR metrics. 2021-03-24T09:34:12Z 2021-03-24T09:34:12Z 2021-03-23 http://hdl.handle.net/10889/14708 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Διαχωρισμός πηγών
Φάση μετασχηματισμού
Source seperation
spellingShingle Διαχωρισμός πηγών
Φάση μετασχηματισμού
Source seperation
Ρουφογάλης, Γεώργιος
Ανάκτηση φάσης για διαχωρισμό ηχητικών πηγών
description Το πρόβλημα του διαχωρισμού πηγών είναι η εύρεση σημάτων δεδομένου ενός σήματος που αποτελεί τη μίξη τους. Προσεγγίζεται με επεξεργασία στο πεδίο του χρόνου ή το χρόνο-συχνοτικό πεδίο. Οι συχνοτικές παράμετροι που περιλαμβάνονται σε κάθε σχήμα διαχωρισμού είναι το πλάτος και η φάση του μετασχηματισμού Short Time Fourier Transform. Η παρούσα Διπλωματική Εργασία επικεντρώνεται στο πρόβλημα της ανάκτησης φάσης για τον διαχωρισμό πηγών θεωρώντας ότι το πλάτος είναι γνωστό ή ότι υπάρχει κάποια εκτίμηση γι αυτό, με τεχνικές που στηρίζονται στην ιδιότητα του Consistency του Short Time Fourier Transform. Στο πρώτο κεφάλαιο γίνεται μια παρουσίαση των ηχητικών πηγών και των ιδιοτήτων τους στο πεδίο του χρόνου και το χρόνο-συχνοτικό πεδίο. Στη συνέχεια γίνεται μια εισαγωγή στο πρόβλημα του διαχωρισμού πηγών και στις σημαντικότερες κατηγορίες του. Τέλος γίνεται μια παρουσίαση των μετρικών που αξιολογούν την ποιότητα διαχωρισμού πηγών στις εφαρμογές. Στο δεύτερο κεφάλαιο παρουσιάζεται ένα γενικό σύστημα διαχωρισμού πηγών και αναφέρονται κάποια βασικά στοιχεία των σταδίων που περιλαμβάνει. Αναφέρονται οι βασικότερες τεχνικές για το στάδιο του διαχωρισμού (Wiener Filtering, Binary Masks) και το στάδιο της εκτίμησης παραμέτρων (NMF, DNNs). Στη συνέχεια ορίζεται μαθηματικά το πρόβλημα την ανάκτησης φάσης στο διαχωρισμό πηγών και παρουσιάζονται οι κυριότερες Model-Based τεχνικές (Phase Unwarping, PhaseNet) και Consistency-Based τεχνικές (Griffin-Lim, FGLA, ADMM, MISI). Στο τρίτο κεφάλαιο γίνεται η διατύπωση μιας νέας μεθόδου εναλλασσόμενων προβολών για το πρόβλημα της ανάκτησης φάσης συνδυάζοντας προηγούμενες Consistency-Based τεχνικές. Στη συνέχεια παρουσιάζεται μια παραλλαγή της μεθόδου με την προσθήκη μιας επιπλέον παραμέτρου. Στο τέταρτο κεφάλαιο γίνεται η πειραματική αξιολόγηση των μεθόδων βάσει των μετρικών SDR, SIR, SAR για δύο, τρεις και τέσσερις πηγές σε ιδανικό και ενθόρυβο σενάριο για το σύνολο δεδομένων Music-Delta του MusDB.
author2 Roufogalis, Georgios
author_facet Roufogalis, Georgios
Ρουφογάλης, Γεώργιος
author Ρουφογάλης, Γεώργιος
author_sort Ρουφογάλης, Γεώργιος
title Ανάκτηση φάσης για διαχωρισμό ηχητικών πηγών
title_short Ανάκτηση φάσης για διαχωρισμό ηχητικών πηγών
title_full Ανάκτηση φάσης για διαχωρισμό ηχητικών πηγών
title_fullStr Ανάκτηση φάσης για διαχωρισμό ηχητικών πηγών
title_full_unstemmed Ανάκτηση φάσης για διαχωρισμό ηχητικών πηγών
title_sort ανάκτηση φάσης για διαχωρισμό ηχητικών πηγών
publishDate 2021
url http://hdl.handle.net/10889/14708
work_keys_str_mv AT rouphogalēsgeōrgios anaktēsēphasēsgiadiachōrismoēchētikōnpēgōn
AT rouphogalēsgeōrgios phaseretrievalformusicsourceseperation
_version_ 1771297303415488512