Ανάκτηση φάσης για διαχωρισμό ηχητικών πηγών

Το πρόβλημα του διαχωρισμού πηγών είναι η εύρεση σημάτων δεδομένου ενός σήματος που αποτελεί τη μίξη τους. Προσεγγίζεται με επεξεργασία στο πεδίο του χρόνου ή το χρόνο-συχνοτικό πεδίο. Οι συχνοτικές παράμετροι που περιλαμβάνονται σε κάθε σχήμα διαχωρισμού είναι το πλάτος και η φάση του μετασχηματισμ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Ρουφογάλης, Γεώργιος
Άλλοι συγγραφείς: Roufogalis, Georgios
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14708
Περιγραφή
Περίληψη:Το πρόβλημα του διαχωρισμού πηγών είναι η εύρεση σημάτων δεδομένου ενός σήματος που αποτελεί τη μίξη τους. Προσεγγίζεται με επεξεργασία στο πεδίο του χρόνου ή το χρόνο-συχνοτικό πεδίο. Οι συχνοτικές παράμετροι που περιλαμβάνονται σε κάθε σχήμα διαχωρισμού είναι το πλάτος και η φάση του μετασχηματισμού Short Time Fourier Transform. Η παρούσα Διπλωματική Εργασία επικεντρώνεται στο πρόβλημα της ανάκτησης φάσης για τον διαχωρισμό πηγών θεωρώντας ότι το πλάτος είναι γνωστό ή ότι υπάρχει κάποια εκτίμηση γι αυτό, με τεχνικές που στηρίζονται στην ιδιότητα του Consistency του Short Time Fourier Transform. Στο πρώτο κεφάλαιο γίνεται μια παρουσίαση των ηχητικών πηγών και των ιδιοτήτων τους στο πεδίο του χρόνου και το χρόνο-συχνοτικό πεδίο. Στη συνέχεια γίνεται μια εισαγωγή στο πρόβλημα του διαχωρισμού πηγών και στις σημαντικότερες κατηγορίες του. Τέλος γίνεται μια παρουσίαση των μετρικών που αξιολογούν την ποιότητα διαχωρισμού πηγών στις εφαρμογές. Στο δεύτερο κεφάλαιο παρουσιάζεται ένα γενικό σύστημα διαχωρισμού πηγών και αναφέρονται κάποια βασικά στοιχεία των σταδίων που περιλαμβάνει. Αναφέρονται οι βασικότερες τεχνικές για το στάδιο του διαχωρισμού (Wiener Filtering, Binary Masks) και το στάδιο της εκτίμησης παραμέτρων (NMF, DNNs). Στη συνέχεια ορίζεται μαθηματικά το πρόβλημα την ανάκτησης φάσης στο διαχωρισμό πηγών και παρουσιάζονται οι κυριότερες Model-Based τεχνικές (Phase Unwarping, PhaseNet) και Consistency-Based τεχνικές (Griffin-Lim, FGLA, ADMM, MISI). Στο τρίτο κεφάλαιο γίνεται η διατύπωση μιας νέας μεθόδου εναλλασσόμενων προβολών για το πρόβλημα της ανάκτησης φάσης συνδυάζοντας προηγούμενες Consistency-Based τεχνικές. Στη συνέχεια παρουσιάζεται μια παραλλαγή της μεθόδου με την προσθήκη μιας επιπλέον παραμέτρου. Στο τέταρτο κεφάλαιο γίνεται η πειραματική αξιολόγηση των μεθόδων βάσει των μετρικών SDR, SIR, SAR για δύο, τρεις και τέσσερις πηγές σε ιδανικό και ενθόρυβο σενάριο για το σύνολο δεδομένων Music-Delta του MusDB.