Μέθοδοι επεξεργασίας ηχητικών σημάτων για καταστολή παρεμβολών σε διατάξεις πολλαπλών μικροφώνων

H παρούσα διατριβή εξετάζει το πρόβλημα της διαρροής μικροφώνου, δηλαδή την αλληλεπίδραση και παρεμβολή μεταξύ ταυτόχρονα ενεργών ηχητικών πηγών σε πολυκαναλικές ηχητικές διατάξεις. Παρ' όλο που είναι ένα πολύ συχνό φαινόμενο με το οποίο οι μηχανικοί ήχου έρχονται αντιμέτωποι καθημερινά, δεν...

Full description

Bibliographic Details
Main Author: Κοκκίνης, Ηλίας
Other Authors: Μουρτζόπουλος, Ιωάννης
Format: Thesis
Language:Greek
Published: 2012
Subjects:
Online Access:http://hdl.handle.net/10889/5544
id nemertes-10889-5544
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Διαρροή μικροφώνου
Καταστολή θορύβου
Τεχνική κοντινού μικροφώνου
Πυκνότητα πρώιμων ανακλάσεων
Ανίχνευση σόλο
Εκτίμηση φασματικής ενέργειας
Microphone leakage
Noise suppression
Close-microphone technique
Early reflection density
Solo detection
Power spectral density estimation
621.382 24
spellingShingle Διαρροή μικροφώνου
Καταστολή θορύβου
Τεχνική κοντινού μικροφώνου
Πυκνότητα πρώιμων ανακλάσεων
Ανίχνευση σόλο
Εκτίμηση φασματικής ενέργειας
Microphone leakage
Noise suppression
Close-microphone technique
Early reflection density
Solo detection
Power spectral density estimation
621.382 24
Κοκκίνης, Ηλίας
Μέθοδοι επεξεργασίας ηχητικών σημάτων για καταστολή παρεμβολών σε διατάξεις πολλαπλών μικροφώνων
description H παρούσα διατριβή εξετάζει το πρόβλημα της διαρροής μικροφώνου, δηλαδή την αλληλεπίδραση και παρεμβολή μεταξύ ταυτόχρονα ενεργών ηχητικών πηγών σε πολυκαναλικές ηχητικές διατάξεις. Παρ' όλο που είναι ένα πολύ συχνό φαινόμενο με το οποίο οι μηχανικοί ήχου έρχονται αντιμέτωποι καθημερινά, δεν έχουν προταθεί μέθοδοι επεξεργασίας σήματος για την επίλυση του προβλήματος. Εδώ, το πρόβλημα διατυπώνεται για πρώτη φορά στο πλαίσιο της επεξεργασίας σήματος. Αρχικά, διατυπώνεται στο πλαίσιο του τυφλού διαχωρισμού πηγών (blind source separation) και αναλύονται οι περιορισμοί αυτής της προσέγγισης. Στην συνέχεια, το πρόβλημα επαναδιατυπώνεται σαν πρόβλημα σήματος υπό θόρυβο στα πλαίσια της καταστολής θορύβου. Ένα πρωτότυπο γενικευμένο πλαίσιο καταστολής διαρροής μικροφώνου εξάγεται βασιζόμενο σε ένα φίλτρο Wiener με πολυκαναλικό όρο θορύβο, καθώς και την ευρέως χρησιμοποιούμενη τεχνική «κοντινού μικροφώνου». Το ακουστικό σύστημα που μοντελοποιεί την διαδικασία μίξης και αλληλεπίδρασης των πηγών αναλύεται και γίνεται διαχωρισμός των σχετικών κρουστικών αποκρίσεων χώρου (room impulse responses) σε απ' ευθείας ακουστικά μονοπάτια και ακουστικά μονοπάτια διαρροής. Οι ιδιότητες του απ' ευθείας ακουστικού μονο- πατιού, δηλαδή της απόκρισης «κοντινού μικροφώνου» αναλύονται για πρώτη φορά από την προσέγγιση της επεξεργασίας σήματος και της ακουστικής κλειστών χώρων για πρώτη φορά. Οι ιδιότητες του ακουστικού μονοπατιού διαρροής αναλύονται επίσης για πρώτη φορά με την χρήση ακουστικών παραμέτρων. Έχοντας καθορίσει τις βασικές ιδιότητες του ακουστικού συστήματος, μια μέθοδος για την καταστολή διαρροής μικροφώνου αναπτύσσεται για μια διάταξη δύο καναλιών, βασισμένη σε ένα φίλτρο Wiener και μια άμεση εκτίμηση των σχετικών πυκνοτήτων φασματικής ενέργεiας (power spectral density). Η απόδοση της μεθόδου για ηχογραφήσεις σε πραγματικούς χώρους είναι πολύ ικανοποιητική και με βάση αυτά τα αποτελέσματα, η μέθοδος επεκτείνεται για περισσότερες από δύο πηγές και μικρόφωνα σε αυθαίρετες διατάξεις. Η ολοκληρωμένη μέθοδος είναι τυφλή και αυτόματη, καθώς δεν απαιτεί την επέμβαση του χρήση. Δεν κάνει χρήση πρότερης γνώσης ούτε απαιτεί εκπαίδευση και είναι υπολογιστικά απλή. Προτείνεται επίσης μια πρωτότυπη μέθοδος ανίχνευσης χρονικών διαστημάτων όπου μόνο μια πηγή είναι ενεργή (χρονικά διαστήματα «σόλο»), η οποία επιτρέπει την εκτίμηση συντελεστών στάθμισης οι οποίοι αντιστοιχούν στην σχετική μείωση της ηχητικής στάθμης που υφίσταται κάθε ηχητική πηγή καθώς το σήμα διαδίδεται προς τα μικρόφωνα. Αυτή η μέθοδος σε συνδυασμό με μια νεά, πρωτότυπη τεχνική εκτίμησης των πυκνοτήτων φασματικής ενέργεαις, η οποία βασίζεται στην αναγνώριση των κυρίαρχων διακριτών συχνοτήτων, επιτρέπει την εκτίμηση όλων των σχετικών ποσοτήτων σε μια πολυκαναλική ηχητική διάταξη. Από αυτές υπολογίζεται ένα πολυκαναλικό φίλτρο Wiener για κάθε σήμα μικροφώνου, το οποίο δίνει την εκτίμηση του αντίστοιχου σήματος πηγής.
author2 Μουρτζόπουλος, Ιωάννης
author_facet Μουρτζόπουλος, Ιωάννης
Κοκκίνης, Ηλίας
format Thesis
author Κοκκίνης, Ηλίας
author_sort Κοκκίνης, Ηλίας
title Μέθοδοι επεξεργασίας ηχητικών σημάτων για καταστολή παρεμβολών σε διατάξεις πολλαπλών μικροφώνων
title_short Μέθοδοι επεξεργασίας ηχητικών σημάτων για καταστολή παρεμβολών σε διατάξεις πολλαπλών μικροφώνων
title_full Μέθοδοι επεξεργασίας ηχητικών σημάτων για καταστολή παρεμβολών σε διατάξεις πολλαπλών μικροφώνων
title_fullStr Μέθοδοι επεξεργασίας ηχητικών σημάτων για καταστολή παρεμβολών σε διατάξεις πολλαπλών μικροφώνων
title_full_unstemmed Μέθοδοι επεξεργασίας ηχητικών σημάτων για καταστολή παρεμβολών σε διατάξεις πολλαπλών μικροφώνων
title_sort μέθοδοι επεξεργασίας ηχητικών σημάτων για καταστολή παρεμβολών σε διατάξεις πολλαπλών μικροφώνων
publishDate 2012
url http://hdl.handle.net/10889/5544
work_keys_str_mv AT kokkinēsēlias methodoiepexergasiasēchētikōnsēmatōngiakatastolēparembolōnsediataxeispollaplōnmikrophōnōn
AT kokkinēsēlias blindsignalprocessingmethodsformicrophoneleakagesuppressioninmultichannelaudioapplications
_version_ 1771297221818449920
spelling nemertes-10889-55442022-09-05T14:07:58Z Μέθοδοι επεξεργασίας ηχητικών σημάτων για καταστολή παρεμβολών σε διατάξεις πολλαπλών μικροφώνων Blind signal processing methods for microphone leakage suppression in multichannel audio applications Κοκκίνης, Ηλίας Μουρτζόπουλος, Ιωάννης Μουστακίδης, Γεώργιος Δερματάς, Ευάγγελος Φακωτάκης, Νικόλαος Μπερμπερίδης, Κωνσταντίνος Σκαρλάτος, Δημήτριος Φλώρος, Ανδρέας Kokkinis, Elias Διαρροή μικροφώνου Καταστολή θορύβου Τεχνική κοντινού μικροφώνου Πυκνότητα πρώιμων ανακλάσεων Ανίχνευση σόλο Εκτίμηση φασματικής ενέργειας Microphone leakage Noise suppression Close-microphone technique Early reflection density Solo detection Power spectral density estimation 621.382 24 H παρούσα διατριβή εξετάζει το πρόβλημα της διαρροής μικροφώνου, δηλαδή την αλληλεπίδραση και παρεμβολή μεταξύ ταυτόχρονα ενεργών ηχητικών πηγών σε πολυκαναλικές ηχητικές διατάξεις. Παρ' όλο που είναι ένα πολύ συχνό φαινόμενο με το οποίο οι μηχανικοί ήχου έρχονται αντιμέτωποι καθημερινά, δεν έχουν προταθεί μέθοδοι επεξεργασίας σήματος για την επίλυση του προβλήματος. Εδώ, το πρόβλημα διατυπώνεται για πρώτη φορά στο πλαίσιο της επεξεργασίας σήματος. Αρχικά, διατυπώνεται στο πλαίσιο του τυφλού διαχωρισμού πηγών (blind source separation) και αναλύονται οι περιορισμοί αυτής της προσέγγισης. Στην συνέχεια, το πρόβλημα επαναδιατυπώνεται σαν πρόβλημα σήματος υπό θόρυβο στα πλαίσια της καταστολής θορύβου. Ένα πρωτότυπο γενικευμένο πλαίσιο καταστολής διαρροής μικροφώνου εξάγεται βασιζόμενο σε ένα φίλτρο Wiener με πολυκαναλικό όρο θορύβο, καθώς και την ευρέως χρησιμοποιούμενη τεχνική «κοντινού μικροφώνου». Το ακουστικό σύστημα που μοντελοποιεί την διαδικασία μίξης και αλληλεπίδρασης των πηγών αναλύεται και γίνεται διαχωρισμός των σχετικών κρουστικών αποκρίσεων χώρου (room impulse responses) σε απ' ευθείας ακουστικά μονοπάτια και ακουστικά μονοπάτια διαρροής. Οι ιδιότητες του απ' ευθείας ακουστικού μονο- πατιού, δηλαδή της απόκρισης «κοντινού μικροφώνου» αναλύονται για πρώτη φορά από την προσέγγιση της επεξεργασίας σήματος και της ακουστικής κλειστών χώρων για πρώτη φορά. Οι ιδιότητες του ακουστικού μονοπατιού διαρροής αναλύονται επίσης για πρώτη φορά με την χρήση ακουστικών παραμέτρων. Έχοντας καθορίσει τις βασικές ιδιότητες του ακουστικού συστήματος, μια μέθοδος για την καταστολή διαρροής μικροφώνου αναπτύσσεται για μια διάταξη δύο καναλιών, βασισμένη σε ένα φίλτρο Wiener και μια άμεση εκτίμηση των σχετικών πυκνοτήτων φασματικής ενέργεiας (power spectral density). Η απόδοση της μεθόδου για ηχογραφήσεις σε πραγματικούς χώρους είναι πολύ ικανοποιητική και με βάση αυτά τα αποτελέσματα, η μέθοδος επεκτείνεται για περισσότερες από δύο πηγές και μικρόφωνα σε αυθαίρετες διατάξεις. Η ολοκληρωμένη μέθοδος είναι τυφλή και αυτόματη, καθώς δεν απαιτεί την επέμβαση του χρήση. Δεν κάνει χρήση πρότερης γνώσης ούτε απαιτεί εκπαίδευση και είναι υπολογιστικά απλή. Προτείνεται επίσης μια πρωτότυπη μέθοδος ανίχνευσης χρονικών διαστημάτων όπου μόνο μια πηγή είναι ενεργή (χρονικά διαστήματα «σόλο»), η οποία επιτρέπει την εκτίμηση συντελεστών στάθμισης οι οποίοι αντιστοιχούν στην σχετική μείωση της ηχητικής στάθμης που υφίσταται κάθε ηχητική πηγή καθώς το σήμα διαδίδεται προς τα μικρόφωνα. Αυτή η μέθοδος σε συνδυασμό με μια νεά, πρωτότυπη τεχνική εκτίμησης των πυκνοτήτων φασματικής ενέργεαις, η οποία βασίζεται στην αναγνώριση των κυρίαρχων διακριτών συχνοτήτων, επιτρέπει την εκτίμηση όλων των σχετικών ποσοτήτων σε μια πολυκαναλική ηχητική διάταξη. Από αυτές υπολογίζεται ένα πολυκαναλικό φίλτρο Wiener για κάθε σήμα μικροφώνου, το οποίο δίνει την εκτίμηση του αντίστοιχου σήματος πηγής. This thesis examines the problem of microphone leakage, that is the interference between simultaneously active sound sources in multichannel audio applications. Despite being a common problem with which sound engineers are confronted every day, almost no signal processing methods have been proposed to address this issue. In this work, the problem is formulated for the first time in a signal processing framework. First, it formulated inside the blind source separation (BSS) context and the limitations of related methods are analysed and reported. Since, BSS methods seem to be inappropriate for this specific problem, it is reformulated as a signal in noise problem inside the well-known noise suppression framework. Based on the widely adopted close-microphone technique a novel, generalized framework for leakage suppression is derived based on a multichannel Wiener filter. The acoustic system that models the mixing process is analysed and the related room impulse responses are discerned in direct and leakage acoustic paths. The properties of the direct acoustic path, that is the close-microphone response are investigated for the first time, from a signal processing point of view as well as a room acoustics perspective. The properties of the leakage acoustic path are also analysed for the first time using room acoustic parameters. After key properties of the acoustic paths have been identified, a method for the suppression of microphone leakage in a two channel audio setup is developed based on aWiener filter and a crude approximation of the related power spectral densities (PSDs). The performance of this method for actual recordings in real reverberant environments is more than adequate and based on these results, the method is extended for more than two sources and microphones in arbitrary arrangements. The complete method is blind and automatic, since it does not require any user input. It does not assume any prior knowledge or require training and is computationally efficient. A novel solo detection method has been developed that allows the estimation of weighting coefficients that correspond to the relative attenuation experienced by sound sources as they travel to each microphone. Combined with a new and advanced PSD estimation method based on the identification of dominant frequency bins, the related PSDs in a multichannel audio application can be identified. From these an appropriate multichannel Wiener filter for each microphone signal can be calculated, which will provide the estimated source signal at its output. 2012-10-01T06:25:52Z 2012-10-01T06:25:52Z 2012-06-27 2012-10-01 Thesis http://hdl.handle.net/10889/5544 gr Η ΒΚΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου της. 0 application/pdf