Επεξεργασία και ανάλυση ήχου, ομιλίας και μουσικής
Το παρόν σύγγραμμα είναι χωρισμένο σε τέσσερις βασικές ενότητες. Στην πρώτη ενότητα με τίτλο «Ήχος» γίνεται μια εισαγωγή στα ηχητικά σήματα και στον ψηφιακό ήχο. Παρουσιάζονται οι κύριες λειτουργίες του ανθρώπινου ακουστικού συστήματος και οι βασικές έννοιες της ψυχοακουστικής και της χωρικής ακουστ...
Κύριοι συγγραφείς: | , , , , , , , , , |
---|---|
Μορφή: | 1 |
Γλώσσα: | Greek |
Έκδοση: |
2023
|
Θέματα: | |
Διαθέσιμο Online: | http://dx.doi.org/10.57713/kallipos-347 http://repository.kallipos.gr/handle/11419/10814 |
id |
kallipos-11419-10814 |
---|---|
record_format |
dspace |
institution |
Kallipos |
collection |
DSpace |
language |
Greek |
topic |
Ακουστική Επεξεργασία Ακουστικού Σήματος Χρονοσυχνοτική Ανάλυση Επεξεργασία Ομιλίας Σύνθεση ομιλίας Ακουστικοί Περιγραφείς Ακουστική Χώρων Ακουστικές Παράμετροι Χώρου Ψηφιακός Ήχος Κωδικοποίηση Ήχου Ψυχοακουστική Χωρική ακουστική Αμφιωτικός ήχος Χρόνος Αντήχησης Ταξινομητές Ισοσταθμιστής Ψηφιακά ηχητικά εφέ Συμπίεση ήχου Αναγνώριση Ομιλίας Κρυμμένο Μοντέλο Markov Μουσική Πληροφορία Ανάλυση Μουσικού Περιεχομένου Ανάκτηση Μουσικού Περιεχομένου Acoustics Audio Signal Processing Time Frequency Analysis Speech Processing Speech Synthesis Audio Features Room Acoustics Room Acoustic Descriptors Digital Sound Sound Coding Psychoacoustics Spatial Acoustics Binaural Sound Reverberation Time Classifiers Sound Equalizers Digital Sound Effects Sound Compression Speech Recognition Hidden Markov Model Music Information Music Information Analysis Music Information Retrieval |
spellingShingle |
Ακουστική Επεξεργασία Ακουστικού Σήματος Χρονοσυχνοτική Ανάλυση Επεξεργασία Ομιλίας Σύνθεση ομιλίας Ακουστικοί Περιγραφείς Ακουστική Χώρων Ακουστικές Παράμετροι Χώρου Ψηφιακός Ήχος Κωδικοποίηση Ήχου Ψυχοακουστική Χωρική ακουστική Αμφιωτικός ήχος Χρόνος Αντήχησης Ταξινομητές Ισοσταθμιστής Ψηφιακά ηχητικά εφέ Συμπίεση ήχου Αναγνώριση Ομιλίας Κρυμμένο Μοντέλο Markov Μουσική Πληροφορία Ανάλυση Μουσικού Περιεχομένου Ανάκτηση Μουσικού Περιεχομένου Acoustics Audio Signal Processing Time Frequency Analysis Speech Processing Speech Synthesis Audio Features Room Acoustics Room Acoustic Descriptors Digital Sound Sound Coding Psychoacoustics Spatial Acoustics Binaural Sound Reverberation Time Classifiers Sound Equalizers Digital Sound Effects Sound Compression Speech Recognition Hidden Markov Model Music Information Music Information Analysis Music Information Retrieval Κούτρας, Αθανασιος Αλεξανδράκη, Χρυσούλα Ζαρούχας, Θωμάς Ζέρβας, Παναγιώτης Χατζηαντωνίου, Παναγιώτης Koutras, Athanasios Alexandraki, Chrisoula Zarouchas, Thomas Zervas, Panagiotis Chatziantoniou, Panagiotis Επεξεργασία και ανάλυση ήχου, ομιλίας και μουσικής |
description |
Το παρόν σύγγραμμα είναι χωρισμένο σε τέσσερις βασικές ενότητες. Στην πρώτη ενότητα με τίτλο «Ήχος» γίνεται μια εισαγωγή στα ηχητικά σήματα και στον ψηφιακό ήχο. Παρουσιάζονται οι κύριες λειτουργίες του ανθρώπινου ακουστικού συστήματος και οι βασικές έννοιες της ψυχοακουστικής και της χωρικής ακουστικής. Περιγράφεται η συμπεριφορά του ήχου σε ανοιχτούς και κλειστούς χώρους, μαζί με βασικές έννοιες από τη θεωρία σημάτων και συστημάτων για την ανάλυση και περιγραφή της ακουστικής κλειστών χώρων. Επιπλέον, παρουσιάζονται οι σημαντικότεροι περιγραφείς που χρησιμοποιούνται στην ανάλυση, επεξεργασία αλλά και αναγνώριση ηχητικών σημάτων. Τέλος, παρουσιάζονται ορισμένες από τις κυριότερες εφαρμογές της Ψηφιακής Τεχνολογίας Ήχου και Ακουστικής. Στη δεύτερη ενότητα με τίτλο «Ομιλία» παρουσιάζονται οι βασικές έννοιες και θεωρίες της ψηφιακής επεξεργασίας σημάτων ομιλίας, με σκοπό τον σχεδιασμό και την υλοποίηση βασικών ταξινομητών για την επίλυση προβλημάτων αναγνώρισης ομιλίας, ομιλητή κ.ά. Παράλληλα, παρουσιάζονται τα βασικά στάδια μετατροπής του κειμένου σε ομιλία, με αναλυτική επισκόπηση των τεχνολογιών και αλγορίθμων που έχουν προταθεί και χρησιμοποιούνται από τους ερευνητές και όχι μόνο για τον σκοπό αυτό. Στην τρίτη ενότητα με τίτλο «Μουσική» γίνεται μια εισαγωγή στο μουσικό σήμα και στη μουσική πληροφορία, με ιδιαίτερη μνεία στις ιδιαιτερότητες του μουσικού σήματος σε σύγκριση με αυτό της ομιλίας. Παρουσιάζονται η μορφή της μουσικής πληροφορίας καθώς και οι τεχνικές κωδικοποίησης του μουσικού σήματος. Γίνεται παρουσίαση ενός σχετικά νέου ερευνητικού πεδίου, αυτού της Ανάκτησης Μουσικής Πληροφορίας (ΑΜΠ) και των κυριότερων εφαρμογών του. Τέλος, εξετάζονται ενδεικτικά αλγοριθμικά προβλήματα της περιοχής της ΑΜΠ, και πιο συγκεκριμένα εκείνα τα οποία αποτελούν προϋπόθεση για την υλοποίηση πλήθους εφαρμογών της. Στο τέταρτο και τελευταίο μέρος του συγγράμματος με τίτλο «Εργαστηριακές Ασκήσεις» παρουσιάζονται έντεκα ενδεικτικές εργαστηριακές ασκήσεις οι οποίες δίνουν την ευκαιρία στον αναγνώστη να δοκιμάσει και να εφαρμόσει στην πράξη όσα αναφέρονται στα προηγούμενα κεφάλαια. |
format |
1 |
author |
Κούτρας, Αθανασιος Αλεξανδράκη, Χρυσούλα Ζαρούχας, Θωμάς Ζέρβας, Παναγιώτης Χατζηαντωνίου, Παναγιώτης Koutras, Athanasios Alexandraki, Chrisoula Zarouchas, Thomas Zervas, Panagiotis Chatziantoniou, Panagiotis |
author_facet |
Κούτρας, Αθανασιος Αλεξανδράκη, Χρυσούλα Ζαρούχας, Θωμάς Ζέρβας, Παναγιώτης Χατζηαντωνίου, Παναγιώτης Koutras, Athanasios Alexandraki, Chrisoula Zarouchas, Thomas Zervas, Panagiotis Chatziantoniou, Panagiotis |
author_sort |
Κούτρας, Αθανασιος |
title |
Επεξεργασία και ανάλυση ήχου, ομιλίας και μουσικής |
title_short |
Επεξεργασία και ανάλυση ήχου, ομιλίας και μουσικής |
title_full |
Επεξεργασία και ανάλυση ήχου, ομιλίας και μουσικής |
title_fullStr |
Επεξεργασία και ανάλυση ήχου, ομιλίας και μουσικής |
title_full_unstemmed |
Επεξεργασία και ανάλυση ήχου, ομιλίας και μουσικής |
title_sort |
επεξεργασία και ανάλυση ήχου, ομιλίας και μουσικής |
publishDate |
2023 |
url |
http://dx.doi.org/10.57713/kallipos-347 http://repository.kallipos.gr/handle/11419/10814 |
work_keys_str_mv |
AT koutrasathanasios epexergasiakaianalysēēchouomiliaskaimousikēs AT alexandrakēchrysoula epexergasiakaianalysēēchouomiliaskaimousikēs AT zarouchasthōmas epexergasiakaianalysēēchouomiliaskaimousikēs AT zerbaspanagiōtēs epexergasiakaianalysēēchouomiliaskaimousikēs AT chatzēantōnioupanagiōtēs epexergasiakaianalysēēchouomiliaskaimousikēs AT koutrasathanasios epexergasiakaianalysēēchouomiliaskaimousikēs AT alexandrakichrisoula epexergasiakaianalysēēchouomiliaskaimousikēs AT zarouchasthomas epexergasiakaianalysēēchouomiliaskaimousikēs AT zervaspanagiotis epexergasiakaianalysēēchouomiliaskaimousikēs AT chatziantonioupanagiotis epexergasiakaianalysēēchouomiliaskaimousikēs AT koutrasathanasios audiospeechandmusicprocessingandanalysis AT alexandrakēchrysoula audiospeechandmusicprocessingandanalysis AT zarouchasthōmas audiospeechandmusicprocessingandanalysis AT zerbaspanagiōtēs audiospeechandmusicprocessingandanalysis AT chatzēantōnioupanagiōtēs audiospeechandmusicprocessingandanalysis AT koutrasathanasios audiospeechandmusicprocessingandanalysis AT alexandrakichrisoula audiospeechandmusicprocessingandanalysis AT zarouchasthomas audiospeechandmusicprocessingandanalysis AT zervaspanagiotis audiospeechandmusicprocessingandanalysis AT chatziantonioupanagiotis audiospeechandmusicprocessingandanalysis |
_version_ |
1799946642859753472 |
spelling |
kallipos-11419-108142024-01-14T11:02:25Z Επεξεργασία και ανάλυση ήχου, ομιλίας και μουσικής Audio, speech and music processing and analysis Κούτρας, Αθανασιος Αλεξανδράκη, Χρυσούλα Ζαρούχας, Θωμάς Ζέρβας, Παναγιώτης Χατζηαντωνίου, Παναγιώτης Koutras, Athanasios Alexandraki, Chrisoula Zarouchas, Thomas Zervas, Panagiotis Chatziantoniou, Panagiotis Ακουστική Επεξεργασία Ακουστικού Σήματος Χρονοσυχνοτική Ανάλυση Επεξεργασία Ομιλίας Σύνθεση ομιλίας Ακουστικοί Περιγραφείς Ακουστική Χώρων Ακουστικές Παράμετροι Χώρου Ψηφιακός Ήχος Κωδικοποίηση Ήχου Ψυχοακουστική Χωρική ακουστική Αμφιωτικός ήχος Χρόνος Αντήχησης Ταξινομητές Ισοσταθμιστής Ψηφιακά ηχητικά εφέ Συμπίεση ήχου Αναγνώριση Ομιλίας Κρυμμένο Μοντέλο Markov Μουσική Πληροφορία Ανάλυση Μουσικού Περιεχομένου Ανάκτηση Μουσικού Περιεχομένου Acoustics Audio Signal Processing Time Frequency Analysis Speech Processing Speech Synthesis Audio Features Room Acoustics Room Acoustic Descriptors Digital Sound Sound Coding Psychoacoustics Spatial Acoustics Binaural Sound Reverberation Time Classifiers Sound Equalizers Digital Sound Effects Sound Compression Speech Recognition Hidden Markov Model Music Information Music Information Analysis Music Information Retrieval Το παρόν σύγγραμμα είναι χωρισμένο σε τέσσερις βασικές ενότητες. Στην πρώτη ενότητα με τίτλο «Ήχος» γίνεται μια εισαγωγή στα ηχητικά σήματα και στον ψηφιακό ήχο. Παρουσιάζονται οι κύριες λειτουργίες του ανθρώπινου ακουστικού συστήματος και οι βασικές έννοιες της ψυχοακουστικής και της χωρικής ακουστικής. Περιγράφεται η συμπεριφορά του ήχου σε ανοιχτούς και κλειστούς χώρους, μαζί με βασικές έννοιες από τη θεωρία σημάτων και συστημάτων για την ανάλυση και περιγραφή της ακουστικής κλειστών χώρων. Επιπλέον, παρουσιάζονται οι σημαντικότεροι περιγραφείς που χρησιμοποιούνται στην ανάλυση, επεξεργασία αλλά και αναγνώριση ηχητικών σημάτων. Τέλος, παρουσιάζονται ορισμένες από τις κυριότερες εφαρμογές της Ψηφιακής Τεχνολογίας Ήχου και Ακουστικής. Στη δεύτερη ενότητα με τίτλο «Ομιλία» παρουσιάζονται οι βασικές έννοιες και θεωρίες της ψηφιακής επεξεργασίας σημάτων ομιλίας, με σκοπό τον σχεδιασμό και την υλοποίηση βασικών ταξινομητών για την επίλυση προβλημάτων αναγνώρισης ομιλίας, ομιλητή κ.ά. Παράλληλα, παρουσιάζονται τα βασικά στάδια μετατροπής του κειμένου σε ομιλία, με αναλυτική επισκόπηση των τεχνολογιών και αλγορίθμων που έχουν προταθεί και χρησιμοποιούνται από τους ερευνητές και όχι μόνο για τον σκοπό αυτό. Στην τρίτη ενότητα με τίτλο «Μουσική» γίνεται μια εισαγωγή στο μουσικό σήμα και στη μουσική πληροφορία, με ιδιαίτερη μνεία στις ιδιαιτερότητες του μουσικού σήματος σε σύγκριση με αυτό της ομιλίας. Παρουσιάζονται η μορφή της μουσικής πληροφορίας καθώς και οι τεχνικές κωδικοποίησης του μουσικού σήματος. Γίνεται παρουσίαση ενός σχετικά νέου ερευνητικού πεδίου, αυτού της Ανάκτησης Μουσικής Πληροφορίας (ΑΜΠ) και των κυριότερων εφαρμογών του. Τέλος, εξετάζονται ενδεικτικά αλγοριθμικά προβλήματα της περιοχής της ΑΜΠ, και πιο συγκεκριμένα εκείνα τα οποία αποτελούν προϋπόθεση για την υλοποίηση πλήθους εφαρμογών της. Στο τέταρτο και τελευταίο μέρος του συγγράμματος με τίτλο «Εργαστηριακές Ασκήσεις» παρουσιάζονται έντεκα ενδεικτικές εργαστηριακές ασκήσεις οι οποίες δίνουν την ευκαιρία στον αναγνώστη να δοκιμάσει και να εφαρμόσει στην πράξη όσα αναφέρονται στα προηγούμενα κεφάλαια. This textbook is divided into four main sections. The first section, titled “Audio” provides an introduction to audio signals and digital sound. It presents the main functions of the human auditory system and the fundamental concepts of psychoacoustics and spatial acoustics. The behavior of sound in open and closed spaces is described, along with basic concepts from the theory of signals and systems for the analysis and description of room acoustics. Additionally, it presents the most significant descriptors used in the analysis, processing, and recognition of audio signals. Furthermore, it discusses some major applications of Digital Sound and Acoustics Technology. In the second section, titled “Speech” the basic concepts and theories of digital speech processing are presented. Its aim is to design and implement basic classifiers for speech recognition, speaker identification, and other applications. Moreover, it provides an overview of the basic stages of text-to-speech conversion, along with an analysis of the technologies and algorithms that are proposed in the literature. The third section, titled “Music”, provides an introduction to musical signals and music information. It covers the structure of music information and the techniques for encoding musical signals. Furthermore, it introduces a relatively new research area known as Music Information Retrieval (MIR) and explores its main applications. Lastly, it presents a variety of algorithmic problems in the field of MIR. In the fourth and final part of the textbook, titled “Lab Exercises”, eleven indicative lab exercises/projects are presented. These exercises offer readers the opportunity to test and apply the concepts that were discussed in all previous chapters. 2023-10-05T09:03:47Z 2024-01-05T10:01:37Z 2024-01-14T11:02:02Z 2023-10-05T09:03:47Z 2024-01-05T10:01:37Z 2024-01-14T11:02:02Z 1 978-618-228-115-4 http://dx.doi.org/10.57713/kallipos-347 http://repository.kallipos.gr/handle/11419/10814 el 1 304 application/pdf application/pdf application/pdf |