Σώματα κειμένων και εφαρμογές

Τα Σώματα Κειμένων (ΣΚ) αποτελούν έναν από τους κυριότερους γλωσσικούς πόρους για την αυτοματοποιημένη επεξεργασία φυσικού λόγου. Το παρόν κεφάλαιο θα περιέχει βασικές έννοιες για α) την κατάρτιση και β) την αξιοποίηση των ΣΚ. Αρχικά, αφού αναδειχθεί η ποιοτική διαφορά ανάμεσα σε επισημειωμένα και μ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριοι συγγραφείς: Tantos, Alexandros, Τάντος, Αλέξανδρος
Μορφή: 7
Γλώσσα:Greek
Έκδοση: 2016
Θέματα:
Διαθέσιμο Online:http://localhost:8080/jspui/handle/11419/2210
id kallipos-11419-2210
record_format dspace
spelling kallipos-11419-22102021-07-11T12:48:24Z Σώματα κειμένων και εφαρμογές Tantos, Alexandros Τάντος, Αλέξανδρος ΥΠΟΛΟΓΙΣΤΙΚΗ ΓΛΩΣΣΟΛΟΓΙΑ ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΛΓΟΡΙΘΜΟΙ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΣΥΜΒΟΛΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΟΥ ΛΟΓΟΥ ΙΕΡΑΡΧΙΑ ΤΣΟΜΣΚΥ ΚΑΝΟΝΙΚΕΣ ΕΚΦΡΑΣΕΙΣ ΑΥΤΟΜΑΤΑ ΟΝΤΟΛΟΓΙΕΣ ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ Computational Linguistics Language Texhnology Algorithms Programming Symbolic And Statistical Natural Language Processing Chomsky Hierarchy Regular Expressions Automata Ontologies Syntactic Parsing Τα Σώματα Κειμένων (ΣΚ) αποτελούν έναν από τους κυριότερους γλωσσικούς πόρους για την αυτοματοποιημένη επεξεργασία φυσικού λόγου. Το παρόν κεφάλαιο θα περιέχει βασικές έννοιες για α) την κατάρτιση και β) την αξιοποίηση των ΣΚ. Αρχικά, αφού αναδειχθεί η ποιοτική διαφορά ανάμεσα σε επισημειωμένα και μη επισημειωμένα ΣΚ, θα αναλυθούν τα βασικά κριτήρια επιλογής και ταξινόμησης των ΣΚ για στοχευμένη και πιο αποτελεσματική γλωσσολογική ή μη επεξεργασία των κειμενικών δεδομένων. Η κατάρτιση ενός ΣΚ αποτελεί μια δύσκολη υπόθεση και προϋποθέτει την τήρηση διαφόρων βασικών κριτηρίων επιλογής των κειμένων, προκειμένου το γλωσσικό δείγμα που θα συλλεχθεί να είναι αντιπροσωπευτικό της γλωσσικής ποικιλίας που φιλοδοξεί να εκπροσωπεί. Θα παρουσιαστούν τα είδη ΣΚ και οι πρακτικές αξιοποίησής τους μέσα από τη χρήση παραδειγμάτων. Επιπλέον, ο αναγνώστης θα εξοικειωθεί με τη γλώσσα σήμανσης XML που αποτελεί την κυρίαρχη γλώσσα σήμανση για την πλειονότητα των επισημειωμένων ΣΚ σημέρα. Στο τελευταίο μέρος του κεφαλαίου, θα παρουσιαστούν οι βασικές αρχές της θεωρίας πιθανοτήτων που είναι απαραίτητες για μια σειρά εφαρμογών στην υπολογιστική γλωσσολογία. Σε αυτή την κατεύθυνση και ως παράδειγμα για την ανάλυση κατηγορικών μεταβλητών που αφορούν τα γλωσσικά δεδομένα, θα λειτουργήσουν η διατύπωση και ο έλεγχος υποθέσεων. Εκεί, περιγράφεται βήμα προς βήμα η διαδικασία ελέγχου υποθέσεων πάνω σε ΣΚ στη βάση ενός απτού παραδείγματος. Ο ελέγχος υποθέσεων αποτελεί ένα απαραίτητο καθημερινό εργαλείο για την επεξεργασία γλωσσικών δεδομένων για τον υπολογιστικό γλωσσολόγο και όχι μόνο. 2016-02-02T21:16:13Z 2021-07-08T09:14:53Z 2016-02-02T21:16:13Z 2021-07-08T09:14:53Z 2016-02-02 7 http://localhost:8080/jspui/handle/11419/2210 el 1 application/pdf
institution Kallipos
collection DSpace
language Greek
topic ΥΠΟΛΟΓΙΣΤΙΚΗ ΓΛΩΣΣΟΛΟΓΙΑ
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ
ΑΛΓΟΡΙΘΜΟΙ
ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ
ΣΥΜΒΟΛΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΟΥ ΛΟΓΟΥ
ΙΕΡΑΡΧΙΑ ΤΣΟΜΣΚΥ
ΚΑΝΟΝΙΚΕΣ ΕΚΦΡΑΣΕΙΣ
ΑΥΤΟΜΑΤΑ
ΟΝΤΟΛΟΓΙΕΣ
ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ
Computational Linguistics
Language Texhnology
Algorithms
Programming
Symbolic And Statistical Natural Language Processing
Chomsky Hierarchy
Regular Expressions
Automata
Ontologies
Syntactic Parsing
spellingShingle ΥΠΟΛΟΓΙΣΤΙΚΗ ΓΛΩΣΣΟΛΟΓΙΑ
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ
ΑΛΓΟΡΙΘΜΟΙ
ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ
ΣΥΜΒΟΛΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΟΥ ΛΟΓΟΥ
ΙΕΡΑΡΧΙΑ ΤΣΟΜΣΚΥ
ΚΑΝΟΝΙΚΕΣ ΕΚΦΡΑΣΕΙΣ
ΑΥΤΟΜΑΤΑ
ΟΝΤΟΛΟΓΙΕΣ
ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ
Computational Linguistics
Language Texhnology
Algorithms
Programming
Symbolic And Statistical Natural Language Processing
Chomsky Hierarchy
Regular Expressions
Automata
Ontologies
Syntactic Parsing
Tantos, Alexandros
Τάντος, Αλέξανδρος
Σώματα κειμένων και εφαρμογές
description Τα Σώματα Κειμένων (ΣΚ) αποτελούν έναν από τους κυριότερους γλωσσικούς πόρους για την αυτοματοποιημένη επεξεργασία φυσικού λόγου. Το παρόν κεφάλαιο θα περιέχει βασικές έννοιες για α) την κατάρτιση και β) την αξιοποίηση των ΣΚ. Αρχικά, αφού αναδειχθεί η ποιοτική διαφορά ανάμεσα σε επισημειωμένα και μη επισημειωμένα ΣΚ, θα αναλυθούν τα βασικά κριτήρια επιλογής και ταξινόμησης των ΣΚ για στοχευμένη και πιο αποτελεσματική γλωσσολογική ή μη επεξεργασία των κειμενικών δεδομένων. Η κατάρτιση ενός ΣΚ αποτελεί μια δύσκολη υπόθεση και προϋποθέτει την τήρηση διαφόρων βασικών κριτηρίων επιλογής των κειμένων, προκειμένου το γλωσσικό δείγμα που θα συλλεχθεί να είναι αντιπροσωπευτικό της γλωσσικής ποικιλίας που φιλοδοξεί να εκπροσωπεί. Θα παρουσιαστούν τα είδη ΣΚ και οι πρακτικές αξιοποίησής τους μέσα από τη χρήση παραδειγμάτων. Επιπλέον, ο αναγνώστης θα εξοικειωθεί με τη γλώσσα σήμανσης XML που αποτελεί την κυρίαρχη γλώσσα σήμανση για την πλειονότητα των επισημειωμένων ΣΚ σημέρα. Στο τελευταίο μέρος του κεφαλαίου, θα παρουσιαστούν οι βασικές αρχές της θεωρίας πιθανοτήτων που είναι απαραίτητες για μια σειρά εφαρμογών στην υπολογιστική γλωσσολογία. Σε αυτή την κατεύθυνση και ως παράδειγμα για την ανάλυση κατηγορικών μεταβλητών που αφορούν τα γλωσσικά δεδομένα, θα λειτουργήσουν η διατύπωση και ο έλεγχος υποθέσεων. Εκεί, περιγράφεται βήμα προς βήμα η διαδικασία ελέγχου υποθέσεων πάνω σε ΣΚ στη βάση ενός απτού παραδείγματος. Ο ελέγχος υποθέσεων αποτελεί ένα απαραίτητο καθημερινό εργαλείο για την επεξεργασία γλωσσικών δεδομένων για τον υπολογιστικό γλωσσολόγο και όχι μόνο.
format 7
author Tantos, Alexandros
Τάντος, Αλέξανδρος
author_facet Tantos, Alexandros
Τάντος, Αλέξανδρος
author_sort Tantos, Alexandros
title Σώματα κειμένων και εφαρμογές
title_short Σώματα κειμένων και εφαρμογές
title_full Σώματα κειμένων και εφαρμογές
title_fullStr Σώματα κειμένων και εφαρμογές
title_full_unstemmed Σώματα κειμένων και εφαρμογές
title_sort σώματα κειμένων και εφαρμογές
publishDate 2016
url http://localhost:8080/jspui/handle/11419/2210
work_keys_str_mv AT tantosalexandros sōmatakeimenōnkaiepharmoges
AT tantosalexandros sōmatakeimenōnkaiepharmoges
_version_ 1771301318905823232