Σώματα κειμένων και εφαρμογές
Τα Σώματα Κειμένων (ΣΚ) αποτελούν έναν από τους κυριότερους γλωσσικούς πόρους για την αυτοματοποιημένη επεξεργασία φυσικού λόγου. Το παρόν κεφάλαιο θα περιέχει βασικές έννοιες για α) την κατάρτιση και β) την αξιοποίηση των ΣΚ. Αρχικά, αφού αναδειχθεί η ποιοτική διαφορά ανάμεσα σε επισημειωμένα και μ...
Κύριοι συγγραφείς: | , |
---|---|
Μορφή: | 7 |
Γλώσσα: | Greek |
Έκδοση: |
2016
|
Θέματα: | |
Διαθέσιμο Online: | http://localhost:8080/jspui/handle/11419/2210 |
id |
kallipos-11419-2210 |
---|---|
record_format |
dspace |
spelling |
kallipos-11419-22102021-07-11T12:48:24Z Σώματα κειμένων και εφαρμογές Tantos, Alexandros Τάντος, Αλέξανδρος ΥΠΟΛΟΓΙΣΤΙΚΗ ΓΛΩΣΣΟΛΟΓΙΑ ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΛΓΟΡΙΘΜΟΙ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΣΥΜΒΟΛΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΟΥ ΛΟΓΟΥ ΙΕΡΑΡΧΙΑ ΤΣΟΜΣΚΥ ΚΑΝΟΝΙΚΕΣ ΕΚΦΡΑΣΕΙΣ ΑΥΤΟΜΑΤΑ ΟΝΤΟΛΟΓΙΕΣ ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ Computational Linguistics Language Texhnology Algorithms Programming Symbolic And Statistical Natural Language Processing Chomsky Hierarchy Regular Expressions Automata Ontologies Syntactic Parsing Τα Σώματα Κειμένων (ΣΚ) αποτελούν έναν από τους κυριότερους γλωσσικούς πόρους για την αυτοματοποιημένη επεξεργασία φυσικού λόγου. Το παρόν κεφάλαιο θα περιέχει βασικές έννοιες για α) την κατάρτιση και β) την αξιοποίηση των ΣΚ. Αρχικά, αφού αναδειχθεί η ποιοτική διαφορά ανάμεσα σε επισημειωμένα και μη επισημειωμένα ΣΚ, θα αναλυθούν τα βασικά κριτήρια επιλογής και ταξινόμησης των ΣΚ για στοχευμένη και πιο αποτελεσματική γλωσσολογική ή μη επεξεργασία των κειμενικών δεδομένων. Η κατάρτιση ενός ΣΚ αποτελεί μια δύσκολη υπόθεση και προϋποθέτει την τήρηση διαφόρων βασικών κριτηρίων επιλογής των κειμένων, προκειμένου το γλωσσικό δείγμα που θα συλλεχθεί να είναι αντιπροσωπευτικό της γλωσσικής ποικιλίας που φιλοδοξεί να εκπροσωπεί. Θα παρουσιαστούν τα είδη ΣΚ και οι πρακτικές αξιοποίησής τους μέσα από τη χρήση παραδειγμάτων. Επιπλέον, ο αναγνώστης θα εξοικειωθεί με τη γλώσσα σήμανσης XML που αποτελεί την κυρίαρχη γλώσσα σήμανση για την πλειονότητα των επισημειωμένων ΣΚ σημέρα. Στο τελευταίο μέρος του κεφαλαίου, θα παρουσιαστούν οι βασικές αρχές της θεωρίας πιθανοτήτων που είναι απαραίτητες για μια σειρά εφαρμογών στην υπολογιστική γλωσσολογία. Σε αυτή την κατεύθυνση και ως παράδειγμα για την ανάλυση κατηγορικών μεταβλητών που αφορούν τα γλωσσικά δεδομένα, θα λειτουργήσουν η διατύπωση και ο έλεγχος υποθέσεων. Εκεί, περιγράφεται βήμα προς βήμα η διαδικασία ελέγχου υποθέσεων πάνω σε ΣΚ στη βάση ενός απτού παραδείγματος. Ο ελέγχος υποθέσεων αποτελεί ένα απαραίτητο καθημερινό εργαλείο για την επεξεργασία γλωσσικών δεδομένων για τον υπολογιστικό γλωσσολόγο και όχι μόνο. 2016-02-02T21:16:13Z 2021-07-08T09:14:53Z 2016-02-02T21:16:13Z 2021-07-08T09:14:53Z 2016-02-02 7 http://localhost:8080/jspui/handle/11419/2210 el 1 application/pdf |
institution |
Kallipos |
collection |
DSpace |
language |
Greek |
topic |
ΥΠΟΛΟΓΙΣΤΙΚΗ ΓΛΩΣΣΟΛΟΓΙΑ ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΛΓΟΡΙΘΜΟΙ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΣΥΜΒΟΛΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΟΥ ΛΟΓΟΥ ΙΕΡΑΡΧΙΑ ΤΣΟΜΣΚΥ ΚΑΝΟΝΙΚΕΣ ΕΚΦΡΑΣΕΙΣ ΑΥΤΟΜΑΤΑ ΟΝΤΟΛΟΓΙΕΣ ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ Computational Linguistics Language Texhnology Algorithms Programming Symbolic And Statistical Natural Language Processing Chomsky Hierarchy Regular Expressions Automata Ontologies Syntactic Parsing |
spellingShingle |
ΥΠΟΛΟΓΙΣΤΙΚΗ ΓΛΩΣΣΟΛΟΓΙΑ ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΛΓΟΡΙΘΜΟΙ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΣΥΜΒΟΛΙΚΗ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΟΥ ΛΟΓΟΥ ΙΕΡΑΡΧΙΑ ΤΣΟΜΣΚΥ ΚΑΝΟΝΙΚΕΣ ΕΚΦΡΑΣΕΙΣ ΑΥΤΟΜΑΤΑ ΟΝΤΟΛΟΓΙΕΣ ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ Computational Linguistics Language Texhnology Algorithms Programming Symbolic And Statistical Natural Language Processing Chomsky Hierarchy Regular Expressions Automata Ontologies Syntactic Parsing Tantos, Alexandros Τάντος, Αλέξανδρος Σώματα κειμένων και εφαρμογές |
description |
Τα Σώματα Κειμένων (ΣΚ) αποτελούν έναν από τους κυριότερους γλωσσικούς πόρους για την αυτοματοποιημένη επεξεργασία φυσικού λόγου. Το παρόν κεφάλαιο θα περιέχει βασικές έννοιες για α) την κατάρτιση και β) την αξιοποίηση των ΣΚ. Αρχικά, αφού αναδειχθεί η ποιοτική διαφορά ανάμεσα σε επισημειωμένα και μη επισημειωμένα ΣΚ, θα αναλυθούν τα βασικά κριτήρια επιλογής και ταξινόμησης των ΣΚ για στοχευμένη και πιο αποτελεσματική γλωσσολογική ή μη επεξεργασία των κειμενικών δεδομένων. Η κατάρτιση ενός ΣΚ αποτελεί μια δύσκολη υπόθεση και προϋποθέτει την τήρηση διαφόρων βασικών κριτηρίων επιλογής των κειμένων, προκειμένου το γλωσσικό δείγμα που θα συλλεχθεί να είναι αντιπροσωπευτικό της γλωσσικής ποικιλίας που φιλοδοξεί να εκπροσωπεί. Θα παρουσιαστούν τα είδη ΣΚ και οι πρακτικές αξιοποίησής τους μέσα από τη χρήση παραδειγμάτων. Επιπλέον, ο αναγνώστης θα εξοικειωθεί με τη γλώσσα σήμανσης XML που αποτελεί την κυρίαρχη γλώσσα σήμανση για την πλειονότητα των επισημειωμένων ΣΚ σημέρα. Στο τελευταίο μέρος του κεφαλαίου, θα παρουσιαστούν οι βασικές αρχές της θεωρίας πιθανοτήτων που είναι απαραίτητες για μια σειρά εφαρμογών στην υπολογιστική γλωσσολογία. Σε αυτή την κατεύθυνση και ως παράδειγμα για την ανάλυση κατηγορικών μεταβλητών που αφορούν τα γλωσσικά δεδομένα, θα λειτουργήσουν η διατύπωση και ο έλεγχος υποθέσεων. Εκεί, περιγράφεται βήμα προς βήμα η διαδικασία ελέγχου υποθέσεων πάνω σε ΣΚ στη βάση ενός απτού παραδείγματος. Ο ελέγχος υποθέσεων αποτελεί ένα απαραίτητο καθημερινό εργαλείο για την επεξεργασία γλωσσικών δεδομένων για τον υπολογιστικό γλωσσολόγο και όχι μόνο. |
format |
7 |
author |
Tantos, Alexandros Τάντος, Αλέξανδρος |
author_facet |
Tantos, Alexandros Τάντος, Αλέξανδρος |
author_sort |
Tantos, Alexandros |
title |
Σώματα κειμένων και εφαρμογές |
title_short |
Σώματα κειμένων και εφαρμογές |
title_full |
Σώματα κειμένων και εφαρμογές |
title_fullStr |
Σώματα κειμένων και εφαρμογές |
title_full_unstemmed |
Σώματα κειμένων και εφαρμογές |
title_sort |
σώματα κειμένων και εφαρμογές |
publishDate |
2016 |
url |
http://localhost:8080/jspui/handle/11419/2210 |
work_keys_str_mv |
AT tantosalexandros sōmatakeimenōnkaiepharmoges AT tantosalexandros sōmatakeimenōnkaiepharmoges |
_version_ |
1771301318905823232 |