Επεξεργασία φυσικής γλώσσας

Στην παρούσα διπλωματική εργασία ασχολούμαστε με τον τομέα της Επεξεργασίας Φυσικής Γλώσσας (ΕΦΓ) ο οποίος τα τελευταία χρόνια έχει γνωρίσει ραγδαία ανάπτυξη και εξέλιξη. Πιο συγκεκριμένα, στο πρώτο κεφάλαιο παραθέτουμε εισαγωγικές έννοιες και όρους αναφορικά με την ΕΦΓ. Δίνουμε τον ορισμό της ΕΦ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Δελατόλας, Γεώργιος
Άλλοι συγγραφείς: Delatolas, Georgios
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15740
Περιγραφή
Περίληψη:Στην παρούσα διπλωματική εργασία ασχολούμαστε με τον τομέα της Επεξεργασίας Φυσικής Γλώσσας (ΕΦΓ) ο οποίος τα τελευταία χρόνια έχει γνωρίσει ραγδαία ανάπτυξη και εξέλιξη. Πιο συγκεκριμένα, στο πρώτο κεφάλαιο παραθέτουμε εισαγωγικές έννοιες και όρους αναφορικά με την ΕΦΓ. Δίνουμε τον ορισμό της ΕΦΓ αλλά και τους λόγους για τους οποίους είναι χρήσιμη η εκμάθησή της. Επίσης, αναφέρουμε τους παράγοντες τους οποίους καθιστούν την ΕΦΓ δύσκολη και εξηγούμε τον τρόπο με τον οποίο δουλεύει η ΕΦΓ, παρουσιάζοντας ενδεικτικά διάφορες τεχνικές που χρησιμοποιούνται για την ερμηνεία της ανθρώπινης γλώσσας. Επιπλέον, παραθέτουμε μία σύντομη ιστορική αναδρομή, προκειμένου να έχουμε εικόνα για το πώς δημιουργήθηκε αυτός ο τομέας αλλά και για να δούμε την εξέλιξη και την πρόοδο που επιτεύχθηκε σε αυτόν ανά τους αιώνες. Στο δεύτερο κεφάλαιο ασχολούμαστε με την προεπεξεργασία δεδομένων. Πιο συγκεκριμένα, αναφέρουμε μερικά βασικά βήματα προεπεξεργασίας κειμένου τα οποία ακολου-θούνται στις περισσότερες από τις εφαρμογές της ΕΦΓ. Έτσι, περιγράφονται αναλυτικά μερικές απλές αλλά και βασικές εργασίες που πρέπει να ακολουθηθούν μετά την απόκτηση ενός κειμένου προτού αυτό δοθεί σε κάποιο μοντέλο για εκπαίδευση. Στο κεφάλαιο τρία παρουσιάζουμε διάφορες μεθόδους αλλά και τρόπους, με τους οποίους μπορούμε να μετατρέψουμε το κείμενο σε μορφή κατάλληλα αναγνώσιμη από τον υπολογιστή. Αυτή η διαδικασία θα μπορούσαμε να πούμε ότι αποτελεί θεμέλιο στην ΕΦΓ καθώς οι υπολογιστές δεν μπορούν να κατανοήσουν, χαρακτήρες, λέξεις ή προτάσεις. Ως είσοδό τους δέχονται μόνο αριθμούς, οι οποίοι μπορεί να είναι δυαδικά ψηφία. Το τέταρτο κεφάλαιο αποτελεί ένα θεωρητικό κεφάλαιο. Σε αυτό, γίνεται μία εισαγωγή στην Μηχανική Μάθηση, στα Νευρωνικά Δίκτυα και παραθέτονται ορισμένα επιπλέον βήματα προεπεξεργασίας των δεδομένων, τα οποία απαιτούνται για την εκπαίδευση μοντέλων Μηχανικής Μάθησης. Το πέμπτο κεφάλαιο είναι αφιερωμένο στις εφαρμογές της ΕΦΓ. Σε αυτό το κεφάλαιο εφαρμόζουμε όλη τη μάθηση από τα προηγούμενα κεφάλαια και λαμβάνουμε μία εικόνα για το τι είδους εφαρμογές μπορούν να αναπτυχθούν, αξιοποιώντας τα Νευρωνικά Δίκτυα αλλά και τεχνικές Μηχανικής Μάθησης. Αναφέρουμε μερικές από τις δημοφιλέστερες εφαρμογές της ΕΦΓ και ανάμεσα σε αυτές εστιάζουμε την προσοχή μας σε μία εφαρμογή για την ανίχνευση σαρκασμού σε κείμενο. Τέλος, συνοψίσουμε όσα έχουμε αναφέρει για την ΕΦΓ και μιλάμε για το μέλλον της ΕΦΓ στην Επιστήμη των Δεδομένων. Αναφερόμαστε σε κάποιες κύριες προκλήσεις που αντιμετωπίζονται αλλά και στα πολλά οφέλη που σχετίζονται με τον τομέα αυτόν.