Περίληψη: | Το κεφάλαιο αυτό εισάγει τον αναγνώστη στο αμιγώς πειραματικό κομμάτι της υπολογιστικής υφολογίας. Περιγράφεται η βασική μεθοδολογία διερεύνησης κειμένων αμφισβητούμενης πατρότητας η οποία περιλαμβάνει την ανάπτυξη κατάλληλου corpus, την μέτρηση των κατάλληλων υφομετρικών χαρακτηριστικών σε αυτό, την εκπαίδευση του κατάλληλου στατιστικού αλγόριθμου και την αξιολόγηση της μηχανικής μάθησης που επιτεύχθηκε. Εξετάζεται η ειδική περίπτωση κατά την οποία το αμφισβητούμενο κείμενο προέρχεται από δύο πιθανούς συγγραφείς και εισάγεται η χρήση της λογιστικής παλινδρόμησης ως αλγόριθμου μηχανικής μάθησης.
|