Περίληψη: | Στο κεφάλαιο αυτό επεκτείνουμε το ερευνητικό ερώτημα της υφομετρικής απόδοσης της συγγραφικής πατρότητας σε περισσότερους από 2 πιθανούς συγγραφείς. Παράλληλα εξετάζεται κατά πόσο το κείμενο είναι η ελάχιστη μονάδα υφομετρικής μέτρησης, ή μπορεί να αξιοποιηθεί αποδοτικά υποσύνολό του (ισομερή υπό-τεμάχια). Το corpus που χρησιμοποιείται για τα πειράματα αυτού του κεφαλαίου ανήκει στο γένος των ιστολογίων και είναι ισορροπημένο τόσο ως προς τον αριθμό των αναρτήσεων ανά συγγραφέα όσο και ως προς το φύλο του συγγραφέα, έτσι ώστε να μπορούμε να μελετήσουμε την επίδραση του αριθμού των συγγραφέων χωρίς τον κίνδυνο παρείσφρησης συνεπιδρώντων παραγόντων. Περιλαμβάνει 1.000 αναρτήσεις από 20 συγγραφείς (10 άνδρες και 10 γυναίκες) με 50 αναρτήσεις από κάθε συγγραφέα. Εισάγεται η χρήση του αλγόριθμου Support Vector Machines και παρουσιάζονται εναλλακτικές μεθοδολογίες επιλογής κατάλληλων υφομετρικών χαρακτηριστικών για την βελτιστοποίηση της μηχανικής μάθησης στο εν λόγω ερευνητικό πρόρβλημα.
|