Εξαγωγή και επεξεργασία χρήσιμης πληροφορίας απο αρχεία καταγραφής πρόσβασης σε δικτυακούς τόπους και μια νέα γλώσσα περιγραφής τους βασισμένη σε xml

Ο Παγκόσμιος Ιστός αποτελεί σήμερα το σημαντικότερο, ίσως, μέσο παγκοσμίως για την εξεύρεση κάθε είδους πληροφορίας και οι δικτυακοί τόποι, των οποίων το πλήθος αυξάνεται συνεχώς, δέχονται πολλές επισκέψεις χρηστών καθημερινά. Οι διαχειριστές των δικτυακών τόπων, σε μία προσπάθεια να κατανοήσουν...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Μπλέκας, Αλέξανδρος
Άλλοι συγγραφείς: Γαροφαλάκης, Ιωάννης
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2007
Θέματα:
Διαθέσιμο Online:http://nemertes.lis.upatras.gr/jspui/handle/10889/508
Περιγραφή
Περίληψη:Ο Παγκόσμιος Ιστός αποτελεί σήμερα το σημαντικότερο, ίσως, μέσο παγκοσμίως για την εξεύρεση κάθε είδους πληροφορίας και οι δικτυακοί τόποι, των οποίων το πλήθος αυξάνεται συνεχώς, δέχονται πολλές επισκέψεις χρηστών καθημερινά. Οι διαχειριστές των δικτυακών τόπων, σε μία προσπάθεια να κατανοήσουν τις ανάγκες και τις επιθυμίες των χρηστών, χρησιμοποιούν τα δεδομένα της πρόσβασης στους δικτυακούς τόπους με την ελπίδα τα δεδομένα αυτά να τους βοηθήσουν να κάνουν το δικτυακό τους τόπο πιο χρήσιμο και αποτελεσματικό για τους τελικούς χρήστες. Τα δεδομένα της πρόσβασης στους δικτυακούς τόπους αποθηκεύονται στους εξυπηρετητές ιστού με τη μορφή αρχείων καταγραφής πρόσβασης (web access logs). Τα αρχεία αυτά, είναι αρχεία κειμένου τα οποία δημιουργούνται βάσει μίας αυτοματοποιημένης διαδικασίας και παρουσιάζουν σειριακά πληροφορίες για κάθε αίτημα το οποίο πραγματοποιείται από έναν χρήστη προς τον εξυπηρετητή ιστού. Κάθε ένα από τα καταγεγραμμένα αιτήματα αναπαριστάται στο αρχείο καταγραφής πρόσβασης ως μία γραμμή κειμένου που περιλαμβάνει πολλές ετερογενείς πληροφορίες αναφορικά με το ίδιο το αίτημα, το χρήστη που το πραγματοποίησε και τη σελίδα ή το αρχείο του διαδικτυακού τόπου για την οποία πραγματοποιήθηκε το αίτημα. Το μειονέκτημα των αρχείων καταγραφής πρόσβασης είναι το γεγονός ότι αποτελούνται από δομημένη αλλά δυστυχώς πολύ δυσανάγνωστη πληροφορία. Για το λόγο αυτό έχουν αναπτυχθεί πολλά εμπορικά εργαλεία διαχείρισης της πληροφορίας αυτής. Στα πλαίσια της παρούσας εργασίας, δημιουργήθηκε ένα τέτοιο εργαλείο, το οποίο όμως έχει ως στόχο να εξάγει και να επεξεργάζεται μόνο τη χρήσιμη πληροφορία που περιέχεται στα αρχεία καταγραφής πρόσβασης. Με τον τρόπο αυτό, ο διαχειριστής ενός δικτυακού τόπου μπορεί να έχει στη διάθεσή του ουσιαστικά χρήσιμα στοιχεία αναφορικά με την πρόσβαση στο δικτυακό του τόπο τα οποία μπορούν να τον βοηθήσουν να σχεδιάσει το δικτυακό τόπο με μεγαλύτερη αποτελεσματικότητα, δίνοντας έμφαση στις πραγματικές ανάγκες και απαιτήσεις των χρηστών. Στην προσέγγιση που παρουσιάζεται στην εργασία αυτή, δίδεται επίσης βαρύτητα στην αποθήκευση και τη διαχείριση της χρήσιμης, πλέον, πληροφορίας που προκύπτει από τα αρχεία καταγραφής πρόσβασης. Σε αυτό τον τομέα, δημιουργήθηκε μία καινούρια γλώσσα περιγραφής των αρχείων αυτών, βασισμένη σε XML. Σήμερα, η γλώσσα XML τείνει να αποτελέσει ένα όσο το δυνατόν πιο καθολικό πρότυπο αποθήκευσης δεδομένων, λόγω της καλά δομημένης φύσης της και την ανεξαρτησίας της από υπολογιστικές πλατφόρμες. Η νέα γλώσσα, λόγω της XML φύσης της, ορίζει με ακρίβεια και πληρότητα τα στοιχεία που αποτελούν τη χρήσιμη πληροφορία των αρχείων καταγραφής πρόσβασης. Η νέα αυτή γλώσσα έχει ορισμένα πλεονεκτήματα που την καθιστούν πρακτική και συνάμα λειτουργική. Η σύνταξή της και η δομή της βασίζεται στην XML, γεγονός που της επιτρέπει να μεταφέρει τα δεδομένα της σε οποιοδήποτε υπολογιστικό περιβάλλον και έτσι αυτά να μπορούν να τύχουν περαιτέρω επεξεργασίας. Ένα ακόμη σημαντικό πλεονέκτημά της, είναι η εξοικονόμηση χώρου που πραγματοποιεί. Τα αρχεία καταγραφής πρόσβασης είναι από τη φύση τους μεγάλα σε όγκο και με την εξαγωγή της χρήσιμης πληροφορίας τους, τα αρχεία της νέας γλώσσας μπορούν να αποθηκεύουν την πληροφορία σε πιο ευανάγνωστη και εύκολα διαχειρίσιμη μορφή, καταλαμβάνοντας παράλληλα πολύ λιγότερο χώρο. Η νέα γλώσσα περιγραφής αρχείων καταγραφής πρόσβασης μπορεί με ευκολία να παραστήσει οπτικά τη χρήσιμη πληροφορία σε ποικίλες μορφές και τα αρχεία της έχουν τη δυνατότητα να συνδυάζονται απλά και αποτελεσματικά ώστε να υπάρχει δυνατότητα συγκέντρωσης ενοποιημένης πληροφορίας που να αφορά μεγάλες χρονικές περιόδους. Το στοιχείο αυτό δε συναντάται συνήθως στα υπάρχοντα εργαλεία ανάλυσης αρχείων καταγραφής πρόσβασης, τα οποία εξάγουν κατά κύριο λόγο στατικές και καθόλου ευέλικτες μορφές αποτελεσμάτων, αποτελώντας ένα σημαντικό πλεονέκτημα της νέας γλώσσας, καθώς από την ενοποιημένη πληροφορία μπορούν να εξαχθούν ακόμη πιο χρήσιμα και ρεαλιστικά συμπεράσματα για την κίνηση και τη χρήση του δικτυακού τόπου. Στην εργασία αυτή, μελετάται η πληροφορία που περιέχεται στα αρχεία καταγραφής πρόσβασης σε δικτυακούς τόπους, ερευνάται το πεδίο εξαγωγής και επεξεργασίας της χρήσιμης πληροφορίας από αυτά και παρουσιάζεται αναλυτικά η νέα γλώσσα, η οποία περιγράφει τα αρχεία καταγραφής πρόσβασης σε δικτυακούς τόπους, με στόχο την καλύτερη δόμηση και διαχείριση της πληροφορίας που περιέχουν. Παράλληλα, παρουσιάζεται ένα ολοκληρωμένο σύστημα ανάλυσης και επεξεργασίας αρχείων καταγραφής πρόσβασης σε δικτυακούς τόπους, το οποίο εξάγει τη χρήσιμη πληροφορία και τη μετατρέπει σε αρχεία της νέας γλώσσας, ενώ την ίδια στιγμή προσφέρει έναν αριθμό επιπλέον λειτουργιών όπως ο συνδυασμός αρχείων της νέας γλώσσας, η παραγωγή αρχείων με οπτικές μορφές των αποτελεσμάτων και ο έλεγχος της εγκυρότητας των αρχείων. Το σύστημα αυτό, εκμεταλλεύεται πλήρως τα πλεονεκτήματα της νέας γλώσσας και έχει ως στόχο τη διευκόλυνση κάθε διαχειριστή στην προσπάθειά του να βελτιώσει τη δομή και την αποτελεσματικότητα του δικτυακού του τόπου.