Περίληψη: | Στην σημερινή εποχή , κάθε επιχείρηση που ασχολείται με συναλλαγές
εμπορικού χαρακτήρα διατηρεί τις βάσεις συναλλαγών της. Ο τεράστιος όγκος των
δεδομένων που αποθηκεύουν σε συνδυασμό με την πληθώρα τεχνικών που έχουν
εφευρεθεί έτσι ώστε να εξάγεται η γνώση από αυτές τις καθιστούν ένα απαραίτητο
αντικείμενο για μελέτη σε κάθε επιχείρηση. Οι τεχνικές που βασίζονται πάνω σε αυτές
οδηγούν κυρίως στην ανακάλυψη σημαντικών επαναλαμβανόμενων προτύπων που
χαρακτηρίζουν την συμπεριφορά των καταναλωτών. Τα αποτελέσματα των μελετών
μπορούν να χρησιμοποιηθούν έτσι ώστε να γίνει πιο στοχευμένη διαφήμιση καθώς και
να διαμορφωθούν νέες στρατηγικές μάρκετινγκ. Στο πλαίσιο αυτό, οργανισμοί είναι
διατεθειμένοι να ανταλλάξουν τα δεδομένα τους , με στόχο το κοινό τους κέρδος.
Αυτή η ανταλλαγή των δεδομένων ελλοχεύει κινδύνους. Από την μετέπειτα
επεξεργασία των δεδομένων μπορεί να αποκαλυφθούν επιτυχημένες πλέον
στρατηγικές ή πρότυπα οι οποίες μπορούν χρησιμοποιηθούν από μη
εξουσιοδοτημένους τρίτους με σκοπό να τις ζημιώσουν οικονομικά. Επομένως είναι
απαραίτητη η ανάγκη για απόκρυψη των ευαίσθητων δεδομένων. Αυτή η ανάγκη έχει
δημιουργήσει ένα νέο επιστημονικό κλάδο, o οποίος προσπαθεί να δώσει λύση στο
συγκεκριμένο πρόβλημα. Όλα αυτά τα χρόνια έχουν αναπτυχθεί διαφόρου είδους
αλγόριθμοι και τεχνικές οι οποίοι προσπαθούν αποκρύψουν την ευαίσθητη
πληροφορία με τις ελάχιστες παράπλευρες απώλειες.
Στην συγκεκριμένη διπλωματική εργασία , θα παρουσιάσουμε λεπτομερώς ένα
πλήθος από αλγορίθμους απόκρυψης συχνών μοτίβων που βρίσκονται στην μορφή
συνολοστοιχείων. Στην συνέχεια εντοπίζουμε μειονεκτήματα σε ορισμένους εξ’ αυτών
και προτείνουμε βελτιώσεις. Εξετάζουμε την απόδοση αυτών , σε πραγματικά και
φανταστικά δεδομένα , προχωρώντας σε μετρήσεις σύμφωνα με την υλοποίηση των
συγκεκριμένων αλγορίθμων ,η οποία έγινε από τον Βασίλειο Καγκλή στο Frequent
Itemset Hiding Toolbox. Αξιολογούμε τους συγκεκριμένους αλγόριθμους
χρησιμοποιώντας τις μετρικές αξιολόγησης τις οποίες εφηύρε ο Παναγιώτης
Μάρκοβιτς. Προτείνουμε ορισμένες βελτιώσεις πάνω στις μετρικές και παρουσιάζουμε
την καταλληλόλητα χρήσης κάθε μιας τεχνικής ανάλογα με τα χαρακτηριστικά των
πειραματικών δεδομένων.
|