Περίληψη: | Η λογοκλοπή αποτελεί ένα σύνθετο πρόβλημα και ένα από τα μεγαλύτερα στον επιστημονικό,δημοσιογραφικό και εκδοτικό χώρο. Τόσο η ραγδαία ανάπτυξη του παγκόσμιου ιστού όσο και ο ανεξέλεγκτος ρυθμός παραγωγής και δημοσίευσης κειμένων σε αυτόν, συντέλεσαν στο γεγονός η πράξη της λογοκλοπής να μπορεί να γίνει πιο εύκολη από ποτέ. Ένα κείμενο ή μέρος του μπορεί να αποτελεί προϊών λογοκλοπής απο ένα ή περισσότερα πρωτότυπα κείμενα. Με τον όρο λογοκλοπή πέραν της ακριβής αντιγραφής συμπεριλαμβάνονται και η αναδιατύπωση κειμένου,η παράφραση κειμένου, η υιοθέτηση μερών κειμένου από άλλες πηγές, η έλλειψη αναφορών σε πρωτότυπα κείμενα και η αναφορά με λανθασμένες παραπομπές. Ήδη έχουν αναπτυχθεί πολλά εργαλεία για την αναγνώριση λογοκλοπής χρησιμοποιώντας διάφορες τεχνικές. Ωστόσο, λόγω του μεγάλου όγκου των κειμένων προκύπτουν ζητήματα απόδοσης και κλιμακωσιμότητας. Μια σύγχρονη μέθοδος αντιμετώπισης του προβλήματος στηρίζεται στη χρήση συστημάτων υπολογιστικών νεφών, που δίνουν τη δυνατότητα παράλληλης επεξεργασίας δεδομένων μεγάλου όγκου. Στην παρούσα διπλωματική εργασία, σχεδιάζεται και υλοποιείται ένα σύστημα εντοπισμού λογοκλοπής, βασισμένο σε περιβάλλον υπολογιστικού νέφους, και συγκεκριμένα στο MapReduce processing framework.
|