Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στον εντοπισμό κύριων τάσεων σε σύνολο κειμένων : εφαρμογή στον εντοπισμό κύριων ερευνητικών πεδίων στο σύνολο των ερευνητικών έργων του ΕΛΚΕ του Πανεπιστημίου Πατρών

Τα τελευταία χρόνια με την ανάπτυξη του παγκόσμιου ιστού, των ψηφιακών βιβλιοθηκών και των βάσεων δεδομένων έχει δημιουργηθεί ένα τεράστιο πρόβλημα συσσώρευσης μεγάλου όγκου κειμένων και πληροφοριών. Το φαινόμενο αυτό έχει απασχολήσει πάρα πολλούς χρήστες που προσπαθούν να εξαγάγουν γρήγορα και εύκο...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αγγελόπουλος, Κωνσταντίνος
Άλλοι συγγραφείς: Βουτσινάς, Βασίλειος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2016
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/9642
id nemertes-10889-9642
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Εξόρυξη γνώσης
Εξόρυξη κειμένου
Ομαδοποίηση
Αλγόριθμοι
Data mining
Text mining
Clustering
Algorithms
006.312
spellingShingle Εξόρυξη γνώσης
Εξόρυξη κειμένου
Ομαδοποίηση
Αλγόριθμοι
Data mining
Text mining
Clustering
Algorithms
006.312
Αγγελόπουλος, Κωνσταντίνος
Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στον εντοπισμό κύριων τάσεων σε σύνολο κειμένων : εφαρμογή στον εντοπισμό κύριων ερευνητικών πεδίων στο σύνολο των ερευνητικών έργων του ΕΛΚΕ του Πανεπιστημίου Πατρών
description Τα τελευταία χρόνια με την ανάπτυξη του παγκόσμιου ιστού, των ψηφιακών βιβλιοθηκών και των βάσεων δεδομένων έχει δημιουργηθεί ένα τεράστιο πρόβλημα συσσώρευσης μεγάλου όγκου κειμένων και πληροφοριών. Το φαινόμενο αυτό έχει απασχολήσει πάρα πολλούς χρήστες που προσπαθούν να εξαγάγουν γρήγορα και εύκολα χρήσιμες πληροφορίες από μεγάλες συλλογές κειμένων. Η δυσκολία έγκειται στην αδυναμία επεξεργασίας όλης αυτής της διαθέσιμης πληροφορίας και των μεγάλων κειμενικών πόρων με απώτερο σκοπό την αδυναμία εξαγωγής χρήσιμων ή νέων γνώσεων και συμπερασμάτων. Προκειμένου να αντιμετωπισθεί το παραπάνω πρόβλημα, έχουν αναπτυχθεί αρκετές τεχνικές για την οργάνωση, την ανάλυση και την εξαγωγή νέας γνώσης από μεγάλους όγκους κειμένων. Μία από αυτές τις τεχνικές είναι η εξόρυξη γνώσης από κείμενα (Text Mining). Μία από τις σημαντικότερες μεθόδους της εξόρυξης γνώσης από κείμενα (Text Mining) είναι η ομαδοποίηση, η οποία ως σκοπό έχει την οργάνωση μεγάλου όγκου κειμένων σε ομάδες (clusters) βάση ορισμένων κριτηρίων ομοιότητας, βοηθώντας καθοριστικά στην ανάλυσή τους και στην εξαγωγή νέων γνώσεων από αυτά. Σκοπός της παρούσας μεταπτυχιακής εργασίας είναι η συλλογή των ερευνητικών προγραμμάτων από την Επιτροπή Ερευνών (ΕΛΚΕ) του Πανεπιστημίου Πατρών και η εφαρμογή της τεχνικής εξόρυξης γνώσης από κείμενα (Text Mining) με απώτερο σκοπό την εξαγωγή συμπερασμάτων για το ποια είναι τα κύρια ερευνητικά πεδία του Πανεπιστημίου Πατρών. Πιο αναλυτικά στο πρώτο κεφάλαιο γίνεται μία σύντομη ανασκόπηση σχετικά με την εξόρυξη γνώσης από κείμενα (Text Mining) και περιγράφονται οι στόχοι, οι μέθοδοι και τα εργαλεία που χρησιμοποιεί. Στο δεύτερο κεφάλαιο παρουσιάζεται η διαδικασία προ-επεξεργασίας των κειμένων καθώς και ο τρόπος αναπαράστασης αυτών. Στο τρίτο κεφάλαιο περιγράφονται η διαδικασία της ομαδοποίησης, σημαντικοί αλγόριθμοι ομαδοποίησης και διάφορα μέτρα ομοιότητας. Στο τέταρτο κεφάλαιο περιγράφεται η διαδικασία συλλογής και προ-επεξεργασίας των ερευνητικών προγραμμάτων καθώς επίσης και η εφαρμογή του λογισμικού Text Mining, QDA Miner, σε συνδυασμό με το λογισμικό ανάλυσης περιεχομένου, Wordstat, προκειμένου τα εν λόγω ερευνητικά προγράμματα να ομαδοποιηθούν σε ομάδες (clusters) με απώτερο σκοπό την εξαγωγή κατάλληλων συμπερασμάτων, ώστε να αποφανθεί όπως προαναφέραμε, ποια είναι τα κύρια ερευνητικά πεδία του Πανεπιστημίου Πατρών. Η εν λόγω εργασία κλείνει με την ανάλυση των αποτελεσμάτων και τις προτάσεις για μελλοντική έρευνα.
author2 Βουτσινάς, Βασίλειος
author_facet Βουτσινάς, Βασίλειος
Αγγελόπουλος, Κωνσταντίνος
format Thesis
author Αγγελόπουλος, Κωνσταντίνος
author_sort Αγγελόπουλος, Κωνσταντίνος
title Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στον εντοπισμό κύριων τάσεων σε σύνολο κειμένων : εφαρμογή στον εντοπισμό κύριων ερευνητικών πεδίων στο σύνολο των ερευνητικών έργων του ΕΛΚΕ του Πανεπιστημίου Πατρών
title_short Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στον εντοπισμό κύριων τάσεων σε σύνολο κειμένων : εφαρμογή στον εντοπισμό κύριων ερευνητικών πεδίων στο σύνολο των ερευνητικών έργων του ΕΛΚΕ του Πανεπιστημίου Πατρών
title_full Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στον εντοπισμό κύριων τάσεων σε σύνολο κειμένων : εφαρμογή στον εντοπισμό κύριων ερευνητικών πεδίων στο σύνολο των ερευνητικών έργων του ΕΛΚΕ του Πανεπιστημίου Πατρών
title_fullStr Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στον εντοπισμό κύριων τάσεων σε σύνολο κειμένων : εφαρμογή στον εντοπισμό κύριων ερευνητικών πεδίων στο σύνολο των ερευνητικών έργων του ΕΛΚΕ του Πανεπιστημίου Πατρών
title_full_unstemmed Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στον εντοπισμό κύριων τάσεων σε σύνολο κειμένων : εφαρμογή στον εντοπισμό κύριων ερευνητικών πεδίων στο σύνολο των ερευνητικών έργων του ΕΛΚΕ του Πανεπιστημίου Πατρών
title_sort χρήση τεχνικών εξόρυξης από κείμενο (text mining) στον εντοπισμό κύριων τάσεων σε σύνολο κειμένων : εφαρμογή στον εντοπισμό κύριων ερευνητικών πεδίων στο σύνολο των ερευνητικών έργων του ελκε του πανεπιστημίου πατρών
publishDate 2016
url http://hdl.handle.net/10889/9642
work_keys_str_mv AT angelopouloskōnstantinos chrēsētechnikōnexoryxēsapokeimenotextminingstonentopismokyriōntaseōnsesynolokeimenōnepharmogēstonentopismokyriōnereunētikōnpediōnstosynolotōnereunētikōnergōntouelketoupanepistēmioupatrōn
AT angelopouloskōnstantinos useoftechnicalminingfromtexttextmininginidentifyingthemaintrendsintotaltextapplicationinidentifyingmainresearchfieldsinallresearchprojectsofthespecialaccountforresearchfundsoftheuniversityofpatras
_version_ 1771297290029367296
spelling nemertes-10889-96422022-09-05T20:26:59Z Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στον εντοπισμό κύριων τάσεων σε σύνολο κειμένων : εφαρμογή στον εντοπισμό κύριων ερευνητικών πεδίων στο σύνολο των ερευνητικών έργων του ΕΛΚΕ του Πανεπιστημίου Πατρών Use of technical mining from text (text mining) in identifying the main trends in total text : application in identifying main research fields in all research projects of the special account for research funds of the University of Patras Αγγελόπουλος, Κωνσταντίνος Βουτσινάς, Βασίλειος Βουτσινάς, Βασίλειος Ανδρουλάκης, Γεώργιος Σταματίου, Ιωάννης Aggelopoulos, Konstantinos Εξόρυξη γνώσης Εξόρυξη κειμένου Ομαδοποίηση Αλγόριθμοι Data mining Text mining Clustering Algorithms 006.312 Τα τελευταία χρόνια με την ανάπτυξη του παγκόσμιου ιστού, των ψηφιακών βιβλιοθηκών και των βάσεων δεδομένων έχει δημιουργηθεί ένα τεράστιο πρόβλημα συσσώρευσης μεγάλου όγκου κειμένων και πληροφοριών. Το φαινόμενο αυτό έχει απασχολήσει πάρα πολλούς χρήστες που προσπαθούν να εξαγάγουν γρήγορα και εύκολα χρήσιμες πληροφορίες από μεγάλες συλλογές κειμένων. Η δυσκολία έγκειται στην αδυναμία επεξεργασίας όλης αυτής της διαθέσιμης πληροφορίας και των μεγάλων κειμενικών πόρων με απώτερο σκοπό την αδυναμία εξαγωγής χρήσιμων ή νέων γνώσεων και συμπερασμάτων. Προκειμένου να αντιμετωπισθεί το παραπάνω πρόβλημα, έχουν αναπτυχθεί αρκετές τεχνικές για την οργάνωση, την ανάλυση και την εξαγωγή νέας γνώσης από μεγάλους όγκους κειμένων. Μία από αυτές τις τεχνικές είναι η εξόρυξη γνώσης από κείμενα (Text Mining). Μία από τις σημαντικότερες μεθόδους της εξόρυξης γνώσης από κείμενα (Text Mining) είναι η ομαδοποίηση, η οποία ως σκοπό έχει την οργάνωση μεγάλου όγκου κειμένων σε ομάδες (clusters) βάση ορισμένων κριτηρίων ομοιότητας, βοηθώντας καθοριστικά στην ανάλυσή τους και στην εξαγωγή νέων γνώσεων από αυτά. Σκοπός της παρούσας μεταπτυχιακής εργασίας είναι η συλλογή των ερευνητικών προγραμμάτων από την Επιτροπή Ερευνών (ΕΛΚΕ) του Πανεπιστημίου Πατρών και η εφαρμογή της τεχνικής εξόρυξης γνώσης από κείμενα (Text Mining) με απώτερο σκοπό την εξαγωγή συμπερασμάτων για το ποια είναι τα κύρια ερευνητικά πεδία του Πανεπιστημίου Πατρών. Πιο αναλυτικά στο πρώτο κεφάλαιο γίνεται μία σύντομη ανασκόπηση σχετικά με την εξόρυξη γνώσης από κείμενα (Text Mining) και περιγράφονται οι στόχοι, οι μέθοδοι και τα εργαλεία που χρησιμοποιεί. Στο δεύτερο κεφάλαιο παρουσιάζεται η διαδικασία προ-επεξεργασίας των κειμένων καθώς και ο τρόπος αναπαράστασης αυτών. Στο τρίτο κεφάλαιο περιγράφονται η διαδικασία της ομαδοποίησης, σημαντικοί αλγόριθμοι ομαδοποίησης και διάφορα μέτρα ομοιότητας. Στο τέταρτο κεφάλαιο περιγράφεται η διαδικασία συλλογής και προ-επεξεργασίας των ερευνητικών προγραμμάτων καθώς επίσης και η εφαρμογή του λογισμικού Text Mining, QDA Miner, σε συνδυασμό με το λογισμικό ανάλυσης περιεχομένου, Wordstat, προκειμένου τα εν λόγω ερευνητικά προγράμματα να ομαδοποιηθούν σε ομάδες (clusters) με απώτερο σκοπό την εξαγωγή κατάλληλων συμπερασμάτων, ώστε να αποφανθεί όπως προαναφέραμε, ποια είναι τα κύρια ερευνητικά πεδία του Πανεπιστημίου Πατρών. Η εν λόγω εργασία κλείνει με την ανάλυση των αποτελεσμάτων και τις προτάσεις για μελλοντική έρευνα. In recent years with the development of the Web, digital libraries and databases has created a huge problem accumulation of large volumes of text and information. This phenomenon has occupied too many users trying to quickly and easily extract useful information from large text collections. The difficulty lies in the inability of all processing of this information available and large textual resources with the aim of export weakness or useful new knowledge and conclusions. To address the above problem, we have developed several techniques for organizing, analyzing and export of new knowledge from large volumes of text. One of these techniques is the extraction of knowledge from texts (Text Mining). One of the most important methods of knowledge extraction from text (Text Mining) is a grouping, which aim is the large volume organize text into groups (clusters) based on certain similarity criteria, helping decisively in their analysis and to draw new knowledge from these. The purpose of this postgraduate thesis is the collection of research projects by the Research Committee of the University of Patras and the application of the technique of extraction of knowledge from texts (Text Mining) with the aim of drawing conclusions as to what the main research fields of the University of Patras. More detail in the first chapter gives a brief overview on the mining of texts (Text Mining) and describes the objectives, methods and tools used. The second chapter presents the process of text preprocessing and how such representation. The third chapter describes the process of clustering, significant clustering algorithms and various similarity measures. The fourth chapter describes the process of collection and pre-processing of research programs as well as the software application Text Mining, QDA Miner, combined with content analysis software, Wordstat, so that these research projects be grouped into groups (clusters) with the ultimate purpose of enabling appropriate conclusions, in order to rule as mentioned above, what are the main research fields of the University of Patras. This paper ends with an analysis of the results and suggestions for future research. 2016-09-21T10:05:49Z 2016-09-21T10:05:49Z 2016-06-07 Thesis http://hdl.handle.net/10889/9642 gr 0 application/pdf