Η γλώσσα R στην επιστήμη δεδομένων

Η αλματώδης ανάπτυξη των πληροφοριακών συστημάτων, και η απεριόριστη χρήση ασύρματων και ενσύρματων δικτύων τα τελευταία χρόνια, έχουν ως συνέπεια την δημιουργία μεγάλων όγκων δεδομένων σε καθημερινή βάση. Τα δεδομένα συναντώνται με διάφορες μορφές, εικόνα, κείμενο κλπ, ή συχνά περιέχουν θόρυβο, και...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Γιαλελή, Αγγελική
Άλλοι συγγραφείς: Ρήγκου, Μαρία
Μορφή: Πτυχιακή Εργασία
Γλώσσα:Greek
Έκδοση: Πανεπιστήμιο Πάτρας 2021
Θέματα:
Διαθέσιμο Online:https://nemertes.library.upatras.gr/handle/10889/17510
Περιγραφή
Περίληψη:Η αλματώδης ανάπτυξη των πληροφοριακών συστημάτων, και η απεριόριστη χρήση ασύρματων και ενσύρματων δικτύων τα τελευταία χρόνια, έχουν ως συνέπεια την δημιουργία μεγάλων όγκων δεδομένων σε καθημερινή βάση. Τα δεδομένα συναντώνται με διάφορες μορφές, εικόνα, κείμενο κλπ, ή συχνά περιέχουν θόρυβο, και πολλές φορές είναι δύσκολο να αξιολογηθούν. Σε έναν κόσμο, όπου κάθε είδος εργασίας περιλαμβάνει την ενασχόληση με δεδομένα οποιουδήποτε είδους, σχεδόν όλοι χρειάζονται έναν επιστήμονα που να εξειδικεύεται στην εξαγωγή και ανάλυση των δεδομένων με στόχο την εύρεση ουσιαστικών λύσεων. Προβλέπεται άλλωστε ότι θα υπάρξει ζήτηση για εκατοντάδες χιλιάδες θέσεις εργασίας στο μέλλον, για ανθρώπους με δεξιότητες αναλυτικής και εμπειρία στη διαχείριση δεδομένων. Και επειδή η εξέλιξη δεν σταματά ποτέ, νέες δεξιότητες απαιτούνται για το σχεδιασμό εκπαιδευτικών εργαλείων που θα προσφέρουν και θα αλλάξουν πολλά. Η Επιστήμη των Δεδομένων (Data Science) και η Μηχανική Μάθηση (Machine Learning), ως νέες αναδυόμενες τεχνολογίες που περιλαμβάνουν σύγχρονες μεθόδους, έχουν επιδείξει εντυπωσιακά αποτελέσματα σε πολλούς επιστημονικούς και επιχειρηματικούς κλάδους αλλά και στην καθημερινή ζωή γενικότερα. Είναι κατά βάση διεπιστημονικά πεδία με κύριο αντικείμενο τη διαχείριση, ανάλυση, επεξεργασία και εξαγωγή γνώσης από δεδομένα σε δομημένη ή σε αδόμητη μορφή. Η R από την άλλη, είναι μια γλώσσα προγραμματισμού ανοιχτού κώδικα που χρησιμοποιείται για τη στατιστική ανάλυση δεδομένων, η οποία έχει γίνει πολύ δημοφιλής τα τελευταία χρόνια. Ταυτόχρονα το λογισμικό της R διαθέτει έναν μεγάλο αριθμό γραφικών παραστάσεων για την οπτικοποίηση και παρατήρηση των δεδομένων.