Πρόβλεψη του ρυθμού των κλικ ως συνιστώσας συστημάτων δημοπρασιών πραγματικού χρόνου

Τα τελευταία χρόνια, όπως και σχεδόν κάθε τομέας της κοινωνίας, έτσι και η διαφήμιση, έχει αναμορφωθεί από το διαδίκτυο. Με τα περισσότερα διαφημιστικά κέρδη να προέρχονται πλέον από αυτό, η αυξανόμενη ενασχόληση και έρευνα έχουν οδηγήσει - εκτός των κλασικών διαδυκτιακών διαφημίσεων - στην δημιουργ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Σταθόπουλος, Ευστάθιος - Κωνσταντίνος
Άλλοι συγγραφείς: Stathopoulos, Efstathios - Konstantinos
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15684
id nemertes-10889-15684
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Πρόβλεψη ρυθμού των κλικ
Δημοπρασίες πραγματικού χρόνου
Μηχανική μάθηση
Clixk through rate prediction
Real time bidding
Machine learning
spellingShingle Πρόβλεψη ρυθμού των κλικ
Δημοπρασίες πραγματικού χρόνου
Μηχανική μάθηση
Clixk through rate prediction
Real time bidding
Machine learning
Σταθόπουλος, Ευστάθιος - Κωνσταντίνος
Πρόβλεψη του ρυθμού των κλικ ως συνιστώσας συστημάτων δημοπρασιών πραγματικού χρόνου
description Τα τελευταία χρόνια, όπως και σχεδόν κάθε τομέας της κοινωνίας, έτσι και η διαφήμιση, έχει αναμορφωθεί από το διαδίκτυο. Με τα περισσότερα διαφημιστικά κέρδη να προέρχονται πλέον από αυτό, η αυξανόμενη ενασχόληση και έρευνα έχουν οδηγήσει - εκτός των κλασικών διαδυκτιακών διαφημίσεων - στην δημιουργία συστημάτων όπως αυτό των Δημοπρασιών Πραγματικού Χρόνου, ή ΔΠΧ (Real Time Bidding, RTB). Πρόκειται για έναν αυτοματοποιημένο μηχανισμό, ο οποίος χρησιμοποιεί αλγορίθμους ανεπτυγμένους από τους διαφημιστές και τους εκδότες με σκοπό την απόκτηση του κατάλληλου χώρου και χρόνου για την προβολή του μηνύματός τους και την προώθηση των προϊόντων-υπηρεσιών τους. Το σύστημα αυτό είναι αρκετά πολύπλοκο. Μια πολύ σημαντική συνιστώσα του η οποία έχει κεντρίσει το ενδιαφέρον των ερευνητών τελευταία, είναι τα μοντέλα πρόβλεψης του ρυθμού με τον οποίον οι χρήστες κάνουν κλικ σε μια διαφήμιση που τους προβάλλεται (Click-Through Rate, CTR). Η παρούσα εργασία, αφού δώσει λεπτομέρειες για τον μηχανισμό των ΔΠΧ, επικεντρώνεται στην μελέτη και στην ανάπτυξη τέτοιων μοντέλων, καθώς και στην αξιολόγησή τους πάνω σε πραγματικά δεδομένα. Μοντέλα Λογιστικής Παλινδρόμησης, Μηχανών Παραγοντοποίησης, Ενίσχυσης Κλίσης Καθόδου και Βαθιάς Μηχανής Παραγοντοποίησης αναπτύσσονται, ρυθμίζονται και αξιολογούνται με διαφορετικές προσεγγίσεις, παράγοντας χρήσιμα και ενδιαφέροντα συμπεράσματα. ΄Ένα από τα βασικότερα εξ αυτών, είναι το γεγονός ότι ο ῾῾πλούτος᾿᾿ της πληροφορίας που παρέχει το κάθε σύνολο δεδομένων, επηρεάζει ιδιαίτερα την ποιότητα της προεπεξεργασίας του, η οποία με την σειρά της διαδραματίζει σημαντικό ρόλο όσον αφορά την ακρίβεια των μοντέλων. Η Μηχανή Παραγοντοποίησης παρουσιάζει γενικά τα καλύτερα αποτελέσματα, με τα υπόλοιπα μοντέλα όμως να έχουν τα δικά τους πλεονεκτήματα. Η εκπαίδευση των μοντέλων πάνω στο σύνολο των δεδομένων φαίνεται να οδηγεί συχνά σε καλύτερα αποτελέσματα, όμως η δημιουργία ομάδων των δεδομένων ανάλογα με το προφίλ του χρήστη δείχνει να μπορεί να τα βελτιώσει έστω και λίγο για συγκεκριμένες ομάδες. Προσεγγίσεις που εξισορροπούν τα σύνολα δεδομένων ως προς την μεταβλητή-στόχο φαίνεται να οδηγούν γενικά σε χειρότερα αποτελέσματα. Σε κάθε περίπτωση, περεταίρω έρευνα πάνω σε όλες τις προσεγγίσεις, κρίνεται αναγκαία.
author2 Stathopoulos, Efstathios - Konstantinos
author_facet Stathopoulos, Efstathios - Konstantinos
Σταθόπουλος, Ευστάθιος - Κωνσταντίνος
author Σταθόπουλος, Ευστάθιος - Κωνσταντίνος
author_sort Σταθόπουλος, Ευστάθιος - Κωνσταντίνος
title Πρόβλεψη του ρυθμού των κλικ ως συνιστώσας συστημάτων δημοπρασιών πραγματικού χρόνου
title_short Πρόβλεψη του ρυθμού των κλικ ως συνιστώσας συστημάτων δημοπρασιών πραγματικού χρόνου
title_full Πρόβλεψη του ρυθμού των κλικ ως συνιστώσας συστημάτων δημοπρασιών πραγματικού χρόνου
title_fullStr Πρόβλεψη του ρυθμού των κλικ ως συνιστώσας συστημάτων δημοπρασιών πραγματικού χρόνου
title_full_unstemmed Πρόβλεψη του ρυθμού των κλικ ως συνιστώσας συστημάτων δημοπρασιών πραγματικού χρόνου
title_sort πρόβλεψη του ρυθμού των κλικ ως συνιστώσας συστημάτων δημοπρασιών πραγματικού χρόνου
publishDate 2021
url http://hdl.handle.net/10889/15684
work_keys_str_mv AT stathopouloseustathioskōnstantinos problepsētourythmoutōnklikōssynistōsassystēmatōndēmoprasiōnpragmatikouchronou
AT stathopouloseustathioskōnstantinos clickthroughratepredictionasacompoundofrealtimebiddingsystems
_version_ 1771297226558013440
spelling nemertes-10889-156842022-09-05T13:57:38Z Πρόβλεψη του ρυθμού των κλικ ως συνιστώσας συστημάτων δημοπρασιών πραγματικού χρόνου Click through rate prediction as a compound of real time bidding systems Σταθόπουλος, Ευστάθιος - Κωνσταντίνος Stathopoulos, Efstathios - Konstantinos Πρόβλεψη ρυθμού των κλικ Δημοπρασίες πραγματικού χρόνου Μηχανική μάθηση Clixk through rate prediction Real time bidding Machine learning Τα τελευταία χρόνια, όπως και σχεδόν κάθε τομέας της κοινωνίας, έτσι και η διαφήμιση, έχει αναμορφωθεί από το διαδίκτυο. Με τα περισσότερα διαφημιστικά κέρδη να προέρχονται πλέον από αυτό, η αυξανόμενη ενασχόληση και έρευνα έχουν οδηγήσει - εκτός των κλασικών διαδυκτιακών διαφημίσεων - στην δημιουργία συστημάτων όπως αυτό των Δημοπρασιών Πραγματικού Χρόνου, ή ΔΠΧ (Real Time Bidding, RTB). Πρόκειται για έναν αυτοματοποιημένο μηχανισμό, ο οποίος χρησιμοποιεί αλγορίθμους ανεπτυγμένους από τους διαφημιστές και τους εκδότες με σκοπό την απόκτηση του κατάλληλου χώρου και χρόνου για την προβολή του μηνύματός τους και την προώθηση των προϊόντων-υπηρεσιών τους. Το σύστημα αυτό είναι αρκετά πολύπλοκο. Μια πολύ σημαντική συνιστώσα του η οποία έχει κεντρίσει το ενδιαφέρον των ερευνητών τελευταία, είναι τα μοντέλα πρόβλεψης του ρυθμού με τον οποίον οι χρήστες κάνουν κλικ σε μια διαφήμιση που τους προβάλλεται (Click-Through Rate, CTR). Η παρούσα εργασία, αφού δώσει λεπτομέρειες για τον μηχανισμό των ΔΠΧ, επικεντρώνεται στην μελέτη και στην ανάπτυξη τέτοιων μοντέλων, καθώς και στην αξιολόγησή τους πάνω σε πραγματικά δεδομένα. Μοντέλα Λογιστικής Παλινδρόμησης, Μηχανών Παραγοντοποίησης, Ενίσχυσης Κλίσης Καθόδου και Βαθιάς Μηχανής Παραγοντοποίησης αναπτύσσονται, ρυθμίζονται και αξιολογούνται με διαφορετικές προσεγγίσεις, παράγοντας χρήσιμα και ενδιαφέροντα συμπεράσματα. ΄Ένα από τα βασικότερα εξ αυτών, είναι το γεγονός ότι ο ῾῾πλούτος᾿᾿ της πληροφορίας που παρέχει το κάθε σύνολο δεδομένων, επηρεάζει ιδιαίτερα την ποιότητα της προεπεξεργασίας του, η οποία με την σειρά της διαδραματίζει σημαντικό ρόλο όσον αφορά την ακρίβεια των μοντέλων. Η Μηχανή Παραγοντοποίησης παρουσιάζει γενικά τα καλύτερα αποτελέσματα, με τα υπόλοιπα μοντέλα όμως να έχουν τα δικά τους πλεονεκτήματα. Η εκπαίδευση των μοντέλων πάνω στο σύνολο των δεδομένων φαίνεται να οδηγεί συχνά σε καλύτερα αποτελέσματα, όμως η δημιουργία ομάδων των δεδομένων ανάλογα με το προφίλ του χρήστη δείχνει να μπορεί να τα βελτιώσει έστω και λίγο για συγκεκριμένες ομάδες. Προσεγγίσεις που εξισορροπούν τα σύνολα δεδομένων ως προς την μεταβλητή-στόχο φαίνεται να οδηγούν γενικά σε χειρότερα αποτελέσματα. Σε κάθε περίπτωση, περεταίρω έρευνα πάνω σε όλες τις προσεγγίσεις, κρίνεται αναγκαία. Over the past few years, advertising, like almost every part of the society, has been reshaped by the internet. As the biggest part of the advertising gain now originate by it, the increasing engagement and study have resulted - besides the classic online commercials - in the creation of systems like Real Time Bidding (RTB). This system is about an automated mechanism of bidding in real time, which uses algorithms deployed by advertisers and publishers in order to provide them the suitable space and time to show their message and to promote their products-services. This system is very complicated. Click-Through Rate (CTR, the rate at which the user clicks a displayed ad) prediction models, consist a very important compound of it that has aroused the interest of many researchers lately. This thesis, after giving details about the RTB mechanism, is focused on studying and creating such models, as well as on their evaluation based on real data. Logistic Regression, Factorisation Machine, Gradient Boosting and DeepFM models are created, tuned and evaluated based on different approaches, producing useful and interesting conclusions. One of the key conclusions, is the fact that the ῾῾wealth᾿᾿ of information provided by a dataset, affects the quality of its preprocessing, which in turn plays an important role in the accuracy of the models. In general, Factorisation Machine presents the best results, but the other models offer their own advantages too. Training the models on the whole dataset seems to lead to better results, but creating clusters of data depending on the user profiles can improve them slightly for some clusters. The approaches that are based on balancing the datasets with respect to the target-variable lead to the worst results. In any case, further study on all of the approaches is necessary. 2021-12-17T06:37:05Z 2021-12-17T06:37:05Z 2021-04-05 http://hdl.handle.net/10889/15684 gr application/pdf