Ανάλυση συναισθήματος σε ελληνικό κείμενο με χρήση αλγόριθμων μηχανικής μάθησης
Sentiment analysis of greek text using machine learning algorithms
Πτυχιακή εργασία
Συγγραφέας
Λιουδάκης, Μιχαήλ
Αλεξανδράκης, Ελευθέριος
Ημερομηνία
2017-09Επιβλέπων
Πρεζεράκος, ΓεώργιοςΘεματική επικεφαλίδα
TPSH::Επιστήμη Υπολογιστών::Τεχνητή ΝοημοσύνηΛέξεις κλειδιά
Ανάλυση συναισθήματος ; Αλγόριθμοι ταξινόμησης ; Πολικότητα κειμένου ; Feature extraction ; Μηχανική μάθησηΠερίληψη
Στόχος της πτυχιακής αυτής είναι η ανάλυση συναισθήματος σε ελληνικό κείμενο, το οποίο έχει εξαχθεί από κοινωνικά δίκτυα. Συγκεκριμένα, μελετήθηκαν διάφορες τεχνικές για την επίτευξη του στόχου αυτού με την χρήση δύο σετ δεδομένων – ένα κύριο και ένα βοηθητικό. Το βοηθητικό σετ δεδομένων, το οποίο περιείχε αγγλικά κείμενα, χρησιμοποιήθηκε για την εξαγωγή χρήσιμων συμπερασμάτων ως προς την συμπεριφορά του συστήματος αλλά και την επιλογή σημαντικών παραμέτρων. Το κύριο σετ δεδομένων χρησιμοποιήθηκε ως τελική αξιολόγηση του συστήματος, καθώς τα δεδομένα του ήταν στα ελληνικά. Όλα τα δεδομένα, εξήχθησαν από ένα κοινωνικό δίκτυο (Twitter) και βαθμονομήθηκαν ως προς το συναίσθημα που φέρουν με κάποια ετικέτα. Τα ετικετοποιημένα, πλέον, δεδομένα εισήχθησαν στο σύστημα με σκοπό την εκπαίδευσή του. Έπειτα, το σύστημα αξιολογήθηκε με συγκεκριμένες μετρικές ως προς την επίδοσή του να προβλέπει άγνωστα δεδομένα για το συναίσθημα που φέρουν. Τέλος, γίνεται μια προσπάθεια κατασκευής ενός δεύτερου συστήματος που παράγει διαφορετικά αποτελέσματα με μια τελείως διαφορετική προσέγγιση. Σκοπός είναι η μελλοντική συγχώνευσή του με το υπάρχον σύστημα για την περαιτέρω βελτίωση της απόδοσης.
Περίληψη
The present thesis concerns the development of sentiment analysis in a Greek context, extracted from social media. For that purpose, different techniques were examined by using two different datasets, a main and a supporting one. The supporting dataset, which contained English texts, was used to extract useful outcomes regarding system’s behavior and the choice of important parameters. The main dataset was used as a final evaluation of the system, as its data were consisted by Greek text. Every text, was extracted from social media (Twitter) and was labeled according to their sentiment conveyed. Labeled data were inserted to system so as to be trained. Afterwards, the system was evaluated with specific metrics for its performance to predict unlabeled data for the sentiment conveyed. Finally, there is an attempt for a construction of a second system, which outputs different outcomes with a totally different approach. The aim is the future merge with the current system for further boost of its performance.
Αριθμός σελίδων
69Σχολή
Σχολή Τεχνολογικών ΕφαρμογώνΑκαδημαϊκό Τμήμα
Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστικών Συστημάτων Τ.Ε.Γλώσσα
ΕλληνικάΟι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: