Ανάλυση συναισθήματος σε ελληνικό κείμενο με χρήση αλγόριθμων μηχανικής μάθησης
Sentiment analysis of greek text using machine learning algorithms
Πτυχιακή εργασία
Author
Λιουδάκης, Μιχαήλ
Αλεξανδράκης, Ελευθέριος
Date
2017-09Advisor
Πρεζεράκος, ΓεώργιοςKeywords
Ανάλυση συναισθήματος ; Αλγόριθμοι ταξινόμησης ; Πολικότητα κειμένου ; Feature extraction ; Μηχανική μάθησηAbstract
Στόχος της πτυχιακής αυτής είναι η ανάλυση συναισθήματος σε ελληνικό κείμενο, το οποίο έχει εξαχθεί από κοινωνικά δίκτυα. Συγκεκριμένα, μελετήθηκαν διάφορες τεχνικές για την επίτευξη του στόχου αυτού με την χρήση δύο σετ δεδομένων – ένα κύριο και ένα βοηθητικό. Το βοηθητικό σετ δεδομένων, το οποίο περιείχε αγγλικά κείμενα, χρησιμοποιήθηκε για την εξαγωγή χρήσιμων συμπερασμάτων ως προς την συμπεριφορά του συστήματος αλλά και την επιλογή σημαντικών παραμέτρων. Το κύριο σετ δεδομένων χρησιμοποιήθηκε ως τελική αξιολόγηση του συστήματος, καθώς τα δεδομένα του ήταν στα ελληνικά. Όλα τα δεδομένα, εξήχθησαν από ένα κοινωνικό δίκτυο (Twitter) και βαθμονομήθηκαν ως προς το συναίσθημα που φέρουν με κάποια ετικέτα. Τα ετικετοποιημένα, πλέον, δεδομένα εισήχθησαν στο σύστημα με σκοπό την εκπαίδευσή του. Έπειτα, το σύστημα αξιολογήθηκε με συγκεκριμένες μετρικές ως προς την επίδοσή του να προβλέπει άγνωστα δεδομένα για το συναίσθημα που φέρουν. Τέλος, γίνεται μια προσπάθεια κατασκευής ενός δεύτερου συστήματος που παράγει διαφορετικά αποτελέσματα με μια τελείως διαφορετική προσέγγιση. Σκοπός είναι η μελλοντική συγχώνευσή του με το υπάρχον σύστημα για την περαιτέρω βελτίωση της απόδοσης.
Abstract
The present thesis concerns the development of sentiment analysis in a Greek context, extracted from social media. For that purpose, different techniques were examined by using two different datasets, a main and a supporting one. The supporting dataset, which contained English texts, was used to extract useful outcomes regarding system’s behavior and the choice of important parameters. The main dataset was used as a final evaluation of the system, as its data were consisted by Greek text. Every text, was extracted from social media (Twitter) and was labeled according to their sentiment conveyed. Labeled data were inserted to system so as to be trained. Afterwards, the system was evaluated with specific metrics for its performance to predict unlabeled data for the sentiment conveyed. Finally, there is an attempt for a construction of a second system, which outputs different outcomes with a totally different approach. The aim is the future merge with the current system for further boost of its performance.
Number of pages
69Faculty
Σχολή Τεχνολογικών ΕφαρμογώνAcademic Department
Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστικών Συστημάτων Τ.Ε.Language
GreekThe following license files are associated with this item: