Ανάλυση συναισθήματος σε ελληνικό κείμενο με χρήση αλγόριθμων μηχανικής μάθησης

Λιουδάκης, Μιχαήλ; Αλεξανδράκης, Ελευθέριος

Sentiment analysis of greek text using machine learning algorithms

Πτυχιακή εργασία

Συγγραφέας

Λιουδάκης, Μιχαήλ

Αλεξανδράκης, Ελευθέριος

Ημερομηνία

2017-09

Περίληψη

Στόχος της πτυχιακής αυτής είναι η ανάλυση συναισθήματος σε ελληνικό κείμενο, το οποίο έχει εξαχθεί από κοινωνικά δίκτυα. Συγκεκριμένα, μελετήθηκαν διάφορες τεχνικές για την επίτευξη του στόχου αυτού με την χρήση δύο σετ δεδομένων – ένα κύριο και ένα βοηθητικό. Το βοηθητικό σετ δεδομένων, το οποίο περιείχε αγγλικά κείμενα, χρησιμοποιήθηκε για την εξαγωγή χρήσιμων συμπερασμάτων ως προς την συμπεριφορά του συστήματος αλλά και την επιλογή σημαντικών παραμέτρων. Το κύριο σετ δεδομένων χρησιμοποιήθηκε ως τελική αξιολόγηση του συστήματος, καθώς τα δεδομένα του ήταν στα ελληνικά. Όλα τα δεδομένα, εξήχθησαν από ένα κοινωνικό δίκτυο (Twitter) και βαθμονομήθηκαν ως προς το συναίσθημα που φέρουν με κάποια ετικέτα. Τα ετικετοποιημένα, πλέον, δεδομένα εισήχθησαν στο σύστημα με σκοπό την εκπαίδευσή του. Έπειτα, το σύστημα αξιολογήθηκε με συγκεκριμένες μετρικές ως προς την επίδοσή του να προβλέπει άγνωστα δεδομένα για το συναίσθημα που φέρουν. Τέλος, γίνεται μια προσπάθεια κατασκευής ενός δεύτερου συστήματος που παράγει διαφορετικά αποτελέσματα με μια τελείως διαφορετική προσέγγιση. Σκοπός είναι η μελλοντική συγχώνευσή του με το υπάρχον σύστημα για την περαιτέρω βελτίωση της απόδοσης.

Περίληψη

The present thesis concerns the development of sentiment analysis in a Greek context, extracted from social media. For that purpose, different techniques were examined by using two different datasets, a main and a supporting one. The supporting dataset, which contained English texts, was used to extract useful outcomes regarding system’s behavior and the choice of important parameters. The main dataset was used as a final evaluation of the system, as its data were consisted by Greek text. Every text, was extracted from social media (Twitter) and was labeled according to their sentiment conveyed. Labeled data were inserted to system so as to be trained. Afterwards, the system was evaluated with specific metrics for its performance to predict unlabeled data for the sentiment conveyed. Finally, there is an attempt for a construction of a second system, which outputs different outcomes with a totally different approach. The aim is the future merge with the current system for further boost of its performance.

Αριθμός σελίδων

Σχολή

Σχολή Τεχνολογικών Εφαρμογών

Ακαδημαϊκό Τμήμα

Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστικών Συστημάτων Τ.Ε.

Γλώσσα

Ελληνικά

URI

http://okeanis.lib2.uniwa.gr/xmlui/handle/123456789/3779

Συλλογή

Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστικών Συστημάτων Τ.Ε.

Εμφάνιση πλήρους εγγραφής

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Creative Commons

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Εκτός από όπου επισημαίνεται κάτι διαφορετικό, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα