Exploring Character Pattern Recognition Techniques: A case study for Greek Polytonic Machine-Printed Characters

Διπλωματική Εργασία uoadl:2878436 313 Αναγνώσεις

Μονάδα:
Κατεύθυνση / ειδίκευση Υπολογιστικά Συστήματα: Λογισμικό και Υλικό (ΣΥΣ)
Πληροφορική
Ημερομηνία κατάθεσης:
2019-07-11
Έτος εκπόνησης:
2019
Συγγραφέας:
Ντόνα Ριζάρτ
Στοιχεία επιβλεπόντων καθηγητών:
Σέργιος Θεοδωρίδης, Καθηγητής ΕΚΠΑ
Βασίλης Γάτος, Ερευνητής ΕΚΕΦΕ ”Δημόκριτος”
Πρωτότυπος Τίτλος:
Exploring Character Pattern Recognition Techniques: A case study for Greek Polytonic Machine-Printed Characters
Γλώσσες εργασίας:
Αγγλικά
Μεταφρασμένος τίτλος:
Εξερευνώντας Τεχνικές Αναγνώρισης Προτύπων για Χαρακτήρες: Μια μελέτη περίπτωσης για Ελληνικούς Πολυτονικούς Τυπωμένους Χαρακτήρες
Περίληψη:
Σε αυτη την διπλωματική εργασία εξερευνούμε διάφορες τεχνικές αναγνώρισης προτύπων για χαρακτήρες και παρουσιάζουμε μια μελέτη περίπτωσης για Ελληνικούς πολυτονικούς τυπωμένους χαρακτήρες όπου οι τεχνικές αυτές είναι εφαρμόσιμες. Υλοποιούμε και περιγράφουμε στατιστικές τεχνικές μηχανικής χαρακτηριστικών (feature engineering) όπως είναι ο διαχωρισμός του χαρακτήρα σε ζώνες, ο διαχωρισμός του χαρακτήρα σε προσαρμοστικές ζώνες, η εξαγωγή ιστογραμμάτων κάθετων και οριζόντιων προβολών καθώς και μια τεχνική εξαγωγής χαρακτηριστικών που βασίζεται σε αναδρομικές υποδιαιρέσεις του χαρακτήρα. Επιπλέον, υλοποιούμε και συζητάμε δύο τεχνικές κατηγοριοποίησης, η μια βασίζεται στο μοντέλο του ταιριάσματος προτύπου (template matching) και η άλλη βασίζεται στα τεχνητά νευρωνικά δίκτυα. Επιπρόσθετα, παρουσιάζουμε την υλοποιημένη σε python βιβλιοθήκη ανοικτού κώδικα που διεκπεραιώνει αυτές τις λειτουργίες μαζί με μια ενότητα για το πώς να την χρησιμοποιήσει κάποιος. Τέλος, αξιολογούμε τις προαναφερθείσες τεχνικές σε δύο διαφορετικά σύνολα δεδομένων που περιέχουν Ελληνικούς πολυτονικούς χαρακτήρες και παρουσιάζουμε τα αποτελέσματα μας για όσον αφορά την απόδοση των μεθόδων μας.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
Οπτική Αναγνώριση Χαρακτήρων, Αναγνώριση Προτύπων, Εξαγωγή Χαρακτηριστικών, Κατηγοριοποίηση Χαρακτήρων, Τεχνητά Νευρωνικά Δίκτυα, Ελληνικοί Πολυτονικοί Χαρακτήρες
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
3
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
27
Αριθμός σελίδων:
37