Chord Builder: A Rapid Music Dataset Generation Tool for Automatic Chord Recognition

Διπλωματική Εργασία uoadl:3421648 7 Αναγνώσεις

Μονάδα:
Κατεύθυνση / ειδίκευση Διαχείριση Πληροφορίας και Δεδομένων (ΔΕΔ)
Πληροφορική
Ημερομηνία κατάθεσης:
2024-12-16
Έτος εκπόνησης:
2024
Συγγραφέας:
Βαγενάς Σάββας
Στοιχεία επιβλεπόντων καθηγητών:
Βασίλης Κατσούρος, Διευθυντής Ερευνών, Ινστιτούτο Επεξεργασίας του Λόγου, Ερευνητικό Κέντρο Αθηνά
Μάξιμος Καλιακάτσος-Παπακώστας, Αναπληρωτής Καθηγητής, Τμήμα Μουσικής Τεχνολογίας και Ακουστικής, Ελληνικό Μεσογειακό Πανεπιστήμιο
Ιωάννης Εμίρης Καθηγητής, Τμήμα Πληροφορικής και Τηλεπικοινωνιών, ΕΚΠΑ
Πρωτότυπος Τίτλος:
Chord Builder: A Rapid Music Dataset Generation Tool for Automatic Chord Recognition
Γλώσσες εργασίας:
Αγγλικά
Ελληνικά
Μεταφρασμένος τίτλος:
Chord Builder: Ένα Eργαλείο Tαχείας Δημιουργίας Μουσικών Δεδομένων για Αυτόματη Αναγνώριση Συγχορδιών.
Περίληψη:
Η παρούσα διπλωματική εργασία εξετάζει ένα κεντρικό πρόβλημα στον τομέα της Ανάκτη-
σης Μουσικής Πληροφορίας (MIR), την Αυτόματη Αναγνώριση Συγχορδιών (ACR). Αν και
έχουν εξεταστεί διάφορες προσεγγίσεις, η έλλειψη επισημειωμένων μουσικών δεδομένων
περιορίζει την αποτελεσματική εκπαίδευση μοντέλων, ειδικά στον τομέα της συμβολικής
μουσικής.
Για την αντιμετώπιση αυτού του ζητήματος, αναπτύξαμε το εργαλείο Chord Builder, το
οποίο επιτρέπει τη γρήγορη δημιουργία προσαρμόσιμων, επισημειωμένων συνόλων δε-
δομένων. Οι χρήστες μπορούν να καθορίσουν παραμέτρους, όπως κλίμακα, βαθμίδες,
τύπο συγχορδίας και εύρος οκτάβας, διευκολύνοντας τη δημιουργία συνόλων δεδομένων
προσαρμοσμένων στις ερευνητικές τους ανάγκες. Η αποτελεσματικότητά του αξιολογή-
θηκε με τη χρήση του δικτύου Harmony Transformer 2, το οποίο διακρίνεται στις εργασίες
ανίχνευσης αλλαγής συγχορδιών και αναγνώρισης συγχορδιών για συμβολικά δεδομένα
μουσικής, με χρήση 11 συνόλων δεδομένων αυξανόμενης πολυπλοκότητας.
Η τεχνική της παραγωγής μοντέλου (model inference) εφαρμόστηκε επίσης στα πραγμα-
τικά μουσικά δεδομένα των Σονάτων για πιάνο του Μπετόβεν (BPS-FH), αποκαλύπτοντας
ότι το προεκπαιδευμένο δίκτυο πέτυχε καλύτερη απόδοση στην ανίχνευση αλλαγής συγ-
χορδιών σε σχέση με το δίκτυο που ήταν απ’ευθείας εκπαίδευμένο στα δεδομένα BPS-FH.
Παρότι τα αποτελέσματα στην αναγνώριση συγχορδιών ήταν μικρότερης ακρίβειας, δεν
παύουν να παρουσιάζουν ιδιαίτερο ενδιαφέρον και υποδεικνύουν πολλά υποσχόμενες κα-
τευθύνσεις για μελλοντική έρευνα.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
Ανάκτηση Μουσικής Πληροφορίας, Αρχιτεκτονική Δικτύου Μετασχηματιστή, Συμβολικά Μουσικά Δεδομένα, Δημιουργία Επισημειωμένων Μουσικών Συνόλων Δεδομένων, Μοντέλος Παραγωγής Μάθησης
Ευρετήριο:
Όχι
Αρ. σελίδων ευρετηρίου:
0
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
32
Αριθμός σελίδων:
78
ACR_Thesis-Savvas_Vagenas.pdf (1 MB) Άνοιγμα σε νέο παράθυρο