Μονάδα:
Τμήμα Πληροφορικής & ΤηλεπικοινωνιώνΠληροφορική
Ημερομηνία κατάθεσης:
2025-03-28
Συγγραφέας:
Κωστής Δημήτριος-Σταύρος
Στοιχεία επιβλεπόντων καθηγητών:
Μανόλης Κουμπαράκης, Καθηγητής, Τμήμα Πληροφορικής και Τηλεπικοινωνιών, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Πρωτότυπος Τίτλος:
Retrieval-Augmented Generation with Geospatial Search: Optimizing Spatial Data Retrieval through Embeddings and Vector Search
Γλώσσες εργασίας:
Αγγλικά
Μεταφρασμένος τίτλος:
Retrieval-Augmented Generation με Γεωχωρική Αναζήτηση – Βελτιστοποίηση της Ανάκτησης Χωρικών Δεδομένων μέσω Embeddings και Διανυσματικής Αναζήτησης
Περίληψη:
Η ενσωμάτωση του Retrieval-Augmented Generation (RAG) στη γεωχωρική
αναζήτηση παρουσιάζει μια καινοτόμο προσέγγιση για τη βελτίωση της
ακρίβειας και της συνάφειας των απαντήσεων που παράγονται από την τεχνητή
νοημοσύνη σε ερωτήματα που βασίζονται σε τοποθεσίες. Ενώ τα παραδοσιακά
generative μοντέλα βασίζονται αποκλειστικά σε προεκπαιδευμένη γνώση, το
RAG ανακτά και ενσωματώνει δυναμικά εξωτερικές πληροφορίες,
διασφαλίζοντας πιο συμφραστικά τεκμηριωμένες και επικαιροποιημένες
απαντήσεις. Αυτή η εργασία εστιάζει στη βελτιστοποίηση των μηχανισμών
γεωχωρικής ανάκτησης εντός του πλαισίου RAG, αξιοποιώντας αναζήτηση
βασισμένη σε διανύσματα, embeddings και τεχνικές χωρικής ευρετηρίασης για
τη βελτίωση της ακρίβειας ανάκτησης σε γεωχωρικά σύνολα δεδομένων.
Για την επίτευξη αυτού του στόχου, η μελέτη υλοποιεί μεθόδους γεωχωρικής
ευρετηρίασης, όπως η 2dsphere indexing, που επιτρέπουν αποδοτικές
αναζητήσεις βάσει εγγύτητας και χωρικό φιλτράρισμα. Επιπλέον, εφαρμόζονται
τεχνικές επεξεργασίας φυσικής γλώσσας (NLP) για την κατανόηση των
ερωτημάτων των χρηστών, διασφαλίζοντας την ομαλή ενσωμάτωση μεταξύ
κειμενικών και γεωγραφικών δεδομένων. Το προτεινόμενο σύστημα επιτρέπει
την ανάκτηση δομημένων πληροφοριών τοποθεσίας, κατατάσσοντας τα
αποτελέσματα με βάση τόσο τη σημασιολογική ομοιότητα όσο και τη γεωχωρική
συνάφεια.
Η παρούσα εργασία αποδεικνύει την αποδοτικότητα της ανάκτησης μέσω
embeddings και αναζήτησης με διανύσματα (vector search) σε γεωχωρικά
πλαίσια, αναδεικνύοντας βελτιώσεις στην ταχύτητα επεξεργασίας ερωτημάτων,
την ακρίβεια τοποθεσίας και τη συνοχή των απαντήσεων. Αυτές οι τεχνολογίες
συμβάλλουν στην εξέλιξη των εφαρμογών τεχνητής νοημοσύνης που
λαμβάνουν υπόψη τη γεωγραφική τοποθεσία, όπως τα γεωγραφικά
πληροφοριακά συστήματα (GIS), τα συστήματα προτάσεων και η ανάλυση
χωρικών δεδομένων. Μελλοντική έρευνα θα επικεντρωθεί στη δυνατότητα
κλιμάκωσης, σε προσαρμοστικούς μηχανισμούς ανάκτησης και σε επεξεργασία
σε πραγματικό χρόνο για δυναμικά περιβάλλοντα αναζήτησης βάσει
τοποθεσίας.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
Παραγωγή Κειμένου Υποβοηθούμενη από Ανάκτηση, Γεωχωρική Αναζήτηση, Διανυσματική Αναζήτηση, Ευρετηρίαση 2dsphere, Ανάκτηση Χωρικών Δεδομένων, Επεξεργασία Φυσικής Γλώσσας, Μεγάλα Γλωσσικά Μοντέλα
Αρ. σελίδων ευρετηρίου:
3
Αρ. βιβλιογραφικών αναφορών:
19