Le tecnologie di intelligenza artificiale applicate al patrimonio culturale
Il patrimonio culturale italiano, con la sua pluralità di origini culturali e la forte capillarità sul territorio, pone diverse sfide in termini di gestione, fruizione e accessibilità. Le tecnologie innovative come l’intelligenza artificiale, all’interno di un più ampio processo di transizione digitale, sono un utile strumento per rispondere a queste sfide.
I.PaC, quale infrastruttura software progettata per ospitare i dati digitali del patrimonio culturale nazionale, mette a disposizione un ampio catalogo di servizi, inclusi quelli basati sull’intelligenza artificiale (IA).
I modelli di IA impiegati in I.PaC permettono estrarre dati dalle risorse digitali arricchendo in tal modo le descrizioni dei beni e facilitando l’elaborazione e la messa in relazione delle informazioni sul patrimonio presenti nei Grafi di conoscenza dello spazio dati nazionale.
Sfruttando l’IA, I.PaC offre ai soggetti che detengono il patrimonio i servizi utili per valorizzare e rendere accessibili le proprie risorse.
IA in “Gestione e processamento delle risorse digitali”
Tra i diversi servizi, I.PaC mette a disposizione quelli di content processing avanzato, che impiegano diversi modelli di IA per l’elaborazione avanzata di contenuti, dal Machine Learning all’intelligenza artificiale generativa. Nello specifico:
- l’elaboratore di testi permette di analizzare le risorse testuali (monografie e periodici) per estrarre il testo, la tavola dei contenuti, la sequenza fisica dei media che compongono la risorsa, gli argomenti, le entità citate e creare un abstract della risorsa;
- l’elaboratore di audio e video consente di analizzare il contenuto di risorse audio e video per estrarre il testo, gli argomenti, le entità citate e creare un abstract della risorsa con relativa riproduzione audio;
- l’elaboratore di immagini rende possibile l’analisi delle immagini per estrarne il soggetto principale, le altre entità riconosciute e creare una descrizione testuale della risorsa con relativa riproduzione audio; inoltre, suggerisce le relazioni con altri beni simili o uguali;
- l’elaboratore di cartografie permette di estrarre informazioni strutturate (luoghi, elementi di rilievo, scala, particelle catastali, etc.) da mappe e carte geografiche, e collegare tali entità a quelle geografiche del grafo.
- l’elaboratore di spartiti musicali trascrivere la notazione di uno spartito in formati XML standard e consente di riprodurre la notazione in musica;
- l’elaboratore di schede di catalogo cartacee restituisce l’analisi delle digitalizzazioni di tali schede, riconosce le entità presenti e mappa le relative informazioni su un modello dati definito.
AI in “grafi di dominio e cross-dominio”
Nell’ambito dei grafi di I.PaC, una delle sfide principali è la riconciliazione dei dati provenienti da fonti diverse. Un esempio comune è rappresentato dall’ entità “Agente” (ad es. Leonardo Da Vinci) che identifica artisti, scrittori, compositori. Questi possono essere registrati in diversi sistemi con più identificatori, moltiplicando in questo modo le entità per uno stesso agente. Per riconciliarli, vengono impiegati algoritmi di intelligenza artificiale che identificano le entità in base alle informazioni a disposizione, come la biografia, lo stile, le qualifiche o i temi artistici affrontati. Questi modelli di IA consentono inoltre di suggerire potenziali corrispondenze tra gli agenti presenti, superando le limitazioni dovute in alcuni casi alla mancanza di dati dettagliati.
IA Generativa per migliorare la navigazione dei portali
Tra gli altri servizi di IA offerti da I.PaC, c’è la realizzazione di chatbot per la navigazione dei portali. Tali chatbot:
- usano la tecnologia RAG (Retrieval Augmented Generation) per navigare dati RDF e facilitare l’accesso e il recupero delle informazioni;
- permettono di trasformare domande dal linguaggio naturale in query sparql;
- consentono l’individuazione di percorsi di approfondimento tramite la navigazione del grafo RDF.
Un esempio tangibile è Alphy, chatbot progettato per facilitare la fruizione del portale Alphabetica, realizzato da I.PaC per l’Istituto Centrale per il Catalogo Unico delle Biblioteche Italiane (ICCU).
È in corso di sviluppo un ulteriore chatbot che faciliterà la navigazione del Catalogo Generale del Patrimonio Culturale, permettendo la fruizione di dati sulla proprietà culturale provenienti da istituzioni e luoghi della cultura.