GeMEB è un framework che permette all’utente di ricercare informazioni all’interno delle normative tecniche in modo conversazionale. L’utente pone una domanda in linguaggio naturale e riceve una risposta sempre in linguaggio naturale. Questo è possibile attraverso la combinazione di tecniche di Information Retrieval e di modelli linguistici generativi (LLM) open-source. 

GeMEB è stato pensato per essere usato all’interno di una rete locale aziendale e su workstation di fascia media così da avere il massimo controllo dei costi e soprattutto dei propri dati che non vengono mai ceduti a enti terzi o servizi esterni. Inoltre, nel suo utilizzo quotidiano GeMEB garantisce la massima trasparenza fornendo sempre all’utente le fonti della risposta ricevuta così che quest’ultima possa essere sempre verificata. Infine, è previsto anche un meccanismo di votazione e di feedback delle risposte ricevute così da poter monitorare nel tempo le performance ed eventuale applicare modifiche e/o correzioni.

Scarica versione PDF
Laboratorio
Referenti
silvia prodi
Area di specializzazione
Digitale
Keyword
Intelligenza Artificiale
Normative tecniche
Software safety-critical
Large Language Models
GeMEB è il framework specializzato nella consultazione delle normative tecniche vigenti
Descrizione

Il framework GeMEB è costituito da tre macro-componenti tecnologiche:

  • Sistema di Retrieval-Augmented Generation (RAG): questo sistema effettua una ricerca nelle normative partendo dalla domanda posta dall’utente e restituisce almeno tre passaggi estratti dalle normative stesse. La ricerca viene effettuata combinando la tecnologia dei vettori semantici con quella dell’analisi delle parole chiave. Inoltre, nell’effettuare la ricerca questo sistema tiene conto non solo l’ultima domanda ricevuta ma anche i due scambi precedenti così avere una sorta di “memoria a breve termine” e garantire un’esperienza più conversazionale;
  • Large Language Model: questo modello consente di rispondere in linguaggio naturale alla domanda dell’utente sfruttando i risultati della ricerca del sistema RAG. Il modello utilizzato è di tipo open-weights e prima della fase di deployment è stato sottoposto a una fase di fine-tuning per ridurre la genericità delle risposte e migliorare le sue performance sull’utilizzo del gergo ferroviario;
  • Interfaccia grafica: questa permette all’utente di interagire in modo semplice e intuitivo con il modello. Per ogni risposta ricevuta l’utente ha la possibilità di esplorarne le fonti, di dare un voto su una scala da 1 a 4 e di lasciare un commento di feedback in linguaggio naturale. È stata sviluppata usando tecnologie all’avanguardia come Flask, Filament (Laravel) e javaScript che garantiscono un’alta accessibilità e una fluida esperienza di utilizzo.
Aspetti innovativi

I punti di forza di GeMEB sono: 

  • Modularità: il sistema è costituito da singole componenti che posso essere sostituite e aggiornate in modo veloce e trasparente verso l’utente. In questo modo possiamo mantenere l’intero sistema aggiornato rispetto alle continue evoluzioni tecnologiche;
  • Trasferibilità: il sistema è pensato per essere facilmente adattato ad varie normative, infatti, tutti i meccanismi sono data-agnostic o comunque velocemente adattabili ad altri dati di input;
  • Sistema di supporto all’annotazione: GeMEB ha un software-companion chiamato GeDI (GeMEB Data Input) che permette di creare dei dataset per il fine-tuning partendo da documenti in pdf. Questo permette l’annotazione delle normative e di creare un dataset di domande-risposte-contesto usato per personalizzare il LLM;
  • Privacy dei dati: GeMEB è stato pensato per avere il controllo su tutto il flusso dei dati, sia quelli interni sia quelli di clienti/fornitori. Infatti, i dati non escono dalla rete aziendale e non sono condivisi con servizi esterni. Inoltre, questo permette anche di avere un controllo più fine dei costi di utilizzo e delle performance del framework.
Applicazioni

Il prodotto così implementato si applica al contesto di sviluppo e testing di prodotti in ambito ferroviario. Altri possibili ambiti di applicazione sono la consultazione di normative tecniche di altri ambiti come quello automotive, biomedicale o del trasporto di sostanze pericolose.

In generale, il framework è facilmente applicabile a tutti quei settori in cui è richiesto il rispetto di una normativa tecnica. Mentre, con delle modifiche minime, il framework può essere utilizzato come strumento per interrogare un qualsiasi set di documenti aziendali.

Dashboard iniziale GeMEB
Esempio di applicazione

Uso di GeMEB per l’interrogazione delle specifiche UNISIG

Descrizione applicazione e risultati

Il framework è stato testato e usato per consultare le normative emesse dal consorzio UNISIG nell’ambito di attività di supporto alla gestione di un prodotto nel contesto ERTMS (European Rail Traffic Management System). Secondo gli utenti, nella sua versione attuale, GeMEB si è rilevato un utile alleato in tutti quei casi in cui c’era la necessità di ricercare velocemente delle informazioni nella normativa e ricevere una breve risposta esplicativa. In questo contesto GeMEB ha ottenuto un punteggio medio di soddisfazione pari a 3.21 (su una scala da 1 a 4) indicando quindi un buon livello di apprezzamento. Tra i feedback positivi troviamo la puntualità delle risposte, la capacità di gestire una breve conversazioni, la facilità di utilizzo e la possibilità di avere sempre sotto controllo le fonti mentre tra quelli negativi la presenza di risposte troppo coincise e di alcune ricerche che non andate a buon fine. 

Partner coinvolti

MeXage s.r.l.

Università degli Studi di Bologna

Bi-Rex

Tempi di realizzazione
1 mese/uomo
Livello di maturità tecnologica
TRL 7 - prototipo dimostrativo in ambiente operativo
Valorizzazione applicazione

Sono in corso attività di promozione attraverso canali di comunicazione quali internet, articoli e comunicazione a convegni.

Interfaccia di una chat
Data pubblicazione