Dai dati “crudi” annotati in corsia nelle cartelle cliniche a “grafi” e relazioni in grado di generare automaticamente diagnosi specifiche e trattamenti mirati. E’ questo l’obiettivo della collaborazione avviata da Oracle Italia con il Dipartimento di Ingegneria Elettrica e delle Tecnologie dell’Informazione dell’Università di Napoli Federico II, che punta a realizzare un progetto di ricerca mettendo in opera le più recenti tecniche di “Graph Machine Learning” e Intelligenza artificiale.
Dal dato grezzo a informazioni sanitarie
La progressiva digitalizzazione di referti, cartelle e fascicoli sanitari ha portato e porterà a una maggiore accessibilità ai documenti di refertazione o di ricerca. Ma ciò che davvero rivoluzionerà l’attività medica la ricerca o la gestione del servizio – si legge in una nota – “sarà la capacità di poter rendere accessibile l’esperienza medica e diagnostica contenuta all’interno di questo oceano di documenti, sia a programmi software sia agli utenti stessi dei servizi”.
Telemedicina: come attivare una valida rete ospedale-medici-territorio
Si tratta di identificare tecnologie e metodi in grado di individuare automaticamente – tra i termini usati nel referto – il sintomo, la patologia associata, il farmaco e l’effetto prodotto attraverso un trattamento su quella patologia, e di farlo potenzialmente in scala, ovvero su tutti i documenti digitali prodotti dalle strutture di ricovero, di diagnostica, o di ricerca.
Si tratta di un processo di “scansione” applicabile a documenti creati senza nessuna strutturazione che permetta di descrivere a priori quale termine sia un “farmaco”, quale un “trattamento”, quale una “terapia”.
Gli obiettivi del progetto Oracle-Federico II
Il progetto, sostenuto tramite Oracle Labs, può creare nuove opportunità per una Sanità 4.0 in grado di sfruttare pienamente le tecnologie più evolute estraendo dalle enormi quantità di dati in suo possesso, attualmente non disponibili perché conservati con modalità poco o per niente strutturate – informazioni e correlazioni di valore, con cui migliorare la capacità di riconoscere, trattare e prevenire le patologie.
Diagnosi, trattamenti prescritti, risultati, sintomi: sono dati che, grazie al progetto potranno essere utilizzati nel rispetto della privacy entrando a pieno titolo nel patrimonio informativo a disposizione per una piena digitalizzazione dei processi sanitari e per offrire al personale sanitario e di ricerca una fonte preziosa di dati da usare nei percorsi di cura.
In cosa consiste la “traduzione” del dato
Il team di ricerca sta lavorando per applicare le tecnologie di data science più evolute; prima di tutto con l’obiettivo di riorganizzare il contenuto informativo di questi documenti – spesso annotati velocemente in corsia, con abbondante uso di termini specialistici e abbreviazioni – in grafi, entità, relazioni che li rendano utilizzabili per un’analisi dei dati automatica, per estrarre indicatori specifici individuati di volta in volta. L’obiettivo finale è quello di realizzare un sistema navigabile e utilizzabile in linguaggio naturale, potendo anche “addestrare” assistenti digitali da usare in servizi disponibili da remoto, come ad esempio i servizi di tele-assistenza.
Ecco come lavora il “grafo di conoscenza”
Un ulteriore vantaggio dello sviluppo di tecniche di “estrazione delle informazioni” sarà la possibilità di realizzare cartelle cliniche elettroniche di formato nuovo, che richiedano meno campi di inserimento dati e quindi offrano…

