HT CHALLENGE 2019

EMBEDDING PROPAGATION PER APPLICAZIONI DI MACHINE LEARNING SU CARTELLE CLINICHE ELETTRONICHE

EMBEDDING PROPAGATION PER APPLICAZIONI DI MACHINE LEARNING SU CARTELLE CLINICHE ELETTRONICHE  

AUTORE PRINCIPALE
Giampaolo Pileggi

AFFILIAZIONE
NEC Laboratories Europe GmbH

VALUTA IL CHALLENGE

Vota

GRUPPO DI LAVORO
Brandon Malone – NEC Laboratories Europe GmbH, Germania
Giampaolo Pileggi – NEC Laboratories Europe GmbH, Baden-Wurttemberg
Saverio Niccolini – NEC Laboratories Europe GmbH, Baden-Wurttemberg

AREA TEMATICA
Sviluppo di tecnologie e dispositivi per la salute

ABSTRACT

Introduzione

Negli ultimi anni l’interesse degli operatori sanitari verso il Machine Learning (ML) è notevolmente cresciuto poiché algoritmi di questo tipo permettono di combinare il potenziale informativo di dati multimodali (immagini serie temporali annotazioni mediche) apparentemente slegati tra loro per far emergere correlazioni normalmente non osservabili e generare così predizioni accurate. Tuttavia molti di questi dataset sono spesso incompleti e quindi affinché vengano generate predizioni affidabili è necessario elaborare opportune contromisure. In questa challenge presentiamo Embedding Propagation (EP) l’algoritmo sviluppato da NEC Laboratories Europe per effettuare operazioni di classificazione e regressione su database multimodali anche nel caso essi siano incompleti e/o sparsi.

Materiali e metodi

Dalle cartelle cliniche digitali (CCD) i dati dei pazienti vengono utilizzati per generare un grafo di conoscenza in cui ogni paziente rappresenta un nodo; successivamente per ogni nodo tutte le informazioni multimodali (che sono incomplete nei vari pazienti) vengono condensate in un solo vettore (embedding); tutti i nodi vicini vengono utilizzati per creare un embedding del nodo di interesse ed i valori vengono ottimizzati iterativamente tramite minimizazione della differenza tra i due embedding; l’informazione e la minimizzazione dell’errore vengono propagate tra i nodi vicini in modo iterativo ed al termine del processo si otterrà per ogni nodo un embedding in cui le informazioni mancanti sono state dedotte dall’algoritmo.

EP è stato testato su tre casi d’uso di algoritmi ML standard: previsione durata degenza (regressione) predizione di riammission di infarto dopo 10 anni e predizioni di mortalità dopo 2 giorni in Terapia Intesiva (entrambi classificazione binaria); per ognuno di questi problemi sono stati usati tre dataset diversi tutti multimodali sparsi ed incompleti; per ogni caso d’uso si sono confrontati i risultati dell’algoritmo sul dataset con e senza embedding a monte.

Risultati

Nel caso d’uso di previsione sulla durata della degenza (regressione) l’errore assoluto medio (MAE) ottenuto in termini di giorni da una regressione lineare è sempre inferiore se viene effettuato un embedding tramite EP con differenze significative quando il numero di pazienti è basso (i MAE sono 5 e 3.5 per dataset senza e con embedding rispettivamente); nel caso d’uso di predizione di riammission di infarto dopo 10 anni (classificazi

 

 

Torna su »

Condividi