AIIC AWARDS 2022

MACHINE LEARNING, SUPERVISED LEARNING: UN SEMPLICE METODO PER DIAGNOSTICARE IL COVID-19 TRAMITE ANALISI EMATOCHIMICHE.

AFFILIAZIONE
asst dei sette laghi

AUTORE PRINCIPALE
Ing. Salerno Piergiorgio

VALUTA IL CHALLENGE

Vota

GRUPPO DI LAVORO
Ing. Salerno Piergiorgio – asst dei sette laghi, varese
Ing. Zadenoori Mohammad Amin – università degli studi di firenze, firenze
Ing. Poggialini Giovanni – , varese
Ing. Iadanza Ernesto – università degli studi di siena, siena
Eng Fregonara Medici Mario – asst dei sette laghi, varese

AREA TEMATICA
Applicazioni innovative di bioingegneria

ABSTRACT
Obiettivi:I sistemi sanitari di tutto il mondo sono stati messi a dura prova nell’affrontare la pandemia della SARS Covid-19. Enormi spese sono state sostenute dagli ospedali e dalle strutture sanitarie per diagnosticare l’infezione dal virus tramite Test Molecolari processati attraverso RT-PCR, considerato dall’OMS il gold standard diagnostico, con tassi di falsi negativi fino al 15 % – 20 %.Inoltre gli esiti diagnostici di questi test sono lenti e impattano fortemente sulla logistica e sulle risorse dei laboratori di Microbiologia. L’obbiettivo di questo lavoro è dimostrare come test ematochimici possono essere utili a discriminare i pazienti covid da quelli che non hanno contratto il virus.Metodologia:Dopo aver analizzato lo stato dell’arte in letteratura, abbiamo deciso di includere nel nostro progetto solo sette dei test ematochimici utili a predire il Covid-19 ( oltre a informazioni relative al genere ed età), per Il principio del rasoio di Occam che suggerisce che un modello che utilizza meno funzionalità è preferibile rispetto a un modello complicato. Il dataset che abbiamo estratto contiene 1854 prestazioni con le features selezionate, di utenti ricoverati dal 2018 al 2021 alla ASST dei Sette Laghi, di cui 927 istanze di pazienti positivi al tampone molecolare per la ricerca del virus Sars-Cov2 e 927 riferite a pazienti negativi . Attraverso i valori delle analisi ematochimiche abbiamo allenato modelli di machine learning a classificare pazienti positivi al covid19 da quelli sani. Oltre all’applicazione di modelli di machine learning comuni come XGBoost, Random Forest e SVM abbiamo proposto modelli ensemble che vengono allenati a classificare istanze attraverso un insieme di classificatori, e l’applicazione di modelli Stacking che contengono un diverso numero di strati di classificazione collegati tra loro. Infine mediante SHAP plot abbiamo valutato come impattano i valori delle features selezionate sulla previsione dei classificatori.Risultati:Tra i modelli implementati quello più performante è lo Stacking che raggiunge valori di AUC del 91% e F1-score di 83%.Dal modello risulta che alti valori di Ferritina, Neutrofili, Linfociciti e Piastrine impattano positivamente sulla predizione del Covid19.Questo lavoro potrebbe essere utile alle strutture ospedaliere dotate di Pronto Soccorso per lo screening dei pazienti in ingresso ed offre anche una valida alternativa a quelle Strutture sanitarie che non hanno la possibilità di eseguire test PCR.

 

 

Torna su »

Condividi