Inova Translational Medicine Institute ha implementato Cloudera Enterprise per analizzare un’ampia raccolta di dati clinici e genomici al fine di innovare più velocemente nell’ambito della ricerca della medicina traslazionale.
Come parte del Centro Inova per la Salute Personalizzata, il team di scienziati, ricercatori, analisti e collaboratori dell’importante istituto di ricerca medica mondiale, utilizza algoritmi di apprendimento automatico su terabyte di informazioni cliniche e genomiche con l’obiettivo di identificare i legami genetici con le malattie.
Parliamo di dati clinici raccolti da migliaia di pazienti di Inova in oltre 110 Paesi nel mondo, per una mole di dati inimmaginabile, se si considera che il solo DNA unico di una persona contiene sei miliardi di bit di informazioni.
Ma proprio la mappatura dei codici DNA degli individui nelle sequenze genomiche aiuta gli scienziati a determinare la causa delle malattie e scoprire le terapie trasformative.
Da qui la realizzazione di piani di trattamento personalizzati per i pazienti in un approccio, noto come medicina di precisione, che ha il potere di aiutare i pazienti a vivere più a lungo e ad avere una vita più sana.
Come parte di questo processo, l’ITMI sta assemblando quello che si prevede sarà uno dei più grandi database di sequenze di genomi di tutto il mondo collegato alle informazioni sui pazienti in un sistema sanitario.
«La sfida per i ricercatori e gli scienziati ITMI è stata quella di analizzare in modo più rapido ed efficiente le nostre enormi e complesse raccolte di dati grezzi e tradurre le analisi in una cura concreta del paziente. Siamo ora in grado di ottenere risposte in pochi minuti e possiamo trovare correlazioni prima inimmaginabili», ha dichiarato Aaron Black, Chief Data Officer di ITMI. “I nostri ricercatori dedicavano l’80% del loro tempo nel gestire la confusione dei dati e solo una piccola parte all’analisi degli stessi. Questa situazione si sta pian piano invertendo. Ora possiamo accelerare il ritmo della scoperta genomica e cambiare drasticamente il modo in cui interagiamo con i nostri team di ricerca. Riteniamo che questo migliorerà la nostra capacità di fornire le giuste terapie ai pazienti e, in definitiva, a migliorare i risultati”.
Analisi end-to-end dei dati: da due mesi a una settimana
La piattaforma di Cloudera ha permesso a ITMI di ottimizzare l’analisi dei dati genomici a fini diagnostici. Questa analisi dei dati genomici consente a uno scienziato di bioinformatica di studiare le correlazioni genomiche di persone con condizioni come l’artrite, le malattie autoimmuni o il cancro. In passato, data l’enorme dimensione di genomi completi, il completamento di questo processo poteva richiedere a ITMI fino a due mesi. Utilizzando Cloudera, ITMI è in grado di eseguire l’analisi end-to-end dei dati in una settimana. Per il futuro ITMI prevede di eseguire queste analisi dei dati in poche ore.
Lavorando con Cloudera, ITMI ha creato un’infrastruttura bioinformatica globale per la raccolta di dati dei genomi dell’Istituto contrapposta agli archivi clinici. L’infrastruttura è stata progettata per archiviare ed elaborare questa convergenza di dati biologici, in velocità e in modo scalabile, oggi e anche in futuro.
Il moderno database analitico di Cloudera, alimentato da Apache Impala (in fase di progettazione), fornisce analisi SQL ad elevate prestazioni per i Big data. Con la flessibilità, la scalabilità e la velocità offerta dalla soluzione Cloudera, il team ITMI applica la contemporaneità multiutente e analisi ad alte prestazioni dei dati genomici acquisiti da madri, padri e bambini partecipanti a diversi studi familiari di base. Per esempio, ITMI è stata in grado di sfruttare la sua esperienza nell’analisi clinica e genomica per aiutare a individuare anomalie congenite precedentemente non diagnosticate nei bambini. Si tratta di un processo iterativo che richiede tempo ma, grazie a strumenti come Cloudera, ITMI prevede di accelerare ancora di più il processo di diagnosi per aiutare le famiglie.