DNA sequenziato per circa 1 miliardo di individui in tutto il mondo, che implicherà la creazione di un gigantesco database online, una sorta di Google del genoma, per immagazzinare l’immane mole di dati generata. II tutto entro il 2025. Una previsione al limite del fantascientifico, ma neanche troppo, se si pensa ai significativi sviluppi della ricerca nel settore e all’integrazione sempre più significativa tra le infrastrutture di rete e molteplici ambiti non direttamente correlati. Lo stesso Google ha già esordito nel comparto della telefonia, valuta di gettarsi in quello dell’ePayment e, cosa ancora più rilevante, ha già realizzato e messo online la piattaforma Google genomics, uno strumento di archiviazione riservato agli studi di ricerca dell’ambito medico.
DNA sequenziato: le stime della rivista PLoS Biology
Le stime sul DNA sequenziato e sulle possibili implicazioni pratiche del fenomeno sono state effettuate e rese pubbliche dalla rivista PLoS Biology del Cold Spring Harbor Laboratory di New York. Secondo quanto rivelato, i dati prodotti tramite le ricerche sulla mappatura del genoma generano una quantità continua di nuovi dati da archiviare, nettamente superiore anche a quella prodotta da piattaforme come Twitter e YouTube, e raddoppiano costantemente ogni 7 mesi.
Cos’è il sequenziamento del DNA
Per sequenziamento del DNA si intende la determinazione dell’ordine dei nucleotidi – cioè le particelle che compongono DNA e RNA. Ciò significa stabilire la composizione e l’ordinamento delle quattro basi azotate che compongono il nucleotide – Adenina, Guanina, Timina e Citosina – con implicazioni incalcolabili per ciò che riguarda l’identificazione e la diagnostica di malattie ereditarie e per lo sviluppo di nuove terapie.
Per archiviare i dati servono miliardi di hard disk ogni anno
Sempre la ricerca rivela come, alla luce della quantità di dati generata per gli studi sul sequenziamento del DNA, ogni anno è necessario immagazzinare volumi compresi tra i 2 e i 40 exabytes di dati ogni anno. Un exabyte è un’unità di misura dell’informazione e il prefisso exa equivale alla sesta potenza di mille. Per archiviare 1 exabyte di dati, oggi sarebbe necessario impiegare circa 1 miliardo di hard disk. YouTube, per dare un’idea delle grandezze, carica in rete circa 300 ore di contenuti al minuto che potrebbero diventare 1.700 entro i prossimi 10 anni, per un totale di 2 exabyte l’anno di dati custoditi in rete.
Google sta investendo in modo massivo su nuove tecnologie di clouding in grado di fornire spazi di immagazzinamento virtuale dei dati. Allo stesso modo, ha affermato Michael Schatz, uno degli autori della ricerca “abbiamo bisogno esattamente dello stesso tipo di investimento se vogliamo capire le nostre malattie, che tipo di trattamenti va applicato o rispondere alle domande sulle nostre origini”.