L’approccio shotgun per il sequenziamento genomico

Dopo aver descritto gli aspetti fondamentali del genoma batterico (http://www.microbiologiaitalia.it/2018/07/31/il-genoma-batterico-generalita/) e indicato  alcuni dati generali sulle tecniche di sequenziamento genico che hanno permesso la prima determinazione dell’ordine dei nucleotidi del genoma di Haemophilus influenzae e il conseguente avvento delle scienze omiche (http://www.microbiologiaitalia.it/2018/08/14/il-primo-sequenziamento-del-genoma-batterico/), proseguiamo nello studio del genoma batterico, riportando gli esperimenti, effettuati nel 1995, che hanno permesso il sequenziamento dell’intero genoma del batterio Haemophilus influenzae.  

 

Haemophilus influenzae è un coccobacillo Gram negativo, pleomorfo.

Lo studio riguardante il  sequenziamento del genoma di H. influenzae fu pubblicato su Science il 28 luglio del 1995 (Science 269: 496-512). Il suo unico genoma circolare è lungo 1,8 Mb ed è costituito da 1.743 geni.

  1. I motivi della scelta di sequenziare il genoma di Haemophilus influenzae

Il biologo statunitense Hamilton Smith (New York, 23 agosto 1931) fu uno dei ricercatori che, insieme agli scienziati dell’Institute of Genome Research, dedicò il suo lavoro al sequenziamento del primo genoma batterico.  Alla fine degli anni sessanta, prima che avesse inizio lo studio sul sequenziamento genomico, Smith, che lavorava su un ceppo di H. influenzae, scoprì l’esistenza degli enzimi di restrizione di tipo II nel batterio H. influenzae. Questa scoperta gli valse la vittoria del Premio Nobel per la Medicina nel 1978. Dunque, il batterio H. influenza  era un microrganismo già conosciuto nei laboratori americani dell’epoca.

Inoltre, da alcuni studi precedenti alla pubblicazione del sequenziamento dell’intero genoma di H. influenzae, si evinse che il contenuto in G+C del batterio (38%) era simile al contenuto in G+C del genoma umano.

Questi motivi, insieme alla misura del genoma di H. influenzae che era tipica di un qualsiasi genoma batterico, hanno spinto i ricercatori a scegliere H. influenzae come oggetto di studio per il sequenziamento del genoma.

  1. Il sequenziamento del genoma di Haemophilus influenzae

Il metodo utilizzato per il sequenziamento del genoma di H. influenzae è l’approccio di sequenziamento shotgun (Whole Genome Shotgun o WGS).

Per sequenziare la molecola di DNA del batterio H. influenzae è stato necessario dividerla in brevi frammenti sequenziati separatamente e successivamente assemblati.

La molecola di DNA di H. influenza è stata sottoposta a frammentazione fisica utilizzando la tecnica della sonicazione, la quale, mediante onde sonore ad alta frequenza, effettua rotture casuali alla molecola del DNA.

La separazione dei frammenti è avvenuta mediante elettroforesi su gel di agarosio. I frammenti di DNA con dimensioni comprese tra 1,6 Kb e 2,0 Kb sono stati purificati e amplificati mediante l’inserimento in un vettore plasmidico per produrre una libreria di cloni. Dalla libreria sono stati selezionati 19.687 cloni e sono stati effettuati 28.643 esperimenti di sequenziamento. Di questi esperimenti, il 15% è stato considerato come insuccesso in quanto ha fornito meno di 400 bp di sequenza. I saggi di sequenziamento andati a buon fine, cioè le restanti 24.304 sequenze, hanno coperto 11.631.485 bp che corrispondono a 6 volte il genoma di H. influenzae. I frammenti di DNA sono stati sequenziati a partire dall’una o dall’altra estremità dell’inserto.

L’assemblaggio delle sequenze ottenute, chiamate contig di sequenza, ha richiesto 30 ore utilizzando un computer con 512 Mb di RAM.

I contig di sequenza erano separati gli uni dagli altri da alcune lacune (o gap) di sequenza. Dunque, per riempire le lacune, era necessario conoscerne le sequenze.

Per riempire le lacune di sequenza sono state messe in atto diverse strategie.

È stato appurato se le lacune potevano essere colmate mediante il sequenziamento di cloni presenti nella genoteca. Furono trovati 99 cloni e, dunque, furono riempite 99 lacune di sequenza con questo approccio.

Rimasero 42 buchi fisici da colmare corrispondenti probabilmente a sequenze di DNA instabili nel vettore di clonaggio. Per tentare di riempire i 42 gaps fisici, fu preparata una ulteriore genoteca utilizzando il vettore fagico λ. Ogni clone della nuova libreria è stato saggiato utilizzando 84 oligonucleotidi sonda le cui sequenze corrispondevano alle sequenze delle estremità dei contig. Dunque, se due oligonucleotidi sonda ibridavano lo stesso clone del vettore fagico λ, le estremità dei contig dai quali gli oligonucleotidi sonda derivavano, dovevano essere presenti in quel clone fagico e il sequenziamento di quel clone λ doveva riempire il gap. Con questa strategia sono state risolte le sequenze di 23 gaps. Per colmare i restanti gaps, dal gruppo di 84 oligonucleotidi utilizzati come sonda nella precedente strategia, sono state scelte alcune coppie di oligonucleotidi utilizzati come primer per la reazione di amplificazione mediante PCR sul DNA genomico del batterio. Le coppie che coprivano la lacuna sono state identificate per la loro capacità di dare un prodotto di PCR.

L’approccio shotgun, utilizzato per sequenziare il genoma del batterio H. influenzae, ha reso possibile il sequenziamento di ulteriori genomi di microrganismi in tempi relativamente brevi e in assenza di mappe fisiche.

 

Fonti: Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM, et al. Science. 1995.

Il primo sequenziamento del genoma batterico. Pubblicato su Microbiologia Italia. http://www.microbiologiaitalia.it/2018/08/14/il-primo-sequenziamento-del-genoma-batterico/

The Haemophilus influenzae genome. http://bio.lmu.de/~parsch/evogen/H_influenzae.pdf

Genomi 3. T. A. Brown. EdiSES. 2013. Pag. 113 – 114.

Immagine in evidenza da Genome up. Storia del sequenziamento: come abbiamo imparato a “leggere” il nostro DNA. https://www.genomeup.com/2018/03/30/storia-del-sequenziamento-del-dna/

Maria Chiara Langella

Commenta per primo

Rispondi