Genetica batterica

L’informazione genetica nella cellula batterica, come in tutte le cellule, è contenuta nel DNA (acido deossiribonucleico). La scoperta del DNA fu il risultato di studi sulla trasformazione genetica condotti con il batterio patogeno gram-positivo Streptococcus pneumoniae. L’unità fondamentale dell’informazione genetica è il gene e l’insieme dei geni contenuti in una cellula prende il nome di genoma.

Il gene è definito come un tratto di DNA codificante per una proteina, attraverso l’RNA messaggero (mRNA), l’RNA ribosomiale (rRNA) e l’RNA transfer (tRNA). Le strutture contenenti il DNA prendono il nome di elementi genetici: nella cellula batterica la maggior parte dei geni sono contenuti nel cromosoma (elemento genetico principale), ma possono anche risiedere in altri elementi genetici come i plasmidi, i profagi e gli elementi genetici trasponibili. Quindi, per genoma batterico si intende tutto il DNA presente in una cellula batterica a prescindere dalla localizzazione cromosomale o meno.

Nel genoma microbico, il mobiloma rappresenta l’insieme dei geni veicolati dagli elementi genetici mobili (MGE, mobile genetic elements) che includono plasmidi, profagi, elementi genetici trasponibili di cui fanno parte gli elementi integrativi e coniugativi (ICE, integrative conjugative element). Il cromosoma contiene i cosiddetti geni housekeeping, cioè essenziali per la sopravvivenza del batterio, mentre i plasmidi e gli elementi genetici trasponibili contengono geni come quelli di resistenza antibiotica o di virulenza, che possono conferire un vantaggio selettivo.

Il genoma batterico è sottoposto a un processo evolutivo che permette al batterio di adattarsi a un ambiente circostante mutato. I cambiamenti a cui un genoma va incontro avvengono attraverso due meccanismi: le mutazioni e la ricombinazione genetica. I batteri hanno un genoma aploide, con un cromosoma che nella maggior parte dei casi è singolo e circolare. La lunghezza del cromosoma batterico varia a seconda della specie da meno di 200 000 paia di basi (bp) a più di 10 000 000.

esempio di genoma batterico di M. mycoides
Figura 1 – esempio di genoma batterico di M. mycoides – Fonte

Il genoma batterico

Nel 1995 il TIGR (The Institute for Genome Research, Rockville, MD, USA) ha sequenziato e pubblicato il primo genoma microbico completo di Haemophilus influenzae (Fleischmann, Science, 1995). All’inizio del 2017 le banche dati contengono le sequenze di poco meno di 8000 genomi procariotici completi, in larga maggioranza batterici. Le informazioni per la maggior parte di essi sono reperibili liberamente in banche dati, tra cui quelle delle Microbial Genome Resources del National Center for Biotechnology Information (NCBI, www.ncbi.nlm.nih.gov/genome/).

Nel descrivere i genomi batterici va considerato che si tratta di organismi con distanze evolutive grandi. Per esemplificarne la complessità basti ricordare che un batterio gram-negativo è più simile ai nostri mitocondri che ai batteri gram-positivi e che la distanza evolutiva tra questi due gruppi di batteri supera quella tra l’uomo e una qualsiasi pianta o fungo. Il genoma comprende tutti gli elementi genetici che portano l’informazione genetica di un organismo. Generalmente i cromosomi batterici sono costituiti da una singola molecola di DNA a doppia elica, capace di autoreplicarsi (replicone).

Nei batteri, oltre al cromosoma che contiene le informazioni genetiche essenziali (geni housekeeping), possono essere presenti elementi genetici aggiuntivi quali plasmidi, profagi, elementi genetici trasponibili, che sono spesso mobili. Il cromosoma batterico è generalmente unico, aploide e circolare, mentre gli elementi genetici aggiuntivi sono spesso presenti in copie multiple ed elementi diversi possono coesistere nella stessa cellula. A queste regole generali, che valgono per la grande maggioranza dei batteri, ci sono molteplici eccezioni.

Esempi di specie con cromosomi lineari sono gli actinomiceti del genere Streptomyces, spirochete del genere Borrelia o l’alfaproteobatterio Agrobacterium tumefaciens. Cromosomi multipli sono stati ritrovati in diverse specie e includono la spirocheta Leptospira interrogans (lunghi 4300000 e 360000 bp) o il proteobatterio Burkholderia pseudomallei (lunghi 4070000 e 3100000 bp). In questi casi la decisione di denominare cromosoma ambedue le unità genetiche autonome è basata sulla dimostrazione della presenza di caratteri essenziali su entrambi i repliconi.

Una seconda serie di tratti distintivi dei genomi batterici è che sono in genere caratterizzati da geni senza introni, non sovrapposti e che non codificano per poliproteine. Nei batteri non ci sono introni dello spliceosoma, sono rari gli introni di gruppo I, mentre gli introni del gruppo II, più frequenti, si comportano esclusivamente come elementi genetici trasponibili e sono quindi parte del mobiloma. Tra i rari esempi di geni che codificano per più di una proteina ci sono il gene che codifica per il citocromo B e C1 di Bradyrhizobium japonicum. Un esempio di utilizzo di geni sovrapposti è Carsonella ruddii che, probabilmente a causa della dimensione ridottissima del genoma, ha un’altissima densità di codificazione con molteplici geni sovrapposti.

Le dimensioni del genoma batterico

Le dimensioni dei genomi batterici correlano direttamente con il numero di situazioni diverse alle quali gli organismi sono esposti nell’ambiente e che sono in grado di affrontare. Più sono protette le nicchie ecologiche nelle quali una specie vive, minori possono essere le dimensioni del genoma. Un esempio estremo sono le dimensioni ridotte dei genomi di mitocondri e cloroplasti delle cellule eucariotiche o il genoma dell’endosimbionta degli insetti Carsonella ruddii, lungo circa 160000 bp o quello del batterio intracellulare umano Mycoplasma genitalium (480000 bp).

I batteri che vivono liberi nell’ambiente, tra i quali Pseudomonas, Bradyrhizobium o Streptomyces, hanno genomi con dimensioni da 6 a 10 milioni di bp che permettono di rispondere a molteplici stimoli esterni e di adattarsi a diverse situazioni metaboliche e ambientali. A prescindere dalla dimensione del genoma, le capacità basilari dei batteri come la replicazione, la trascrizione, la traduzione e il metabolismo energetico di base rimangono pressoché costanti. Quello che varia maggiormente con l’incremento delle dimensioni genomiche è il numero dei sensori degli stimoli ambientali, dei regolatori della risposta genica e delle vie metaboliche aggiuntive.

Tutte queste caratteristiche conferiscono molteplici capacità adattative ai batteri con genomi di dimensioni grandi. La sequenza del primo genoma di una qualsiasi specie mostra il corredo genico completo e permette di fare luce sui processi metabolici e sulla fisiologia in generale di questo organismo. Queste caratteristiche includono l’identificazione di buona parte delle vie metaboliche, la caratterizzazione delle proteine di superficie che interagiscono con l’ambiente (l’ospite umano), e delle vie anaboliche responsabili per la biosintesi dei molteplici polisaccaridi che caratterizzano la superficie batterica (parete cellulare, acidi teicoici, acidi lipoteicoici, lipopolisaccaride e capsula).

Dimensioni di genomi a confronto
Figura 2 – Dimensioni di genomi a confronto – Fonti

Le applicazioni biotecnologiche

La disponibilità di sequenze genomiche complete ha cambiato profondamente la biologia per quanto riguarda le conoscenze scientifiche in generale, ma in particolare per quanto riguarda i campi di applicazioni biotecnologiche, farmacologiche o industriali.

Le applicazioni mediche di queste conoscenze genomiche includono la ricerca di nuovi bersagli per farmaci antibatterici utilizzando le conoscenze sulle vie metaboliche, oppure l’identificazione di nuovi candidati come antigeni vaccinali analizzando le strutture polisaccaridiche o proteiche della superficie batterica. La conoscenza di tutte le vie metaboliche, e in particolare di quelle specifiche di un certa specie di batteri o di un certo gruppo di batteri, permette di individuare nuovi enzimi come possibili bersagli per inibizione farmacologica. Nello sviluppo di vaccini ricombinanti a subunità, le sequenze genomiche associate a dati di epidemiologia molecolare hanno cambiato la metodologia di sviluppo dei nuovi vaccini. In questo caso la possibilità di predire quali proteine in un batterio sono in superficie, quali di queste sono conservate e quali sono differenti da proteine omologhe in altri batteri, permette il disegno razionale di un pannello di possibili proteine da sottoporre a screening per la loro efficacia come antigeni vaccinali.

A livello industriale e ambientale la conoscenza delle vie metaboliche permette di ottimizzare processi di fermentazione industriale, come nel caso della produzione di biodiesel, oppure di ingegnerizzare nuovi processi di bioremediation nei quali il catabolismo batterico viene utilizzato per la bonifica di sostanze tossiche, come nel caso di inquinamento da polifenoli o idrocarburi.

Un ulteriore esempio riguarda l’utilizzo di genomi di batteri estremofili per la ricerca di enzimi utili a processi industriali, fra cui ricordiamo l’uso di DNA polimerasi di batteri termofili per la reazione a catena della polimerasi (PCR). Lo scambio genico orizzontale tramite trasformazione, coniugazione o trasduzione è un fenomeno frequente nei batteri e contribuisce all’acquisizione e alla perdita di geni. Poiché i batteri si moltiplicano tramite divisione binaria, il materiale genetico trasferito orizzontalmente si stabilizza immediatamente nella progenie delle cellule riceventi.

Core-genoma e pan-genoma: due aspetti del genoma batterico

Sequenziando il genoma di isolati indipendenti appartenenti alla stessa specie si ottengono informazioni sulla variabilità dei singoli geni e operoni, tramite analisi comparativa di questi genomi. L’insieme dei geni conservati in tutti gli isolati di una specie prende il nome di core-genome, mentre la totalità dei geni presenti anche in un solo isolato di una specie prende il nome di pan-genome. La variabilità genomica intra-specie dovuta a scambio genico orizzontale è cosi grande che tra due ceppi della stessa specie le differenze possono ammontare anche al 20% del genoma. Ne deriva che il core-genome rappresenta circa il 60% dei geni presenti in un ceppo, mentre i rimanenti geni possono essere suddivisi in geni essenziali (presenti in tutti i ceppi, ma presenti come forme alleliche), oppure geni aggiunti che danno al ceppo delle caratteristiche accessorie, quale ad esempio la resistenza ad antibiotici.

Differenze tra core-genoma e pan-genoma
Figura 3 – Differenze tra core-genoma e pan-genoma – Fonte

Le possibilità attuali di sequenziare anche centinaia di ceppi diversi di una specie permette di correlare a livello genomico la presenza di singoli alleli, geni o operoni a possibili fenotipi multifattoriali quali aumentata virulenza o propensione a generare specifiche infezioni (ad es. ceppi di Streptococcus pneumoniae associati a carriage rispetto a ceppi che danno malattia invasiva).

Il sequenziamento del genoma può essere inoltre utilizzato come strumento epidemiologico efficace nel tracciare la trasmissione di una malattia all’interno di un focolaio epidemico, per indagare la presenza di determinanti di resistenza antibiotica e per studiare, a livello di popolazione, la risposta dei microrganismi all’applicazione di pressioni selettive quali la terapia antibiotica o la vaccinazione. Infine il numero crescente di specie batteriche con genoma completo sequenziato permette di utilizzare le informazioni di tutto il genoma per la classificazione tassonomica anziché basarsi sulla sola sequenza del gene per il 16S rRNA.

Fonti

  • Didelot, X. et al. (2016), «Within-host evolution of bacterial pathogens», Nat Rev Microbiol, 14(3), pp. 150-62.
  • Fleischmann, R.D. et al. (1995), «Whole-genome random sequencing and assembly of Haemophilus influenzae Rd», Science, 269(5223), pp. 496-512.
  • Goodwin, S. et al. (2016), «Coming of age: ten years of next-generation sequencing technologies», Nat Rev Genet, 17(6), pp. 333-351.
  • Johnson, C.M. et al. (2015), «Integrative and Conjugative Elements (ICEs): what they do and how they work», Annu Rev Genet, 49, pp. 577-601.
  • Margulies, M. et al. (2005), «Genome sequencing in microfabricated high-density picolitre reactors», Nature, 437(7057), pp. 376-380.
  • Ronaghi, M. et al. (1996), «Real-time DNA sequencing using detection of pyrophosphate release», Anal. Biochem., 242(1), pp. 84-89.
  • Sanger, F. et al. (1977), «DNA sequencing with chain-terminating inhibitors», Proc Natl Acad Sci USA, 74(12), pp. 5463-5467.
  • Sboner, A. et al. (2011), «The real cost of sequencing: higher than you think!» Genome Biology, 12:125.
  • Service, R.F. (2006), «Gene sequencing. The race for the $1000 genome», Science, 311(5767),pp. 1544-1546.
%d blogger hanno fatto clic su Mi Piace per questo: