StrainEst: Un nuovo algoritmo per identificare i ceppi batterici

L’Unità di Biologia Computazionale della Fondazione Edmund Mach ha recentemente messo a punto un algoritmo, StrainEst, in grado di identificare e quantificare con precisione i ceppi batterici in un campione di microbiota. La ricerca è stata pubblicata sulla rivista Nature Communications

Le premesse

Le comunità microbiche sono spesso composte da miscele complesse di più ceppi della stessa specie e caratterizzate da un’ampia variabilità genomica e fenotipica. Metodi computazionali in grado di identificare, quantificare e classificare i diversi ceppi presenti in un campione sono essenziali per sfruttare pienamente il potenziale del sequenziamento metagenomico nell’ecologia microbica. Le applicazioni di questo spaziano dall’epidemiologia delle malattie infettive alla caratterizzazione delle dinamiche della colonizzazione microbica.

Mettere a profitto il potenziale delle tecnologie metagenomiche, come?

Secondo gli esperti, sono necessarie tecniche di analisi dei dati in grado di districare comunità potenzialmente complesse di ceppi strettamente correlati e classificarle in base alla struttura di popolazione delle specie. In molti casi, le specie di rilevanza clinica o biotecnologica sono state studiate e sono attualmente disponibili database di sequenze genomiche di singoli isolati, insieme a un ampio corpus di conoscenze sulle singole caratteristiche dei ceppi selezionati.

StrainEst: Uno studio made in Italy

Il progetto presenta un approccio computazionale, StrainEst, che impiega i dati genomici disponibili per ricostruire profili complessi di ceppi a partire dal sequenziamento metagenomico, quantificando l’abbondanza dei diversi ceppi e catalogandoli in base alla struttura di popolazione delle specie. Il metodo, messo a punto da un team tutto italiano, è stato convalidato su set di dati sintetici e applicato alla caratterizzazione della distribuzione dei ceppi di importanti specie batteriche in campioni reali.

Un criterio innovativo

StrainEst utilizza i profili Single Nucleotide Variants (SNV) dei genomi disponibili delle specie selezionate per determinare il numero e l’identità dei ceppi coesistenti e la loro abbondanza relativa in campioni metagenomici misti. Piuttosto che fornire uno strumento generale che caratterizzi tutte le specie allo stesso tempo, StrainEst si concentra su quelle di interesse definendo la loro struttura di popolazione attraverso un raggruppamento dei profili SNV.

Questo approccio identifica e quantifica tutti i ceppi delle specie di interesse presenti in un campione, affinando la risoluzione degli attuali metodi di identificazione dei ceppi. Inoltre, classificando questi componenti tramite l’utilizzo di un database predefinito di sequenze genomiche rappresentative, StrainEst consente la compilazione di ampie meta-analisi, inclusi campioni da studi non correlati, e pone le basi per un uso esteso della metagenomica negli studi epidemiologici.

I ricercatori hanno testato l’algoritmo sulle due comunità simulate disponibili nel Progetto Microbioma Umano. Per ciascuna hanno verificato la capacità di StrainEst di identificare il ceppo corretto di Escherichia coli (Fig.1), Neisseria meningitidis, Propionibacterium acnes, Staphylococcus aureus e Staphylococcus epidermidis. Il test è risultato particolarmente difficile a causa della scarsa abbondanza di alcune di queste specie nei campioni. Per ogni specie di interesse, i ricercatori hanno scaricato tutte le sequenze genomiche complete disponibili dal database dell’NCBI (National Center for Biotechnology Information).

escherichia coli, identificati da strainest
Figura 1 – Escherichia coli

Limiti e vantaggi di StrainEst

Un presupposto necessario per l’utilizzo di StrainEst, spiegano gli studiosi, è che si tratta di un metodo applicabile solo a specie per le quali sono disponibili informazioni genomiche sufficienti. Pur essendo una limitazione ovvia nel caso di specie mal caratterizzate, tale approccio presenta il vantaggio di fornire una classificazione dei ceppi in termini di un set standard di sequenze rappresentative, il cui numero e identità derivano dalla struttura di popolazione delle specie. Tra gli ulteriori pregi di questo procedimento vi è, inoltre, la possibilità di eseguire meta-analisi su larga scala, confronti di studi non correlati e l’opportunità di utilizzare i dati per indagini epidemiologiche molecolari riguardo specie di particolare rilevanza.

Angela Chimienti

Fonti:

  • Albanese, Donati, 2017, Strain profiling and epidemiology of bacterial species from metagenomic sequencing, Nat Commun. 8, Article number: 2260 (2017), [Open Access] DOI: 10.1038/s41467-017-02209-5 Creative Commons Attribution 4.0 International License.
  • Foto di Markus Spiske da Pixabay (immagine in evidenza)
  • Pixnio (Fig.1)

Foto dell'autore

Francesco Centorrino

Sono Francesco Centorrino, creatore ed amministratore di Microbiologia Italia, primo sito di divulgazione microbiologica in Italia. Sono laureato in biologia e molto appassionato di tecnologia, cinema, scienza e fantascienza. Sono Siciliano ma vivo e lavoro in Basilicata come analista di laboratorio microbiologico presso una nota azienda farmaceutica. Ho creato il portale di Microbiologia Italia per condividere conoscenza ed informazioni a chiunque fosse interessato a questa bellissima scienza. Potete trovare tutti i miei contatti al seguente link: https://linktr.ee/fcentorrino.

Rispondi

Scopri di più da Microbiologia Italia

Abbonati ora per continuare a leggere e avere accesso all'archivio completo.

Continue reading