Principi di genetica - page 28

412
Capitolo 15
Genomica
Attualmente, si accumulano ogni giorno enormi quantità di dati di sequenza. La mag-
gior parte di questi dati è il risultato di progetti di ricerca finanziati da agenzie governative
– negli Stati Uniti il National Institute of Health (NIH), la National Science Foundation
(NSF) e il Department of Energy (DOE) – e agenzie statali di altri paesi. Quindi, que-
sti dati sono accessibili liberamente e sono disponibili per chiunque desideri usarli. Le
sequenze sono state rese pubbliche, costruendo banche dati disponibili su Internet al sito
(vedi Approfondimento: “GenBank”).
Naturalmente, ciò non è sufficiente rendere le banche dati disponibili al pubblico.
Dobbiamo essere in grado di estrarre informazioni – cioè di scavare nelle banche dati – e
poi di analizzarle in modo accurato ed efficiente. Ciò richiede programmi al computer
che possano identificare particolari regioni esplorando la mole di sequenze di DNA che
costituiscono i genomi. La necessità di questi particolari software ha portato alla nascita di
una nuova disciplina scientifica, chiamata bioinformatica. Matematici, informatici e bio-
logi molecolari che lavorano in quest’ambito sviluppano algoritmi per la ricerca mediante
il computer in banche dati, sia di DNA che di proteine, da cui estrarre informazioni sotto
forma di sequenze.
La disponibilità delle sequenze di interi genomi ha aperto le porte all’analisi bioin-
formatica e allo studio funzionale dei geni contenuti in queste sequenze. I microarray
– inclusi i cosiddetti gene-chip – hanno permesso agli scienziati di investigare l’espressione
di tutti i geni di un organismo in modo simultaneo (vedi “Saggi su RNA e proteine per lo
studio delle funzioni del genoma” in questo capitolo). Altre procedure utilizzano le sequen-
ze nucleotidiche conosciute per selezionare le vie metaboliche mediante “knockout”, cioè
spegnimento dell’espressione dei geni (vedi “Genetica inversa” nel Capitolo 16).
In questo capitolo discuteremo alcuni degli strumenti e delle tecniche utilizzati nello
studio della struttura e della funzione dei genomi; esamineremo gli spettacolari progressi
del Progetto Genoma Umano e vedremo come il confronto tra genomi possa contribuire
a migliorare la nostra comprensione dell’evoluzione. Nel capitolo che segue esamineremo
altri progressi tecnici: DNA profiling, terapia genica umana e produzione di microrgani-
smi, piante e animali transgenici. Vedremo anche come i genetisti abbiano identificato i
geni difettivi che sono responsabili di due malattie con effetti tragici nell’uomo, la malattia
di Huntington e la fibrosi cistica. I procedimenti usati per identificare questi geni sono
diventati paradigmi metodologici per l’identificazione di molti altri geni associati a malat-
tie nell’uomo.
GENBANK
N
el 1979 Walter Goad, un fisico che lavorava al Los
Alamos National Laboratory (LANL) nel New Me-
xico, pensò di costruire un database che contenes-
se tutte le sequenze di DNA disponibili. Dal 1982 al 1992,
Goad e i suoi colleghi iniziarono a raccogliere le sequenze
in un database – oggi chiamato GenBank – che fu mante-
nuto presso il LANL. Oggi, questo database è curato dal
National Center for Biotechnology Information (NCBI),
che è parte della National Library of Medicine (NLM) nei
National Institutes of Health (NIH) di Bethesda, Maryland
(US). Il contenuto del database è cresciuto enormemente
a partire dalla data della sua creazione. La GenBank con-
teneva 680.338 coppie di nucleotidi in forma di sequenza
di DNA ma poi, nell’Aprile del 2008, ne conteneva già qua-
si 90 miliardi (
j
Figura 1
).
Banche dati simili alla GenBank sono state create
anche in Europa e in Giappone. La “European Molecu-
lar Biology Laboratory (EMBL) Data Library” fu stabilita
in Germania nel 1980 e la DNA DataBank del Giappone
(DDBJ) nel 1984. La GenBank, l’EMBL e la DDBJ hanno
unito successivamente le forze e hanno formato l’Interna-
tional Nucleotide Sequence Database Collaboration, che
permette ai ricercatori di consultare simultaneamente le
tre banche dati.
Lo sviluppo di software per la ricerca e il recupero di
sequenze con similarità rispetto a una utilizzata come
riferimento ha fornito agli scienziati uno strumento di
ricerca di grande rilevanza. In particolare, il sistema di
recupero di sequenze dell’NCBI chiamato ENTREZ si
è rivelato di enorme valore. Il sistema fu distribuito su
CD-ROM nel 1992, poi come versione per il network nel
1993, e infine fu reso disponibile, liberamente, nel 1994
su Internet (URL:
). La quan-
tità di informazione analizzabile e recuperabile presso il
sito web Entrez è cresciuta annualmente in modo espo-
nenziale. Non solo contiene sequenze di DNA e proteine,
ma anche un’enorme quantità di riferimenti bibliografici,
raccolti in un altro database chiamato PubMed. Esso in-
clude la maggior parte di riviste scientifiche di medicina e
biologia. Oggi è possibile consultare tutte queste banche
APPROFONDIMENTO
1...,18,19,20,21,22,23,24,25,26,27 29,30
Powered by FlippingBook