Bioinformatica e microarray a DNA
I microarray sono piccole superfici, generalmente poste su di un vetrino da microscopia, su cui sono legate chimicamente piccole molecole di DNA.
Sono utilizzati per saggiare in un campione la presenza e la quantità di determinate sequenze di DNA o RNA, grazie alla capacità di legarle in modo specifico e di emettere una luce proporzionale alla quantità di molecole legate.
Le diverse sequenze che si possono indagare sono disposte nel vetrino secondo una griglia: analizzando la luminosità in ciascun quadratino si può dedurre se la sequenza corrispondente è presente, e in quale quantità, nel nostro campione.
Questo tipo di analisi normalmente si effettua su diverse migliaia di sequenze in contemporanea.
L'immagine che si ottiene fotografando un vetrino di microarray al termine dell'esperimento assomiglia molto a quello dell'immagine in alto a sinistra.
Il computer, dopo aver registrato le luminosità, ci restituisce una tabella in cui associa ad ogni quadratino il riferimento alla sequenza che contiene e la luminosità rilevata.
A questo punto, la bioinformatica ci aiuta ad interpretare i dati. Le operazioni che si possono effettuare con l'ausilio del computer e di software appositi sono moltissime, ne segnaliamo solo alcune per avere un'idea di quello che è possibile fare.
Il primo punto è capire quali differenze di luminosità sono da ritenersi significative: è possibile che sul vetrino sia rappresentata tutta la gamma di luminosità possibile, tocca a noi stabilire i limiti di significatività. Normalmente si procede in parallelo anche con un microarray di controllo (oltre a dedicare alcune "cellette" dello stesso microarray a controlli interni) che sono usati come parametro di confronto: il primo passo, quindi, è "normalizzare" i dati con quelli di controllo. Quindi si applicano diversi strumenti statistici per validare i dati.
A questo punto possiamo pensare veramente al nostro esperimento.
Consideriamo di voler analizzare l'espressione genica (cioè quali geni sono attivi in una determinata cellula) di una cellula cancerosa, per capire quali sono le differenze a livello di funzionamento del DNA.
Realizziamo l'esperimento usando due microarray diversi, uno per le cellule normali e uno per quelle tumorali.
A questo punto, confrontiamo i risultati e chiediamo al computer di isolarci le differenze: otterremo una lunga lista di sequenze che si comportano in modo diverso.
Ripetiamo alcune volte l'esperimento per ripulire la nostra lista da differenze non significative: alcune di queste potrebbero essere oscillazioni biologiche che non dipendono strettamente dalla genetica.
Ottenuta la nostra lista ripulita, ci accorgiamo che è ancora molto lunga: centinaia di nomi incomprensibili si susseguono.
A questo punto quello che fa un bioinformatico è applicare un algoritmo statistico che ci fornisce una catalogazione ragionata della nostra lista sulla base di informazioni presenti nelle banche dati. Questa si chiama classificazione ontologica: le sequenze sono classificate in base alla loro funzione in insiemi e sottoinsiemi.
A questo punto sarà molto più semplice leggere i nostri dati: sapremo, per esempio, che nella nostra cellula tumorale sono iperattivi i geni che appartengono ad una certa classe di molecole che controllano la proliferazione. Se siamo fortunati, una di queste è una molecola chiave (cioè, se inibita blocca l'intero sistema in cui agisce) che può essere interessante usare come base per progettare un nuovo farmaco antitumorale.
In realtà la bioinformatica è utile in molti altri passaggi dell'analisi di microarray: per esempio, è fondamentale per progettare in modo adeguato le sequenze che devono essere messe nella griglia (tecnicamente definite "sonde").