Hamarkada bat baino gehiago pasa da gizakion genoma sekuentziatu zenetik. Orduan gure material genetikoa nola idatzita zegoen jakiteak gure osasunean eta bizi baldintzetan hobekuntza eragingo zuela uste zen. Hala ere, mugarri horretatik denbora pasa bada ere, ez dirudi orduan egindako aurreikuspenak bete direnik.
Koldo Garcia (Basauri) biologo konputazionala eta genetikan doktore
da. Genomak eta eboluzioa dira ikertzen dituen gaiak.
2001. urtean giza genomaren zirriborroa aurkeztu zen eta hiru urte beranduago behin-betiko bertsioa aurkeztu zen. Mugarri horrek gizakion ongizatea hobetuko zuela uste zen, gure funtzio biologikoen “argibide-liburua”-ren letra jakinda, nola funtzionatzen duen hobeto ulertuko baitzen.
Lehen ezustekoa uste ziren baino gene gutxiago zeudela ikustea izan zen. Geneek funtzio biologikoei buruzko informazioa eramaten dutenez eta izaki bizidunok hainbat funtzio betetzen ditugunez, gene asko egongo zirela uste zen. Baina aurreikuspenen aurka, gene kopurua txikiagoa zen. Horrek genomak ulertzeko bide berri bat zabaldu zuen: geneak ez dira beti modu berdinean irakurtzen eta irakurketa alternatiboak dituztenez funtzio ezberdinak bete ditzazkete. Horrela, 20.000 gene inguruko katalogoa izanda gure organismoak beharrezkoak dituen funtzio biologiko guztiak betetzen ditu.
Beste ezusteko bat geneak genomaren zati txiki bat besterik ez direla ikustea izan zen. Aurretik ezagunak ziren genomaren beste osagai batzuk, oro har “DNA-zabor” izendatzen direnak ageriko funtziorik ez dutelako, baina genoman duten hedapena uste baino handiagoa izan zen.
Genomak sekuentziatzen direnean indibiduo batekin lan egin ohi da. Gizakiaren kasuan ordea, pertsona ezberdinen material genetikoa aztertu zen arazo etikoak ekiditeko. Hala ere horrek informazio oso gutxi eman zuen pertsonen eta populazioen arteko aldakortasunari buruz. Aldakortasuna SNPekin (single nucleotide polymorphisms, nukleotido bakarreko polimorfismoak) neurtu ohi da, hots, genomaren puntu konkretu batean gertatzen diren letra aldaketak. SNPez gain, metodo berriei esker, beste aldaera batzuk aztertzea posible izan da, CNVak (copy number variations, kopia kopuru aldaketak) deitutakoak. Hauek indibiduo ezberdinetan kopia kopuru aldakorra azaltzen duten 1000 base (letra) baino gehiagoko DNA zatiak dira. Aldaera hauek modu orokor batean aztertzeko eta horrela giza populazioen aldakortasuna aztertzeko “HapMap” eta “1000 genomes” bezalako egitasmoak martxan jarri ziren.
“HapMap” egitasmoa 3 fasetan antolatu zen eta 3 fase horien ostean 11 populaziotako 1184 indibiduoren genomaren aldakortasuna aztertu zen, bai SNPak (1,2 milioi SNP) zein CNVak (1610 eskualde).
“1000 genomes” egitasmoak, izenak dioen moduan, 1000 genoma aztertzea du helburu, baina, momentuz 1092 dira aztertu dituzten laginak. Genoma guztiak ez dituzte sakonki aztertu, hurbilketa ezberdinak erabili zituzten (genedun eskualdean sakonki sekuentziatu eta gainontzeko eskualdeak gainetik) eta programa informatikoen bidez sortutako datuak bildu indibiduo horien aldaerak estimatzeko. Guztira 38 milioi SNP, 1,4 milioi insertzio/delezio labur eta 14.000 delezio luzeago inguru aztertu zituzten. Aldaera hauetatik guztietatik maiztasun altuetan agertzen zirenak, hots, populazioetan hedatuta daudenak, lehendik ere ezagunak ziren, baina, maiztasun baxuetan agertzen zirenetatik soilik %13a ezagutzen zen.
Bi egitasmo hauek antzeko emaitzak lortu zituzten populazioak konparatzerakoan. Maiztasun altuetan agertzen ziren aldaerak populazio ezberdinetan agertzen ziren, hots, ez zegoen populazio arteko ezberdintasunik. Baina maiztasun baxuetan agertzen ziren alderak, populazio gutxitan agertzen ziren, populazioen espezifikoak ziren.
Genomen aldakortasuna ezaugarri konplexuak eta gaixotasunak aztertzeko ere erabili da. “Genome-wide associations study” (GWAS, genoma osoko asoziazio analisiak) deitutako metodologia erabilita, genomako milaka aldaera aldi berean erabiltzen dira aztertu nahi den ezaugarria duten pertsonak (diabetesa esate baterako) ezaugarri hori azaltzen ez dutenekin alderatzeko. Horrela, aldaera bat ezaugarria dutenen artean ohikoagoa den ala ez aztertu daiteke eta, hortaz, ezaugarri horrek oinarri genetikoa ote duen.
Azken 7-8 urteetan 2.000 asoziazio inguru aurkitu dira 300 gaixotasun edo ezaugarri konplexurekin. Emaitzak positiboak badirudite ere, hasierako euforia hoztuz joan zen hainbat arrazoirengatik. Batetik, asoziatutako aldaerek ez zuelako gaixotasuna izateko arriskua asko emendatzen. Bestetik aztertutako faktore genetikoek ez dituztelako ezaugarriak guztiz azaltzen, “heradabilitate galdua” bezala ezagutzen den gertaera. Azken finean, aldaera maiztasun baxuetan agertzen bada, aztertutako indibiduo tamainak handia behar du izan aldaera hori aurkitu ahal izateko. Hori ikerketa hauetan muga handia da, GWASetan ez baitira maiztasun baxuko aldaerak aztertzen.
Hala ere, esan beharra dago, ikerkuntzak medikuntzan aplikatzeko bataz beste 17 urte behar direla. Hortaz, GWASak prozesu horren hastapenetan besterik ez daudenez, denboraren poderioz eguneroko medikuntzan genomaren azterketa hauek gehituko dira. Izan ere, teknika hau lau arlotan lagungarria izan daiteke: gaixotasun bat izateko arriskua aurresaterakoan, gaixotasunak sailkatzerakoan, botikak garatzerakoan eta botiken toxikotasuna ezartzerakoan.
Genomaren letra eta aldaerak ezagunak badira ere, beharrezkoa da argibide-liburu horretan idatzita dauden funtzioak noiz betetzen diren jakitea, hots, aktibo noiz dauden jakitea.
2012. urtean ENCODE (The Encyclopedia of DNA Elements, DNA osagaien entziklopedia) deitutako egitasmoak bere datuak argitaratu zituen aktibo zeuden genomaren eskualdeen inguruan. Hamaika esperimenturen emaitzak eta horien hasierako interpretazioak 30 artikulutan publikatu ziren aldi berean. Gure argibide-liburua hobeto ezagutzeko mugarria izan zen.
Egitasmo honetan munduko talde ezberdinak batu ziren eta sortu zuten datu kopurua izagurria izan zen. Ziurrenik icebergaren punta bakarrik izan da eta sortutako datuek luzarorako zer esana emango dute.
Emaitzarik deigarriena izan zen genomaren eskualde gehienak (genomaren %90 inguru), DNA zabortzat jotzen zirenak barne, momenturen batean edo bestean aktibo zuedela eta, hortaz, funtzioren bat izan behar dutela. Horrek genomak ulertzeko modua goitik behera aldatu zuen.
Hala ere emaitzen interpretazio honekin bat ez datorron ikertzaile talde handi bat dago, eta horien buru nabarmenena Dan Graur da. Ikertzaile hauen iritziz ENCODEko emaitzak nahiko puztu ziren, oinarrizko akats metodologikoak eta biologikoak eginez. Esate baterako, funtzio biologikoa nola definitzen duten ez daude ados, hots, aktibo egoteak halabeharrez ez du inplikatzen funtzio bat izatea.
Ikertzaile talde honen kritikek hautsak harrotu badituzte ere, datozen urteetan kritikak neurrikoak diren ala ez ikusiko dugu. ENCODEko datuak publikoak diren heinean ikertzaile taldeek datu horiek erabili eta baliozkotu ditzazkete, eta ondorio berrietara heldu.
ENCODEren emaitzaren harira sortutako eztabaida “DNA zaborra” kontzeptuaren beraren baitan egon daiteke. Hasieran aipatu dugun bezala “DNA zabor”-tzat jotzen diren osagaiak genomaren zati handi bat dira eta hauek ez dute ageriko funtziorik. ENCODEren emaitzek funtzio bat izan dezaketela ondorioztatzen dutenez osagai hauek hainbeste hedatu izanaren paradoxa azaldu dezakete.
Hala ere, ENCODEren emaitzak puztuta badaude, “DNA zaborra”-ren hedapena azaltzeko beste bide bat beharrezkoa da. Osagai hauen hedapena populazioaren taimainaren eta jito genetikoaren eraginaren islada dela proposatzen da. Hots, populazioa txikia bada, zoriaren eraginez, “DNA zaborra” hedatu daiteke eta populazio horrek bizirauteko “DNA zaborra”-ren presentzia baimendu.
Edonola ere, “DNA zaborra”ren parte diren osagai batzuk birzikla daitezke genomaren onurarako. Alde batetik, genomak funtzio berriak lor ditzake “DNA zabor”-eko osagai batzuk gene bilakatuz, adibidez gizakion sinzitina genea (karenaren garapenerako beharrezko genea). Bestetik, dauden geneen aktibazioa aldatu dezakete eta, horrek gene baten funtzioa lehendik ez zegoen ehun edo organo batean gertatzea eragiten du; gizakiok listu guruinetan amilasa (almidoia liseritzen duen entzima) edukitzea esate baterako. Izan ere, autore batzuek “DNA zaborra” indar ebolutibotzat jotzen dute.
Oraindik bide luzea dago genometako sekretu guztiak aurkitzeko. Etorkizunean, medikuntza pertsonalizatuaren garapenarekin batera, gero eta aldaera gehiago lotuko dira gaixotasunekin edo ezaugarri konplexuekin eta hauen erabilera medikuntzan ohikoagoa izango da. Gainera, beste izaki bizidunen genomak aztertzea gero eta ohikoagoa izango da (behien HapMap-a edo 1000 landareen genomak sekuentziatzea, adibidez) eta, genomak konparatuta, genomen eboluzioa eta sekretuak ulertuko dira. Azkenik, “DNA zaborra” genomak ulertzeko azken mugarria dela dirudi, zabor artean ezkutatuta altxorrak egon baitaitezke.
International Human Genome Sequencing Consortium. 2001. Initial sequencing and analysis of the human genome. Nature, 409:860-921.
Altschuler, D., et al. 2010. Integrating common and rare genetic variation in diverse human populations. Nature, 467:52-8.
The 1000 Genomes Project Consortium. 2012. An integrated map of genetic variation from 1,092 human genomes. Nature, 491: 56-65.
Manolio, T., et al. 2009. Finding the missing heritability of complex diseases. 461:747-53.
Manolio, T., 2013. Bringing genome-wide association findings into clinical use. Nature reviews. Genetics, 14: 549-58.
Bernstein, B., et al. 2012. An integrated encyclopedia of DNA elements in the human genome. Nature, 489:57-74.
Graur, D., et al. 2013. On the Immortality of Television Sets: “Function” in the Human Genome According to the Evolution-Free Gospel of ENCODE. Genome biology and evolution, 5: 578-90.
Biémont, C., et al. 2006. Junk DNA as an evolutionary force. Nature, 443:521-4.
Volff, J., et al. 2006. Turning junk into gold: domestication of transposable elements and the creation of new genes in eukaryotes. BioEssays, 28:913-22.