Calendario

Septiembre 2012
L M X J V S D
« Jul   Oct »
 12
3456789
10111213141516
17181920212223
24252627282930

Lecciones desde ENCODE

Esta semana hemos sido testigos a un acontecimiento histórico en el campo de la investigación genética: se han publicado los primeros resultados del proyecto ENCODE, un proyecto que para poder llevarse a cabo ha requerido de un enorme esfuerzo, en cuanto a trabajo (442 investigadores de 32 instituciones procedentes de diversos países han participado en las 30 publicaciones que han ocurrido esta semana, basadas en 1.649 experimentos) y dinero (no se sabe con seguridad cuánto ha costado, pero parece que estaríamos cerca de los 200 millones de dólares, de momento). Baste decir que para quienes equiparan el esfuerzo de la secuenciación del genoma humano con viajar a la luna, el proyecto ENCODE equivaldría a viajar a Marte.

 Pero, ¿qué es ENCODE?. El nombre procede de Encyclopedia of DNA Elements, es decir, enciclopedia de elementos de DNA. ENCODE es el nombre de un Consorcio internacional que se diseñó en el 2003 para avanzar en el conocimiento del funcionamiento del genoma humano, una vez que la secuencia del genoma había quedado establecida por el Proyecto Genoma Humano (PHG), otro consorcio internacional que dio por finalizado su trabajo en el 2003.

 Cuando se obtuvo la secuencia completa del genoma humano, lo que se consiguió fue conocer el “libro de instrucciones” del funcionamiento biológico de los seres humanos. Sin embargo quedaba pendiente conocer cómo las células utilizan ese libro de instrucciones y consiguen realizar sus funciones correctamente y de manera integrada entre sí.

 Cuando en el PHG se identificaron los 3 mil millones de letras del genoma humano y se buscaron las secuencias que entonces pensábamos eran necesarias para que los genes se expresasen en proteínas, comprobamos que sólo el 1% de las secuencias estaban implicadas en ese proceso. Por ello, de considerar que en el ser humano había unos 100.000 genes, con el conocimiento de la secuencia completa pasamos a considerar que el número de genes era bastante menor (unos 20.000 genes). Este descubrimiento marcó un cambio drástico en la consideración de la arquitectura del genoma y nos hizo construir una representación en la que, si el genoma fuese una gran masa terrestre, sólo unas pocas zonas estarían habitadas (que serían los genes), mientras que existirían enormes regiones desérticas (sin genes), de función desconocida. Pues bien, el proyecto ENCODE se propuso analizar si esas zonas desérticas lo eran realmente, identificando las secuencias funcionales de DNA que se esconden allí, y avanzar en el conocimiento de qué secuencias están activas en qué tipos de células, cómo se regula la expresión de los genes en los diferentes tipos celulares (cuándo se activan, cuánto de expresan,…), cómo se lee (a partir de una secuencia en el DNA se obtiene siempre el mismo tipo de RNA y la misma secuencia de aminoácidos en la proteína?), cómo se empaqueta,…

 En el 2007 el consorcio ENCODE ya nos hizo un anticipo cuando publicó los resultados del trabajo piloto en el que analizaron funcionalmente el 1% del genoma humano. Ahora, una vez identificadas y analizadas las secuencias funcionales que han detectado en la totalidad del genoma humano, utilizando 147 tipos celulares, han puesto a disposición de la comunidad científica sus conclusiones y toda la información que han recopilado, mediante la publicación de 30 artículos en tres revistas (Nature, Genome Research y Genome Biology). Se puede acceder a lo más interesante a partir de http://www.nature.com/ENCODE

El consorcio ha asignado algún tipo de función a aproximadamente el 80% del genoma, incluyendo más de 70.000 regiones promotoras (los puntos de inicio de los genes y donde se unen proteínas que regulan la expresión de los genes) y cerca de 400.000 regiones intensificadoras (secuencias que incrementan los niveles de expresión de los genes hasta niveles adecuados), que regulan la expresión de genes distantes. Según indica Ewan Birney, un biólogo computacional en el Instituto Europeo del Laboratorio Europeo de Biología Molecular Bioinformática en Hinxton, Reino Unido, coordinador del análisis de los datos de ENCODE, el trabajo está lejos de haber terminado: estima que habrán identificado alrededor del 10% de las secuencias funcionales que podrían existir.

 Aunque la información obtenida es ingente y será necesario que transcurra tiempo para conocer el alcance de estos resultados, nos adelantan algunas conclusiones generales:

 –  La gran mayoría del genoma humano (80,4%) participa en al menos un evento asociado a la bioquímica del RNA (y / o de la cromatina) en al menos un tipo de célula

–   Han encontrado numerosos elementos específicos de primates, y otros no restringidos a primates, que muestran pruebas de selección negativa, por lo que se espera que algunos de ellos sean funcionales, así que el número final de secuencias funcionales, aún podría aumentar

–  Han identificado cerca de 400.000 regiones que podrían ser regiones intensificadoras y más de 70.000 regiones promotoras. También han detectado cientos de miles de regiones quiescentes (o silenciosas).

–  Los promotores funcionales parece que explicarían la mayor parte de la variación en la expresión del RNA.

– Muchas variantes no codificantes que previamente se han encontrado en genomas individuales, están localizadas en regiones funcionales que han sido anotadas por ENCODE; este número es al menos tan grande como las que se encuentran en genes que codifican proteínas. Polimorfismos de un solo nucleótido (SNP) que en trabajos previos del tipo GWAS (trabajos en los que se buscan asociaciones entre polimorfismos de todo el genoma con una característica clínica determinada) se han asociado a enfermedades, pero que están situados en regiones no codificantes, están dentro o cerca de regiones que ENCODE ha definido como funcionales. En muchos casos, los fenotipos de la enfermedad podrían estar asociados a un tipo específico de célula o de factor de transcripción.

No hay duda de que en los próximos años estos datos serán de gran utilidad para comprender el correcto funcionamiento de las células, así como las bases moleculares de muchas de las enfermedades complejas que hoy todavía se nos escapan, así como de la susceptibilidad genética identificada en muchas de ellas. Mucho trabajo está ahora pendiente. Algunos dudan incluso que pueda ser finalizado alguna vez…..

 

3 comentarios a Lecciones desde ENCODE

  • Hola Ana. Me puedes dar tu opinión acerca de esto: http://paleofreak.blogalia.com/historias/72361 ? A mí me parece muy razonable, pero hay un cacao muy serio

    • ANA ISABEL AGUIRRE ESCOBAL

      Pues a mí también me parece muy razonable lo que se dice en ese blog!.
      El término “basura” tiene gramaticalmente cierto componente peyorativo.
      Los científicos tenemos tendencia a considerar que debemos ser “políticamente correctos” y por eso tratamos de evitar términos coloquiales despreciativos.
      Sin embargo, con “DNA basura” nos referimos a secuencias que muy probablemente son resultado de errores del proceso funcional y evolutivo de los genomas y, por tanto, creo que el término “basura”, en este contexto, resulta muy ilustrativo de la realidad a la que se refiere.
      Hasta donde sabemos, los genomas de organismos superiores no son un ejemplo de lo bien que la selección natural “limpia” sus propios errores. Bien al contrario, son ejemplo de acumulación de fallos: copias de secuencias obtenidas por error, RNAs que pasan a ser secuencias de DNA y se insertan en el genoma miles de veces, fragmentos de genes que salpican el genoma, …
      Que ENCODE haya encontrado que el 80% del genoma se transcribe, no garantiza que todo el (o la mayoría) vaya a tener una función. Podría seguir siendo basura a pesar de que se exprese.
      Para mí lo más interesante del trabajo de ENCODE es que probablemente va a dar mucha información sobre secuencias que quizás habían pasado desapercibidas hasta ahora y que podrían estar implicadas en la regulación de los niveles de expresión de secuencias codificantes (secuencias promotoras e intensificadoras) y en los procesos epigenéticos.
      Mi impresión es que, aunque se exprese, gran parte del genoma seguirá siendo no funcional y que algunas secuencias pueden haber adquirido una nueva función, cual basura reciclada. Veremos.

  • […] Lecciones desde ENCODE, en Genes, Genomas y otras funcionalidades. […]

Deje una respuesta

 

 

 

Puedes utilizar estos tags HTML

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>