Un consorcio internacional de científicos ha publicado la primera secuencia completa y sin huecos de un genoma humano, dos décadas después de que el Proyecto Genoma Humano produjera el primer borrador de la secuencia del genoma humano.
El genoma humano (el ADN que hay en cada una de nuestras células) está formado por una secuencia de nucleótidos. Estos nucleótidos pueden ser Adenina (A), Timina (T), guanina (G) y Citosina (C ), y según como se ordenen dan lugar a unos genes o a otros. El conjunto de todos los genes es lo que conocemos como genoma.
Según los investigadores, disponer de una secuencia completa y sin huecos de los aproximadamente 3.000 millones de bases (o «letras«) de nuestro ADN es fundamental para comprender todo el espectro de la variación genómica humana y para entender las contribuciones genéticas a determinadas enfermedades, ya que muchas enfermedades genéticas tienen lugar cuando ocurren ciertas mutaciones, es decir, cuando se «cambian» unas letras por otras (por ejemplo si dónde había una T ahora hay una C).
¿Quién ha realizado el trabajo?
El trabajo, publicado en la revista Science, fue realizado por el consorcio Telómero a Telómero, con el liderazgo de investigadores del Instituto Nacional de Investigación del Genoma Humano, parte de los Institutos Nacionales de Salud; la Universidad de California Santa Cruz y la Universidad de Washington. El NHGRI fue el principal financiador del estudio.
El análisis de la secuencia completa del genoma contribuirá significativamente a nuestro conocimiento de los cromosomas (ya que los cromosomas son secuencias de nuestro ADN enrolladas sobre si mismas de manera muy compacta, como los cables de los teléfonos fijos de toda la vida), incluyendo mapas más precisos de cinco brazos cromosómicos (los cromosomas tienen forma de X, el centro de la X sería el centrómero y las «rayitas» serían los brazos del cromosoma), lo que abre nuevas líneas de investigación. Esto ayuda a responder a preguntas de biología básica sobre cómo los cromosomas se segregan y dividen adecuadamente.
El consorcio T2T utilizó la secuencia del genoma, ahora completa, como referencia para descubrir más de 2 millones de variantes adicionales en el genoma humano. Estos estudios proporcionan información más precisa sobre las variantes genómicas dentro de 622 genes de importancia médica.
«La generación de una secuencia del genoma humano verdaderamente completa representa un logro científico increíble, ya que proporciona la primera visión completa de nuestro ADN –explica el doctor Eric Green, director del NHGRI–. Esta información fundamental reforzará los numerosos esfuerzos en curso para comprender todos los matices funcionales del genoma humano, lo que a su vez potenciará los estudios genéticos de las enfermedades humanas».
La secuencia del genoma humano, ahora completa, será especialmente valiosa para los estudios que pretenden establecer una visión global de la variación genómica humana, o de las diferencias en el ADN de las personas, , ya que el genoma de cada persona puede variar en función de muchos parámetros (por ejemplo, existen diferencias entre la secuencia de un europeo de un asiático, incluso entre la tuya y la mía, es decir, a grandes rasgos la inmensa mayoría del genoma es igual entre todos, pero claro, a poco que haya un 1% de diferencia, ya es un 1% de 3000 millones, que al final es una barbaridad de cambios de «letras»).
Estos conocimientos son vitales para comprender las contribuciones genéticas a determinadas enfermedades y para utilizar la secuencia del genoma como parte rutinaria de la atención clínica en el futuro. Muchos grupos de investigación ya han empezado a utilizar una versión previa a la publicación de la secuencia completa del genoma humano para sus investigaciones.
(Aclaración: lo que se suele hacer es coger la secuencia del paciente y compararla con bases de datos en las que se almacenan miles de secuencias y así se ven ciertos tipos de enfermedades genéticas.)
¿Qué se había secuenciado hasta ahora?
La secuenciación completa se basa en el trabajo del Proyecto Genoma Humano, que cartografió cerca del 92% del genoma, y en las investigaciones realizadas desde entonces.
Miles de investigadores han desarrollado mejores herramientas de laboratorio, métodos computacionales y enfoques estratégicos para descifrar la compleja secuencia. En Science se publican seis artículos que abarcan la secuencia completa, junto con otros artículos complementarios en varias otras revistas.
Ese último 8% incluye numerosos genes y ADN repetitivo y su tamaño es comparable al de un cromosoma entero (los humanos tenemos 23 pares de cromosomas, por lo tanto, un cromosoma solo contiene una burrada de información genética). Los investigadores generaron la secuencia completa del genoma utilizando una línea celular especial que tiene dos copias idénticas de cada cromosoma, a diferencia de la mayoría de las células humanas, que llevan dos copias ligeramente diferentes.
Los investigadores observaron que la mayoría de las nuevas secuencias de ADN añadidas se encontraban cerca de los telómeros repetitivos (extremos largos y finales de cada cromosoma) y de los centrómeros (secciones densas del centro de cada cromosoma).
«Desde que se obtuvo el primer borrador de la secuencia del genoma humano, determinar la secuencia exacta de regiones genómicas complejas ha sido un reto –afirma el doctor Evan Eichler, investigador de la Facultad de Medicina de la Universidad de Washington y copresidente del consorcio T2T–. Estoy encantado de que hayamos conseguido el trabajo. El proyecto completo va a revolucionar la forma en que pensamos sobre la variación genómica humana, las enfermedades y la evolución».
El coste de la secuenciación de un genoma humano mediante tecnologías de «lectura corta», que proporcionan varios cientos de bases de la secuencia de ADN a la vez, es de sólo unos cientos de dólares, habiendo disminuido considerablemente desde el final del Proyecto Genoma Humano. Esto facilita que en un tiempo se utilice la secuenciación como una técnica rutinaria a la hora de diagnosticar enfermedades genéticas.
Sin embargo, el uso de estos métodos de lectura corta por sí solos sigue dejando algunas lagunas en las secuencias genómicas ensambladas. El enorme descenso de los costes de secuenciación del ADN viene acompañado de un aumento de las inversiones en nuevas tecnologías de secuenciación del ADN para generar lecturas de secuencias de ADN más largas sin comprometer la precisión.
En la última década, surgieron dos nuevas tecnologías de secuenciación de ADN que producen lecturas de secuencias mucho más largas. El método de secuenciación de ADN Oxford Nanopore puede leer hasta un millón de letras de ADN en una sola lectura con una precisión modesta, mientras que el método de secuenciación de ADN PacBio HiFi puede leer unas 20.000 letras con una precisión casi perfecta.
Los investigadores del consorcio T2T utilizaron ambos métodos de secuenciación de ADN para generar la secuencia completa del genoma humano. (Todo esto viene a que la secuenciación tradicionalmente consiste en coger la el genoma de esa persona, cortarlo en cachitos pequeños y luego pegar esos cachitos, entonces, cuanto más grandes consigamos que sean esos cachitos mejor, porque así se cometen menos errores al empalmar los cachitos).
«Gracias a los métodos de lectura larga, hemos logrado avances en nuestra comprensión de las partes más difíciles y ricas en repeticiones del genoma humano –subraya afirma la doctora Karen Miga, copresidenta del consorcio T2T, cuyo grupo de investigación en la Universidad de California, Santa Cruz, está financiado por el NHGRI–. Esta secuencia completa del genoma humano ya ha proporcionado nuevos conocimientos sobre la biología del genoma, y espero con interés la próxima década de descubrimientos sobre estas regiones recién reveladas«.
¿Qué se espera en el futuro?
Según el copresidente del consorcio, el doctor Adam Phillippy, cuyo grupo de investigación en el NHGRI dirigió el esfuerzo de acabado, la secuenciación del genoma completo de una persona debería ser menos costosa y más sencilla en los próximos años.
«En el futuro, cuando se secuencie el genoma de una persona, podremos identificar todas las variantes de su ADN y utilizar esa información para orientar mejor su atención sanitaria –apunta Phillippy–. Terminar realmente la secuencia del genoma humano ha sido como ponerse unas gafas nuevas. Ahora que podemos ver todo con claridad, estamos un paso más cerca de entender lo que significa todo».