Vor 21 Jahren hat das Humangenomprojekt zum ersten Mal das menschliche Erbgut entschlüsselt – aber einige entscheidende Regionen blieben damals unkartiert. Jetzt hat ein internationales Forschungs-Konsortium die Lücken geschlossen. Zum ersten Mal wurde die DNA aller menschlichen Chromosomen von Spitze zu Spitze sequenziert. Dadurch sind nun auch die von unzähligen Wiederholungen gekennzeichneten Genabschnitte im Zentrum der Chromosomen und an ihren Enden lesbar. Das eröffnet neue Einblicke in die Regulation der Gene und Zellteilung, in die Variationsbreite des menschlichen Erbguts und in die Ursachen von Krankheiten.
Die erste Sequenzierung des menschlichen Genoms im Jahr 2001 war bahnbrechend, denn sie lieferte erstmals eine Referenz für die rund sechs Millionen Basenpaare und rund 25.000 proteinkodierenden Gene unseres Erbguts. Doch dieses erste Referenzgenom war nicht vollständig, denn es umfasste nur rund 92 Prozent der gesamten DNA-Abfolge. Einige Millionen Basenpositionen im Erbgutstrang sind in dieser Version nur mit dem Buchstaben “N” gekennzeichnet, statt mit einem der Kürzel für die vier DNA-Basen. Diese bisher nicht entschlüsselten Regionen liegen vor allem an den sogenannten Centromeren, den zentralen Knotenpunkten der Chromosomen, die für den Ablauf der Zellteilung entscheidend sind. Aber auch an den Chromosomenenden, den Telomeren, liegen nicht entschlüsselte Bereiche.
Neue Sequenzierungstechnologie schließt Lücken
Ein Grund für diese Lücken sind die Grenzen der damals genutzten Sequenzierungstechnologien: Sie zerteilen das Erbgut in unzählige, jeweils nur rund hundert Basen lange DNA-Fragmente. Diese müssen nachträglich wieder in der richtigen Reihenfolge zusammengesetzt werden. Das aber ist unmöglich, wenn hunderte oder tausende dieser Stückchen nahezu identisch sind – und genau dies ist an den Centromeren und Telomeren der Chromosomen der Fall. Die dortigen Genombereiche bestehen aus unzähligen, vielfach wiederholten DNA-Abfolgen. Will man diese auf Basis kurzer DNA-Fragmente rekonstruieren, gleicht dies dem Versuch, ein Puzzle aus tausenden identisch gefärbten Puzzleteilen zusammenzusetzen: “Es ist, als wenn man beispielsweise nur Teile aus dem Himmel hat”, erklärt Winston Timp von der Johns Hopkins University, einer der Beteiligten am Telomere-to-Telomere (T2T) Konsortium.
Doch inzwischen hat die Sequenzierungstechnik Fortschritte gemacht. Zwei neue Methoden erlauben es nun, das Erbgut in deutlich längere Abschnitte zu zerteilen. Die sogenannte Oxford-Nanoporen-Sequenzierung kann bis zu eine Million Basen lange DNA-Abschnitte lesen, wenn auch nur mit mäßiger Genauigkeit. Ein zweites System von Pacific Biosciences erstellt rund 20.000 Basen lange Abschnitte, kann dieser aber mit 99-prozentiger Präzision auslesen. Die Wissenschaftler des T2T-Konsortiums haben nun beide Methoden in Kombination genutzt, um erstmals die noch fehlenden Abschnitte des menschlichen Genoms lückenlos zu dekodieren. Das Erbgut dafür stammte von einer menschlichen Zelllinie, bei der durch einen glücklichen Zufall alle Erbgutanteile nur von einem Elternteil stammen. Dadurch sind auch die Schwesterchromosomen identisch, was die Sequenzierung erleichtert.
Neue Gene, neue Varianten und der erste Blick ins Centromer
Das Ergebnis des T2T-Projekts ist nun das erste lückenlos entschlüsselte menschliche Genom. Die bisher fehlenden rund 200 Millionen Basen – etwa so viel wie in einem ganzen Chromosom enthalten wären – sind nun dekodiert. Unter ihnen sind 99 bisher unbekannte proteinkodierende Gene und fast 2000 weitere Genkandidaten. Das T2T-CHM13 getaufte Genom korrigiert zudem tausende strukturelle Fehler im bisherigen Referenzerbgut. “Damit sehen wir jetzt Kapitel im Buch des Lebens, die wir noch nie zuvor lesen konnten”, sagt Evan Eichler von University of Washington. “Der vollständige Bauplan unseres Erbguts wird unsere Vorstellungen der genetischen Variation, der Krankheiten und der Evolution des Menschen revolutionieren.” So decken beispielsweise viele der nun ergänzten DNA-Abschnitte Lücken in Genbereichen ab, deren Varianten als mögliche Ursachen für Krankheiten gelten. “Jetzt können wir sie identifizieren, weil wir ein vollständigeres und akkurates Referenzgenom haben”, sagt Karen Miga von der University of California in Santa Cruz.
Ebenfalls bedeutsam sind die neuen Erkenntnisse über die Struktur der Centromere, der Knotenpunkte, die die beiden Hälften der Chromosomen zusammenhalten. Sie spielen eine entscheidende Rolle bei der Meiose, der Reifeteilung, die diese Schwesterchromatiden trennt. “Wenn dieser Schritt der Meiose schiefläuft, kann es zu Chromosomen-Anomalien kommen, die Fehlgeburten oder genetisch bedingte Krankheiten verursachen”, erklärt Nicolas Altemose von der University of California in Berkeley. Auch Krebs kann die Folge einer solchen fehlregulierten Teilung sein. Umso wichtiger ist es, den Code der Centromere zu kennen, um die Ursachen solcher Anomalien identifizieren zu können. Genau dies ist nun dank des neuen T2T-Referenzgenoms möglich. “Vorher hatten wir nur ein extrem verschwommenes Bild dessen, was sich dort verbirgt. Aber jetzt ist es klar bis in die einzelne DNA-Base hinein”, so Altemose.
Die erste vollständige, lückenlose Entschlüsselung des menschlichen Erbguts sei ein bedeutsamer Meilenstein, kommentiert Bob Waterston von der University of Washington, einer der Mitarbeiter am ersten Humangenomprojekt. “Wir hätten das liebend gern schon vor 20 Jahren gemacht, aber damals war die Technologie einfach noch nicht so weit.” Doch die Arbeit des T2T-Konsortiums ist damit noch nicht beendet: Sie arbeiten bereits daran, nun auch ein Erbgut mit dem normalen, von beiden Elternteilen stammenden Chromosomensatz zu entschlüsseln. Außerdem wollen sie das Genom von Menschen aus verschiedenen Populationen mit ähnlicher Genauigkeit und Vollständigkeit sequenzieren – dies könnte neue Einblicke in die Gemeinsamkeiten, Unterschiede und die Evolution der verschiedenen Menschentypen liefern.
Quelle: T2T Consortium, Science, doi: 10.1126/science.abp8653; doi: 10.1126/science.abj6987 etc.