Menschliches Genom vollständig entschlüsselt

Die erste Sequenzierung des menschlichen Genoms im Jahr 2001 war bahnbrechend, denn sie lieferte erstmals eine Referenz für die rund sechs Millionen Basenpaare und rund 25.000 proteinkodierenden Gene unseres Erbguts. Doch dieses erste Referenzgenom war nicht vollständig, denn es umfasste nur rund 92 Prozent der gesamten DNA-Abfolge. Einige Millionen Basenpositionen im Erbgutstrang sind in dieser Version nur mit dem Buchstaben “N” gekennzeichnet, statt mit einem der Kürzel für die vier DNA-Basen. Diese bisher nicht entschlüsselten Regionen liegen vor allem an den sogenannten Centromeren, den zentralen Knotenpunkten der Chromosomen, die für den Ablauf der Zellteilung entscheidend sind. Aber auch an den Chromosomenenden, den Telomeren, liegen nicht entschlüsselte Bereiche.

Neue Sequenzierungstechnologie schließt Lücken

Ein Grund für diese Lücken sind die Grenzen der damals genutzten Sequenzierungstechnologien: Sie zerteilen das Erbgut in unzählige, jeweils nur rund hundert Basen lange DNA-Fragmente. Diese müssen nachträglich wieder in der richtigen Reihenfolge zusammengesetzt werden. Das aber ist unmöglich, wenn hunderte oder tausende dieser Stückchen nahezu identisch sind – und genau dies ist an den Centromeren und Telomeren der Chromosomen der Fall. Die dortigen Genombereiche bestehen aus unzähligen, vielfach wiederholten DNA-Abfolgen. Will man diese auf Basis kurzer DNA-Fragmente rekonstruieren, gleicht dies dem Versuch, ein Puzzle aus tausenden identisch gefärbten Puzzleteilen zusammenzusetzen: “Es ist, als wenn man beispielsweise nur Teile aus dem Himmel hat”, erklärt Winston Timp von der Johns Hopkins University, einer der Beteiligten am Telomere-to-Telomere (T2T) Konsortium.

Doch inzwischen hat die Sequenzierungstechnik Fortschritte gemacht. Zwei neue Methoden erlauben es nun, das Erbgut in deutlich längere Abschnitte zu zerteilen. Die sogenannte Oxford-Nanoporen-Sequenzierung kann bis zu eine Million Basen lange DNA-Abschnitte lesen, wenn auch nur mit mäßiger Genauigkeit. Ein zweites System von Pacific Biosciences erstellt rund 20.000 Basen lange Abschnitte, kann dieser aber mit 99-prozentiger Präzision auslesen. Die Wissenschaftler des T2T-Konsortiums haben nun beide Methoden in Kombination genutzt, um erstmals die noch fehlenden Abschnitte des menschlichen Genoms lückenlos zu dekodieren. Das Erbgut dafür stammte von einer menschlichen Zelllinie, bei der durch einen glücklichen Zufall alle Erbgutanteile nur von einem Elternteil stammen. Dadurch sind auch die Schwesterchromosomen identisch, was die Sequenzierung erleichtert.

Neue Gene, neue Varianten und der erste Blick ins Centromer

Das Ergebnis des T2T-Projekts ist nun das erste lückenlos entschlüsselte menschliche Genom. Die bisher fehlenden rund 200 Millionen Basen – etwa so viel wie in einem ganzen Chromosom enthalten wären – sind nun dekodiert. Unter ihnen sind 99 bisher unbekannte proteinkodierende Gene und fast 2000 weitere Genkandidaten. Das T2T-CHM13 getaufte Genom korrigiert zudem tausende strukturelle Fehler im bisherigen Referenzerbgut. “Damit sehen wir jetzt Kapitel im Buch des Lebens, die wir noch nie zuvor lesen konnten”, sagt Evan Eichler von University of Washington. “Der vollständige Bauplan unseres Erbguts wird unsere Vorstellungen der genetischen Variation, der Krankheiten und der Evolution des Menschen revolutionieren.” So decken beispielsweise viele der nun ergänzten DNA-Abschnitte Lücken in Genbereichen ab, deren Varianten als mögliche Ursachen für Krankheiten gelten. “Jetzt können wir sie identifizieren, weil wir ein vollständigeres und akkurates Referenzgenom haben”, sagt Karen Miga von der University of California in Santa Cruz.