Vor gut 22 Jahren haben Forscher erstmals das menschliche Erbgut entschlüsselt. Doch diese DNA-Sequenz war noch lückenhaft und stammte nur von einer Handvoll Individuen. Jetzt stellt das Human Pangenome Reference Consortium das erste Pangenom der Menschheit vor – ein Referenz-Erbgut bestehend aus 47 vollständigen und von Menschen aus verschiedenen Populationen stammenden Einzelgenomen. Das Pangenom spiegelt damit zum ersten Mal auch die genetische Diversität der menschlichen Spezies wider und deckt zudem Millionen zuvor unbekannter Strukturvarianten auf. Dieser Meilenstein der Genetik ermöglicht es nun, individuelle Unterschiede, aber auch krankhafte Veränderungen des Erbguts besser zu erforschen und zu erkennen als jemals zuvor.
Im Jahr 2001 wurde ein erster wichtiger Meilenstein der Genetik erreicht: Wissenschaftler des internationalen Humangenomprojekts (HGP) stellten eine erste sequenzierte Fassung weiter Teile des menschlichen Erbguts vor. Die DNA für diese mehr als zehn Jahre dauernde Entschlüsselung lieferten DNA-Proben von nur einer Handvoll Menschen, der größte Teil des Erbmaterials stammte von nur einer Person. Dennoch eröffnete dieses erste Referenzgenom eine neue Ära der Medizin und Genetik. Denn nun konnten individuelle Genanalysen mit dieser Referenz abgeglichen und auf Anomalien hin untersucht werden.
Allerdings hat dieses offizielle, seither mehrfach ergänzte Referenzgenom einige grundlegende Mängel: Es ist nicht vollständig, weil rund 210 Millionen DNA-Basenpaare fehlen oder nicht korrekt zugeordnet werden konnten. Dies liegt vor allem daran, dass viele Genom-Abschnitte aus vielen nahezu identischen Kopien und Wiederholungen bestehen. Die lange Zeit gängigen Sequenzierungsmethoden zerteilten das Erbgut aber in kurze, nur wenige hundert Basen lange Fragmente, die dann nachträglich wieder richtig zusammengesetzt werden mussten. Wenn es aber viele ähnliche Fragmente gibt, sind sie schwer zuzuordnen. Hinzu kommt, dass der größte Teil des als GRCh38 bezeichneten Referenzgenoms nur von einem Haplotyp stammt – dem halben Chromosomensatz eines einzigen Menschen. Damit repräsentiert es nicht einmal ansatzweise die genetische Vielfalt der menschlichen Populationen. Es ist ein aus Genschnipseln mehrerer Menschen zusammengestelltes Mosaikgenom – es gibt wahrscheinlich keine einzige menschliche Zelle auf unserem Planeten, die genau diese DNA-Abfolge aufweist.
Erst im Jahr 2022 gelang es Forschen des Telomere-to-Telomere (T2T) Konsortiums, erstmals das menschliche Erbgut vollständig und von einem Ende der Chromosomen zum anderen zu sequenzieren. Das T2T-CHM13 getaufte Referenzgenom enthüllte die Abfolge der rund 200 Millionen bisher nicht lesbaren Basen und korrigierte tausende strukturelle Fehler im bisherigen Referenz-Erbgut. Möglich wurde dies durch moderne Sequenziertechnologien, die sehr viel längere DNA-Abschnitte am Stück dekodieren können. Auch Fortschritte in der computergestützten Zusammenstellung zum kompletten Genom trugen dazu bei. Allerdings stammt das Erbmaterial für dieses Referenzgenom nur von einer einzigen Zelllinie und damit nur von einem einzigen Menschen. “Aber ein Genom ist nicht genug, um menschliche Vielfalt zu repräsentieren”, sagt Benedict Paten von der University of California in Santa Cruz.
Gemeinsamkeiten und Unterschiede auf einen Blick
Das internationale Team des Human Pangenome Reference Consortium (HPRC) hat es sich daher zum Ziel gesetzt, ein sogenanntes Pangenom zu erstellen – ein Referenzgenom, das für jeden Punkt entlang der DNA die verschiedenen Strukturvarianten des menschlichen Erbguts zeigt. Dort, wo alle Menschen die gleichen Gene haben und wenig Unterschiede haben, ähnelt dieses Referenzgenom einem einzigen Strang. An Stellen mit vielen Varianten fächert es sich dagegen in parallele Strangvarianten auf. Jetzt hat das Human Pangenome Reference Consortium ein erstes solches Pangenom auf Basis von 47 Individuen verschiedenster Abstammung vorgestellt. Anders als das bisherige Referenzgenom enthält es die genetische Information aller 46 Chromosomen der Zelle und unterscheidet dabei zwischen den Chromosomenkopien mit den väterlichen und mütterlichen Gensätzen. Dies ist wichtig, um beispielsweise den Einfluss verschiedener Allele eines Gens zu erforschen. Den Angaben des Konsortiums zufolge liegt die Genauigkeit des mithilfe mehrerer Methoden parallel zusammengestellten Pangenoms bei mehr als 99 Prozent und seine Vollständigkeit ebenfalls über 99 Prozent.
Das resultierende Referenzgenom ergänzt das bisher entschlüsselte Erbgut um 1115 Gen-Dopplungen und 119 Millionen Basenpaare. Unter diesen 119 Millionen DNA-Basenpaaren gehen rund 90 Millionen auf Strukturvarianten zurück – DNA-Abschnitte, die durch Sequenzwiederholungen, Einfügungen, fehlende Teile oder Umkehrungen von DNA-Abfolgen verändert sind. Damit erhöht sich die Zahl der bekannten Strukturvarianten um 104 Prozent. “Die früheren Genomstudien erzeugten den Eindruck, dass unser menschliches Erbgut ‘flach’ ist und bei jedem Menschen sehr ähnlich, nur unterschieden durch eine Handvoll Punktmutationen”, sagt Erik Garrison vom Memphis College of Medicine. “Aber das menschliche Pangenom zeigt nun, dass jeder von uns ein wenig DNA in sich trägt, die ungewöhnlich oder sogar einzigartig ist.” Konsortiumsmitglied Evan Eichler von University of Washington in Seattle ergänzt: “Das Pangenom repräsentiert eine ganz neue Sichtweise der menschlichen genetischen Variation. Es hat das Potenzial, unser Bild der genetischen Vielfalt unserer Spezies zu transformieren.”
Neuer Blick auf genetisch bedingte Krankheiten
Gleichzeitig eröffnet das Pangenom auch neue Chancen, Krankheiten und ihre genetischen Wurzeln besser zu verstehen. „Da ein Großteil der menschlichen Diversität in dem Pangenom abgebildet werden soll, wird es einfacher, Sequenzabschnitte im Genom einer Person, die potenziell mit Krankheiten in Verbindung stehen, zu entdecken”, erklärt der nicht am Projekt beteiligte Siegfried Schloissnig vom Forschungsinstitut für Molekulare Pathologie in Wien. “In vielen Individuen vorkommende Sequenzabschnitte können so ausgeschlossen werden. Alles, was noch nicht im Pangenom enthalten ist, stellt dann entweder die genomische Individualität einer Person dar oder könnte in Verbindung mit einer Krankheit stehen.”
Doch dieser Meilenstein ist erst der Anfang: Das Human Pangenome Reference Consortium plant, die Genome von insgesamt 350 Menschen auf diese Weise zu sequenzieren und in das Pangenom einzufügen. Schon im Jahr 2024 soll dann dieses neue, noch umfassendere Pangenom fertig sein. “Dies ist nicht das Ende eines Projekts, sondern der Anfang einer neuen Ära, in der die menschliche Diversität in vollerem Umfang in die biologischen, biomedizinischen und klinischen Wissenschaften integriert wird”, sagt Konsortiumsmitglied Ting Wang von der Washington University in St. Louis. “Die neue Genom-Referenz wird weiterwachsen, sich erweitern und optimiert werden, um die genetische Blaupause unserer Spezies zu zeigen.”
Quelle: Benedict Paten (University of California, Santa Cruz) et al., Nature, doi: 10.1038/s41586-023-05896-x