Im Jahr 2001 wurde ein erster wichtiger Meilenstein der Genetik erreicht: Wissenschaftler des internationalen Humangenomprojekts (HGP) stellten eine erste sequenzierte Fassung weiter Teile des menschlichen Erbguts vor. Die DNA für diese mehr als zehn Jahre dauernde Entschlüsselung lieferten DNA-Proben von nur einer Handvoll Menschen, der größte Teil des Erbmaterials stammte von nur einer Person. Dennoch eröffnete dieses erste Referenzgenom eine neue Ära der Medizin und Genetik. Denn nun konnten individuelle Genanalysen mit dieser Referenz abgeglichen und auf Anomalien hin untersucht werden.
Allerdings hat dieses offizielle, seither mehrfach ergänzte Referenzgenom einige grundlegende Mängel: Es ist nicht vollständig, weil rund 210 Millionen DNA-Basenpaare fehlen oder nicht korrekt zugeordnet werden konnten. Dies liegt vor allem daran, dass viele Genom-Abschnitte aus vielen nahezu identischen Kopien und Wiederholungen bestehen. Die lange Zeit gängigen Sequenzierungsmethoden zerteilten das Erbgut aber in kurze, nur wenige hundert Basen lange Fragmente, die dann nachträglich wieder richtig zusammengesetzt werden mussten. Wenn es aber viele ähnliche Fragmente gibt, sind sie schwer zuzuordnen. Hinzu kommt, dass der größte Teil des als GRCh38 bezeichneten Referenzgenoms nur von einem Haplotyp stammt – dem halben Chromosomensatz eines einzigen Menschen. Damit repräsentiert es nicht einmal ansatzweise die genetische Vielfalt der menschlichen Populationen. Es ist ein aus Genschnipseln mehrerer Menschen zusammengestelltes Mosaikgenom – es gibt wahrscheinlich keine einzige menschliche Zelle auf unserem Planeten, die genau diese DNA-Abfolge aufweist.
Erst im Jahr 2022 gelang es Forschen des Telomere-to-Telomere (T2T) Konsortiums, erstmals das menschliche Erbgut vollständig und von einem Ende der Chromosomen zum anderen zu sequenzieren. Das T2T-CHM13 getaufte Referenzgenom enthüllte die Abfolge der rund 200 Millionen bisher nicht lesbaren Basen und korrigierte tausende strukturelle Fehler im bisherigen Referenz-Erbgut. Möglich wurde dies durch moderne Sequenziertechnologien, die sehr viel längere DNA-Abschnitte am Stück dekodieren können. Auch Fortschritte in der computergestützten Zusammenstellung zum kompletten Genom trugen dazu bei. Allerdings stammt das Erbmaterial für dieses Referenzgenom nur von einer einzigen Zelllinie und damit nur von einem einzigen Menschen. “Aber ein Genom ist nicht genug, um menschliche Vielfalt zu repräsentieren”, sagt Benedict Paten von der University of California in Santa Cruz.
Gemeinsamkeiten und Unterschiede auf einen Blick
Das internationale Team des Human Pangenome Reference Consortium (HPRC) hat es sich daher zum Ziel gesetzt, ein sogenanntes Pangenom zu erstellen – ein Referenzgenom, das für jeden Punkt entlang der DNA die verschiedenen Strukturvarianten des menschlichen Erbguts zeigt. Dort, wo alle Menschen die gleichen Gene haben und wenig Unterschiede haben, ähnelt dieses Referenzgenom einem einzigen Strang. An Stellen mit vielen Varianten fächert es sich dagegen in parallele Strangvarianten auf. Jetzt hat das Human Pangenome Reference Consortium ein erstes solches Pangenom auf Basis von 47 Individuen verschiedenster Abstammung vorgestellt. Anders als das bisherige Referenzgenom enthält es die genetische Information aller 46 Chromosomen der Zelle und unterscheidet dabei zwischen den Chromosomenkopien mit den väterlichen und mütterlichen Gensätzen. Dies ist wichtig, um beispielsweise den Einfluss verschiedener Allele eines Gens zu erforschen. Den Angaben des Konsortiums zufolge liegt die Genauigkeit des mithilfe mehrerer Methoden parallel zusammengestellten Pangenoms bei mehr als 99 Prozent und seine Vollständigkeit ebenfalls über 99 Prozent.





