Erbgut: Das Pangenom des Menschen - wissenschaft.de | Bild der Wissenschaft
BDW PlusGesundheit & Medizin
Das Pangenom des Menschen
Die Entschlüsselung des menschlichen Genoms ist eine Mammutaufgabe. Sie wird viele Generationen von Wissenschaftlern beschäftigen. Doch es geht voran. Ein internationales Team aus 119 Forschern hat im Mai 2023 einen neuen digitalen Datensatz unseres Erbguts vorgestellt (bdw berichtete in Heft 7/21 und auf…
Sie haben noch 1 von 3 kostenlosen Artikeln übrig2/3
von RAINER KURLEMANN
Die Entschlüsselung des menschlichen Genoms ist eine Mammutaufgabe. Sie wird viele Generationen von Wissenschaftlern beschäftigen. Doch es geht voran. Ein internationales Team aus 119 Forschern hat im Mai 2023 einen neuen digitalen Datensatz unseres Erbguts vorgestellt (bdw berichtete in Heft 7/21 und auf wissenschaft.de). Diese detaillierte Version übertrifft alle bisherigen Fassungen bei Weitem. Denn sie bildet nicht nur 99 Prozent des DNA-Strangs ab, sie erreicht dabei auch eine Genauigkeit von 99 Prozent.
Zudem sind die Forscher einen weiteren wichtigen Schritt gegangen: den vom einzelnen Menschen hin zur Menschheit. Der Datensatz basiert nicht mehr auf einer Person, er verknüpft das Genom von derzeit 47 Individuen unterschiedlicher Herkunft zu einem Pangenom des Menschen. Er ist das Ergebnis von Fortschritten in der Technik der Sequenzierung des Genoms und bei der Entwicklung von Algorithmen, mit denen sich große Datenmengen ordnen und auswerten lassen.
„Wenn ich vor zehn Jahren gefragt worden wäre, ob das möglich ist, dann hätte ich geantwortet: Die Ideen existieren, aber für die Umsetzung fehlen an allen Ecken und Enden die nötigen Methoden, sowohl in der Informatik als auch bei der Sequenzierung der DNA“, sagt Tobias Marschall. Der Direktor des Instituts für medizinische Biometrie und Bioinformatik der Universität Düsseldorf gehört zu den fünf leitenden Wissenschaftlern des Human Pangenome Reference Consortium. Das Pangenom wird der internationale Vergleichsstandard der Genforschung werden. Wissenschaftler wollen den Einfluss der Gene auf biologische Vorgänge im menschlichen Körper besser verstehen. Mediziner sollen damit Auffälligkeiten im Erbgut ihrer Patienten erkennen.
Trotz der großen Bedeutung haben die Forscher auf einen pompösen Rahmen für die Präsentation ihrer Ergebnisse verzichtet. Das war in der Genforschung schon anders. 2001 hatte US-Präsident Bill Clinton in den East Room des Weißen Hauses eingeladen, „um die Fertigstellung der ersten Vermessung des gesamten menschlichen Genoms zu feiern“. Doch damals war die erste entschlüsselte Version der mehr als drei Milliarden Buchstaben des menschlichen Gencodes ebenso wenig vollständig wie im Jahr 2003, als das internationale Forscherteam des Human Genome Project (HGP) das Schließen der letzten Lücken verkündete.
Es war immer „nur so vollständig, wie es die Technologie erlaubt“, stellt die HGP-Internetseite heute klar. In Zahlen ausgedrückt: Etwa 90 Prozent des DNA-Strangs konnten damals entziffert werden. Erst im April 2022 gelang es dem Konsortium die verbliebenen Lücken zu füllen.
Strukturelle Varianten
Probleme bereiteten vor allem die Bereiche, die ungeordnet wirken, weil sich dort kurze oder längere Abschnitte des Genoms hunderte oder tausende Male wiederholen, sich dabei umgekehrt anordnen, Abschnitte tauschen und einzelne Fragmente löschen. Zu Anfang wurden diese besonderen Abschnitte, die als strukturelle Varianten bezeichnet werden, als nicht so wichtig bewertet. Aber das erwies sich als Fehleinschätzung. Heute gilt es als sicher, dass strukturelle Varianten einen erheblichen Einfluss haben. Sie können beispielsweise die Aktivität von Genen regulieren, weil sie die räumliche Anordnung der DNA beeinflussen.
Mehr aus Gesundheit & Medizin
Weitere aktuelle Artikel aus der Rubrik Gesundheit & Medizin.
Wer die Funktion des Erbguts des Menschen erforschen will, muss also das große Ganze betrachten. Schon 2007 konnte Gen-Pionier Craig Venter zeigen, dass es beim genetischen Vergleich zweier Personen mehr Unterschiede innerhalb der strukturellen Varianten gibt als Änderungen, die nur einen Buchstaben des genetischen Codes betreffen. Letztere sind unter dem Begriff Mutation bekannt. Für die Bedeutung von Veränderungen im repetitiven Bereich war die Forschung dagegen lange Zeit blind. Bisherige Studien hätten vor allem die Teile des Genoms untersucht, die die meisten Gene enthalten, so André Reis. „Doch die strukturellen Varianten im Genom können einen großen Einfluss auf die Funktionen im Körper haben und somit auch gesundheitlich relevant sein“, urteilt der Direktor des Humangenetischen Instituts am Universitätsklinikum Erlangen.
„Viele dieser Varianten konnten bisher bei Genanalysen etwa zur Bewertung eines Krankheitsrisikos gar nicht erfasst werden, weil sie im alten Referenzgenom nicht abgebildet wurden, dann fehlt einfach die Möglichkeit zum Vergleich“, sagt Marschall. Darunter leiden auch die genomweiten Vergleichsstudien (GWAS), die die Rolle des Erbguts als Risikofaktor für Volkskrankheiten untersuchen. Hier werden genetische Daten von zehntausenden Patienten mit denen von ebenso vielen gesunden Menschen verglichen. Manchmal lassen sich dabei auffällige Unterschiede zwischen den Gruppen finden: Bestandteile des Genoms, die offenbar die Entstehung der Krankheit begünstigen. Das Referenzgenom ist dabei die gemeinsame Basis, die Vergleiche erleichtert, vergleichbar mit dem Meter oder Kilogramm als Bezugsgröße im Handwerk.
Aber die GWAS-Analysen sind nicht so gut, wie sie sein könnten. Bei Studien zu Erkrankungen des Herz-Kreislauf-Systems fehlte beispielsweise bisher oft der Einfluss des LPA-Gens. Es codiert das für den Fettstoffwechsel und Arteriosklerose entscheidende Lipoprotein A. Dieses Gen ist sehr komplex und enthält viele Wiederholungen. Ein genetischer Fehler entsteht meist nicht durch einzelne Mutationen, sondern dadurch, dass Wiederholungen nicht in der richtigen Abfolge oder Häufigkeit vorkommen. Dank der Verbesserungen durch das Pangenom als neuem Referenzsystem lässt sich dieser Effekt besser messen.
Ähnliches gilt für die Gene C4A und C4B, die eine große Bedeutung für die individuelle Stärke der Immunabwehr besitzen. Die beiden Gene haben sich während der Entwicklung des Menschen wohl aus demselben Vorläufer entwickelt. Sie ähneln einander sehr stark, obwohl sie unterschiedliche Aufgaben haben. „Bisher war es kaum möglich, ein kurzes Sequenzstück aus einer Genanalyse exakt einer der beiden Kopien zuzuordnen“, erklärt Marschall. Damit das in Zukunft besser gelingt, haben die Genetiker und Informatiker für sich einen hohen Qualitätsanspruch formuliert. Das Pangenom sollte nicht nur nahezu lückenlos sein, sondern auch korrekt. „Wenn wir einen Unterschied in einer Sequenz entdecken, soll es auch ein real existierender Unterschied sein und nicht nur ein Fehler bei der Auswertung der Sequenzierung“, sagt der Bioinformatiker. Deshalb ist die Veröffentlichung des Pangenoms nicht das Ende eines Forschungsprojekts, sondern ein Impuls für die weltweite Erforschung der biologischen und genetischen Ursachen von Krankheiten. Das neue Wissen soll der Forschung dienen. Alle Wissenschaftler, die sich mit dem menschlichen Erbgut beschäftigen, können es nutzen. Die 47 Datenspender haben eine umfangreiche Einwilligung zur Verwendung aller genomischen Daten erteilt. Bis Ende 2024 soll die Datenbank die Erbgut-Informationen von 350 Individuen zusammenführen. Die Informatiker haben mit den Algorithmen ein öffentlich zugängliches Pangenom bereitgestellt und liefern zusätzlich etliche Softwaretools auf Open-Source-Basis, die allesamt frei zugänglich verwendet werden dürfen. „Wenn die Daten aus dem Sequenziergerät kommen, durchlaufen sie noch bestimmte Qualitätskontrollen, danach sind sie vom ersten Moment öffentlich zugänglich“, sagt Marschall.
Neue DNA-Technologie
Das Pangenom verdankt seine Existenz vor allem den immensen Fortschritten in der Technologie zur DNA-Analyse. Der britische Chemiker Frederick Sanger hat 1980 einen Nobelpreis bekommen, weil er sehr kleine Genome analysieren konnte, indem er einen Bestandteil der DNA nach dem anderen entfernte und identifizierte. Doch dieser Aufwand lässt sich nicht auf das Erbgut des Menschen übertragen. Die Methoden zur Bestimmung der exakten Reihenfolge der Bausteine des Erbguts haben sich erheblich verbessert. Anfang dieses Jahrhunderts hat sich das „Next Generation Sequencing“ (NGS) etabliert. Dieses Verfahren zerteilt das Erbgut millionenfach relativ zufällig in kurze Fragmente mit etwa 100 Buchstaben, die gleichzeitig sequenziert werden. Ein Computerprogramm sucht dann in den Fragmenten nach übereinstimmenden Passagen und baut diese als „Reads“ bezeichneten Stücke wie ein Puzzle zu der langen Buchstabenfolge des DNA-Strangs zusammen. NGS hat die Kosten für Genanalysen deutlich verringert und ist noch immer die Standardmethode.
Aber dieses Verfahren muss natürlich an den Stellen scheitern, wo sich die Abfolge im Genom häufig wiederholt. Zudem gibt es Probleme, wenn der kurze Read zu wenig Ähnlichkeit mit dem Referenzgenom aufweist. Bisher wurde das sequenzierte Stück dann einfach ignoriert, es blieb „unmapped“.
Seit etwa fünf Jahren bieten zwei Gerätehersteller auch „Long Reads“ an, deren Erstellung deutlich teurer ist, die aber eine Sequenzierung längerer Stücke in guter Qualität erlaubt. Bei der SMRT-Technologie von Pacific Bioscience (PacBio) aus Kalifornien haben die einzelnen Fragmente eine Länge von etwa 20.000 Buchstaben, beim Konkurrenten Oxford Nanopore Technology aus Großbritannien sind es sogar zwischen 100.000 und einer Million Buchstaben. Beide Hersteller sind eng in das Pangenom-Projekt eingebunden. Ihre Technologie hat zwar eine höhere Fehlerquote, aber Computeralgorithmen können diese Schwäche ausgleichen. Die Long Reads können viele Wiederholungen enthalten und damit die Lücke schließen, um bisher unbekannte strukturelle Varianten aufklären zu können. „Das Aufkommen dieser Technologie bot uns endlich die Gelegenheit, das Referenzgenom vollständig neu aufzubauen“, sagt Marschall. Der Fortschritt kam zur rechten Zeit, denn schon 2015 gab es Überlegungen dazu, wie ein Pangenom erstellt werden könnte, berichtet Marschall, der damals einen Workshop an der Universität im niederländischen Leiden organisierte.
Gleichzeitig war den Genforschern klar, dass ein neues Referenzgenom nicht mehr überwiegend von einer Person stammen kann. Dieser willkürliche Ansatz kann die genetische Vielfalt der Menschheit nicht abbilden. Das Forscherteam profitierte vom „1000-Genom-Projekt“, einem internationalen Verbund, der im Jahr 2008 mit dem Ziel startete, einen detaillierten Katalog menschlicher genetischer Variationen zu erstellen. Für das Projekt wurden Menschen unterschiedlicher Herkunft gesucht. Sie gaben Blutproben ab, aus denen dann Zellen gezüchtet und deren DNA entnommen und analysiert wurde. Da bei Menschen jedes Chromosom zweimal vorliegt, umfasst die aktuelle Referenz insgesamt 94 verschiedene Genomversionen.
Software-Fortschritte
Die möglichst fehlerfreie Datensammlung ist aber nur eine Aufgabe. Die Informatiker mussten gleichzeitig eine Struktur festlegen, die auch die Unterschiedlichkeit der Genome widerspiegeln kann. Sie entschieden sich für ein graphenbasierte Datenbank. Diese Struktur enthält Knoten für die Stellen, an denen die Genome nahezu identisch sind, und Pfade, die von einem Knoten zum anderen führen. Diese Pfade können sich voneinander unterscheiden, sie stellen die Variationen im Erbgut dar. Einige Pfade sind breiter als andere, diese Versionen kommen dann häufiger vor. „Mit welcher Datenstruktur wir das Pangenom abbilden würden, war zu Anfang nicht klar. Die beteiligten Teams hatten verschiedene Ideen, die miteinander konkurrierten, bis wir den besten Weg gefunden hatten, um die Anforderungen zu erfüllen“, erzählt Marschall.
Das Düsseldorfer Forscherteam hat sich einer weiteren Aufgabe gewidmet. Es konnte den Informationsgehalt der bestehenden Daten verbessern, wenn diese aus kurzen Reads stammen. Die Datenspezialisten erarbeiteten ein Softwaretool, mit dem die älteren Daten besser ausgewertet werden als vorher und vergleicht sie dabei mit dem neuen Pangenom. „Wenn diese Genomdaten mit herkömmlichen Methoden analysiert werden, findet man etwa 10.000 strukturelle Varianten, mit unserer neuen Software ermitteln wir 18.000“, erklärt Marschall den Fortschritt. Der Einsatz der teuren Long-Read-Technologie würde weitere 7000 Varianten aufzeigen, doch der Aufwand dafür ist erheblich.
Experten rechnen damit, dass in den nächsten Jahren viele bereits existierende Studien von Forschergruppen neu berechnet werden, wenn die bessere Software zur Auswertung der Genom-Daten zur Verfügung steht. Denn es liegen weltweit bereits Millionen von Datensätzen aus vielen Studien vor, die kurze Reads verwenden. Diese Entwicklung kann der Wissenschaft viele neue Erkenntnisse zur Bedeutung der Gene liefern. Davon könnten auch die Staaten profitieren, die bereits nationale Gendatenbanken für Forschungszwecke und zur Verbesserung der Gesundheit durch personalisierte Medizin aufgebaut haben. In vielen europäischen Ländern wie Estland, Island, Großbritannien, den Niederlanden, aber auch in den USA laufen seit vielen Jahren Programme, bei denen die Bürger freiwillig Genanalysen machen lassen. Deutschland agiert auf diesem Gebiet abgesehen von der Tumordiagnostik eher zurückhaltend.
Ursachen und Therapien
Die Vielfalt innerhalb des Pangenoms zeigt auch, dass viele DNA-Veränderungen ohne Folgen bleiben. „Ein Genom ist wie ein Mosaik, das aus der Entfernung ein Gesamtbild ergibt. Viele Teile können durch Ähnliche ersetzt werden, ohne das Ergebnis zu verfälschen“, erklärt Siegfried Schloissnig vom Forschungsinstitut für Molekulare Pathologie (IMP) in Wien. Das Pangenom stelle eine Art Katalog dar, der besage, was an gewissen Stellen möglich ist, um noch ein gleichwertiges Ergebnis zu erhalten, so der Forscher. Oder anders formuliert: Wenn eine Sequenzveränderung in mehreren Individuen vorkommt, ist die Wahrscheinlichkeit hoch, dass diese nicht direkt an der Entstehung einer Krankheit beteiligt ist.
Gleichzeitig verbessert sich die Chance, die Ursache von seltenen Erkrankungen zu ermitteln. Zwar vermuten die Mediziner, dass sie mit Mutationen im Erbgut zusammenhängen. Doch nur 30 Prozent der betroffenen Menschen bekommen derzeit nach einer Genanalyse eine entsprechende Diagnose. Bei den anderen kann mit der bisher verwendeten Technologie keine Auffälligkeit im Genom gefunden werden. „Jetzt haben wir eine bessere Chance zu vergleichen, welche Varianten wir bei den betroffenen Patienten finden, die im Pangenom nicht vorhanden sind“, erklärt Marschall. Er erwartet, dass der Anteil der Analysen, die zu einer Diagnose führen, deutlich größer wird. Ein solches Resultat liefert wichtige Hinweise für die Ursachenforschung und mögliche Therapien.
Allerdings wird auch das Pangenom nicht die Entstehung aller Erkrankungen erklären können. Neben der echten Veränderung des Genoms kann auch eine unterschiedliche Regulation der Genaktivität durch Epigenetik Krankheiten verursachen. Solche Effekte kann das Pangenom nicht abbilden. Ebenso wenig wie einen ungesunden Lebenswandel, der zu den häufigen Ursachen von Krankheiten zählt.
Doch das neue Werkzeug der Genforscher liefert auch andere Informationen. Forscher können nun viel gezielter danach suchen, welche Spuren beispielsweise Infektionskrankheiten wie die Pest im Genom hinterlassen haben oder warum einige Menschen Alkohol, Koffein oder Laktose besser vertragen als andere.
Evolution der Menschheit
Interessant sind auch die Informationen zur genetischen Evolution der Menschheit. Im Pangenom sind einige Bereiche zu erkennen, in denen es extrem wenige Veränderungen zwischen den Individuen gibt. Die Wissenschaftler gehen davon aus, dass die dort befindlichen Funktionen besonders wichtig für die Entwicklung des Menschen sind, Veränderungen in dieser Region scheinen die Überlebensfähigkeit stark einzuschränken.
Ein Team um Evan E. Eichler von der University of Washington School of Medicine in Seattle entdeckte bereits 38 Gene, die sich als besonders einheitlich erweisen. Einige davon werden mit für den Menschen typischen Veränderungen des Gehirns in Verbindung gebracht. Auffällig ist auch, dass mindestens 171 Gene während der Evolution des Menschen verdoppelt und in eine andere Genomregion verschoben wurden. Solche und andere Umbauten sind in der Geschichte der menschlichen DNA alles andere als selten. Einige dieser Phänomene sind erst durch das neue Referenzgenom bekannt geworden.
Die Suche nach den individuellen Unterschieden im Genom führt außerdem dazu, dass eine überwältigende Menge an Gemeinsamkeiten der Menschen gefunden wird. Das Erbgut zweier Menschen ist zu einem sehr hohen Anteil identisch. Bis auf sehr wenige Ausnahmen beschränken sich alle Varianten, die das Pangenom aufweist, nicht auf eine Region oder einen Kontinent, sondern sind auf der ganzen Welt verbreitet. „Es würde deshalb keinen Sinn machen, ein spezielles Pangenom beispielsweise für Europäer oder Asiaten aufzubauen“, sagt Marschall. Die frühere Theorie, dass die Menschen von unterschiedlichen regionalen Populationen abstammen, beispielsweise der Mensch sich in Europa unter dem Einfluss der Neandertaler entwickelte, ist längst widerlegt. Und auch die Daten des Pangenoms bestätigen dies. Die größte genetische Vielfalt gibt es in Afrika. Auch dort ist die Menschheit nicht an einem Ort entstanden. Vielmehr haben sich die Menschen aus mehreren Regionen später vermischt.
Das Pangenom zeigt eindrucksvoll, was die Entwicklung der Menschheit seit Jahrtausenden charakterisiert: die Migration. Anders als bei vielen Pflanzen- und Tierarten hat die ständige Migration des Menschen zu einer weiten Durchmischung des menschlichen Erbguts geführt. Das mag in der heutigen Zeit nicht allen gefallen, ist aber eine der Botschaften des Pangenoms: Die Migration ist ebenso tief im Menschen verwurzelt wie seine Individualität.
Gesundheit & Medizin
Forscher verändern Gene menschlicher Embryos
10. Juni 2026
Chance und Risiko zugleich: Eine neue Methode der Gen-Editierung könnte helfen, krankmachende Mutationen und Erbkrankheiten schon beim…
Gesundheit & Medizin
Wie Neandertaler-Gene unsere Reaktion auf DNA-Viren prägen
9. Juni 2026
Rund zwei Prozent des Erbguts heutiger Europäer stammen von Neandertalern. Die archaischen Genvarianten beeinflussen unter anderem unser…