Bestimmte Mutationen in unserer DNA-Sequenz können dazu führen, dass Proteine anders aufgebaut werden als sie sollten. Während viele dieser Mutationen harmlos sind, können andere schwerwiegende Krankheiten verursachen. Für die meisten Varianten sind ihre Auswirkungen allerdings bislang unklar. Nun hat die Google-Tochter DeepMind das Programm AlphaMissense veröffentlicht, das mit Hilfe künstlicher Intelligenz die Struktur der veränderten Proteine berechnet und vorhersagt, welche Mutationen potenziell schädlich sind. Damit könnte es dabei helfen, die Ursachen seltener genetischer Krankheiten aufzudecken.
Die DNA-Sequenz unseres Genoms liefert den Bauplan für unsere Proteine. Durch Mutationen können sich einzelne DNA-Bausteine verändern. Im Fall von sogenannten Missense-Mutationen führt eine solche Veränderung im Bauplan dazu, dass eine andere Aminosäure in das betroffene Protein eingebaut wird. „Von den mehr als vier Millionen beobachteten Missense-Varianten sind nur schätzungsweise zwei Prozent klinisch als pathogen oder gutartig eingestuft worden, während die überwiegende Mehrheit von ihnen von unbekannter klinischer Bedeutung ist“, erklärt ein Team um Jun Cheng von Google DeepMind in London. „Dies begrenzt die Diagnose seltener Krankheiten sowie die Entwicklung oder Anwendung klinischer Behandlungen, die auf die zugrunde liegende genetische Ursache abzielen.“
Weiterentwicklung von AlphaFold
Bislang war es allerdings aufwendig, die potenziellen Auswirkungen einer Missense-Variante vorherzusagen. Zwar ermöglichen es neue Technologien, tausende Varianteneffekte gleichzeitig mit Hilfe von Zellkulturen und DNA-Sequenzierung zu erfassen. Doch Ergebnisse aus solchen Experimenten sind bisher nur für einen winzigen Teil des menschlichen Genoms verfügbar. Jun Cheng und sein Team haben deshalb einen anderen Ansatz gewählt, der in wesentlich größerem Maßstab anwendbar ist. Als Grundlage diente ihnen das schon vor einigen Jahren von DeepMind entwickelte KI- Programm AlphaFold, das anhand der Proteinsequenz genau vorhersagt, wie sich das entsprechende Protein faltet, welche Struktur es also annimmt.
„Wir haben AlphaFold angepasst, um die Pathogenität von Missense-Varianten vorherzusagen“, schreiben Cheng und seine Kollegen. Dazu kombinierten sie die Strukturvorhersagen von AlphaFold mit Informationen aus klinischen Datenbanken, die Angaben zu bereits bekannten Missense-Mutationen und deren Auswirkungen enthalten. Zudem bezogen sie die Häufigkeit bestimmter Varianten beim Menschen ein. „Mit Hilfe von maschinellem Lernen lassen sich Muster in biologischen Daten erkennen und ausnutzen, um darauf zu schließen, wie sich bislang nicht erforschte Varianten auswirken“, erklären die Autoren.
Krankhaft oder gutartig?
Für sämtliche fast 20.000 menschliche Proteine rechneten die Forschenden alle möglichen Varianten von Missense-Mutationen durch – insgesamt 216 Millionen mögliche Veränderungen einzelner Aminosäuren. Das führte zu 71 Millionen Vorhersagen von Missense-Varianten. „32 Prozent dieser Missense-Varianten haben wir mit Hilfe von AlphaMissense als potenziell pathogen klassifiziert, 57 Prozent als wahrscheinlich gutartig“, berichtet das Team. Für elf Prozent der Varianten lieferte AlphaMissense keine eindeutige Einschätzung.
Genauere Analysen ergaben, dass Varianten in Proteinen, die sich im Laufe der Evolution wenig verändert haben, besonders häufig als pathogen eingestuft wurden, ebenso wie Varianten, die die Stabilität von Proteinen beeinflussen. Vergleiche der Ergebnisse mit bereits wissenschaftlich untersuchten Missense-Mutationen zeigten eine hohe Übereinstimmung zwischen den Vorhersagen von AlphaMissense und tatsächlich beobachteten Effekten. „AlphaMissense-Vorhersagen haben das Potenzial, unser Verständnis der molekularen Auswirkungen von Varianten auf die Proteinfunktion zu beschleunigen, zur Entdeckung krankheitsverursachender Gene beizutragen und die diagnostische Ausbeute bei seltenen genetischen Krankheiten zu erhöhen“, schreiben Jun Cheng und sein Team.
Bisher nur eingeschränkt diagnostisch nutzbar
In einem begleitenden Kommentar, der ebenfalls in der Fachzeitschrift Science veröffentlicht wurde, schreiben Joseph Marsh von der University of Edinburgh und Sarah Teichmann von der University of Cambridge, die nicht an der Studie beteiligt waren, AlphaMissense markiere den Beginn einer neuen Phase in der Vorhersage von Varianteneffekten. Sie weisen allerdings auch darauf hin, dass noch unklar ist, inwieweit man sich bei der Diagnose von Krankheiten auf rein rechnerische Vorhersagen verlassen kann.
„Obwohl die von AlphaMissense vorgenommenen Einstufungen als wahrscheinlich pathogen oder wahrscheinlich gutartig zweifellos für die Interpretation und Priorisierung von Varianten hilfreich sind, dürfen diese Bezeichnungen nicht mit den sehr spezifischen klinischen Definitionen dieser Begriffe verwechselt werden, die sich auf mehrere Beweislinien stützen“, schreiben sie. Zu beachten sei auch, dass die Auswirkungen von Mutationen in der Praxis sehr komplex sind. Selbst wenn eine Person eine krankhafte Variante trägt, führe diese nicht zwangsläufig tatsächlich zu einer Erkrankung. „Doch obwohl man sich derzeit bei der genetischen Diagnostik nicht allein auf Vorhersagemodelle wie AlphaMissense verlassen kann, wird sich ihr Nutzen zukünftig weiter steigern, da sich sowohl die Berechnungsansätze als auch die Strategien für ihre Interpretation verbessern.“
Quelle: Jun Cheng (Google DeepMind, London, UK) et al., Science, doi: 10.1126/science.adg7492