Die DNA-Sequenz unseres Genoms liefert den Bauplan für unsere Proteine. Durch Mutationen können sich einzelne DNA-Bausteine verändern. Im Fall von sogenannten Missense-Mutationen führt eine solche Veränderung im Bauplan dazu, dass eine andere Aminosäure in das betroffene Protein eingebaut wird. „Von den mehr als vier Millionen beobachteten Missense-Varianten sind nur schätzungsweise zwei Prozent klinisch als pathogen oder gutartig eingestuft worden, während die überwiegende Mehrheit von ihnen von unbekannter klinischer Bedeutung ist“, erklärt ein Team um Jun Cheng von Google DeepMind in London. „Dies begrenzt die Diagnose seltener Krankheiten sowie die Entwicklung oder Anwendung klinischer Behandlungen, die auf die zugrunde liegende genetische Ursache abzielen.“
Weiterentwicklung von AlphaFold
Bislang war es allerdings aufwendig, die potenziellen Auswirkungen einer Missense-Variante vorherzusagen. Zwar ermöglichen es neue Technologien, tausende Varianteneffekte gleichzeitig mit Hilfe von Zellkulturen und DNA-Sequenzierung zu erfassen. Doch Ergebnisse aus solchen Experimenten sind bisher nur für einen winzigen Teil des menschlichen Genoms verfügbar. Jun Cheng und sein Team haben deshalb einen anderen Ansatz gewählt, der in wesentlich größerem Maßstab anwendbar ist. Als Grundlage diente ihnen das schon vor einigen Jahren von DeepMind entwickelte KI- Programm AlphaFold, das anhand der Proteinsequenz genau vorhersagt, wie sich das entsprechende Protein faltet, welche Struktur es also annimmt.
„Wir haben AlphaFold angepasst, um die Pathogenität von Missense-Varianten vorherzusagen“, schreiben Cheng und seine Kollegen. Dazu kombinierten sie die Strukturvorhersagen von AlphaFold mit Informationen aus klinischen Datenbanken, die Angaben zu bereits bekannten Missense-Mutationen und deren Auswirkungen enthalten. Zudem bezogen sie die Häufigkeit bestimmter Varianten beim Menschen ein. „Mit Hilfe von maschinellem Lernen lassen sich Muster in biologischen Daten erkennen und ausnutzen, um darauf zu schließen, wie sich bislang nicht erforschte Varianten auswirken“, erklären die Autoren.
Krankhaft oder gutartig?
Für sämtliche fast 20.000 menschliche Proteine rechneten die Forschenden alle möglichen Varianten von Missense-Mutationen durch – insgesamt 216 Millionen mögliche Veränderungen einzelner Aminosäuren. Das führte zu 71 Millionen Vorhersagen von Missense-Varianten. „32 Prozent dieser Missense-Varianten haben wir mit Hilfe von AlphaMissense als potenziell pathogen klassifiziert, 57 Prozent als wahrscheinlich gutartig“, berichtet das Team. Für elf Prozent der Varianten lieferte AlphaMissense keine eindeutige Einschätzung.
Genauere Analysen ergaben, dass Varianten in Proteinen, die sich im Laufe der Evolution wenig verändert haben, besonders häufig als pathogen eingestuft wurden, ebenso wie Varianten, die die Stabilität von Proteinen beeinflussen. Vergleiche der Ergebnisse mit bereits wissenschaftlich untersuchten Missense-Mutationen zeigten eine hohe Übereinstimmung zwischen den Vorhersagen von AlphaMissense und tatsächlich beobachteten Effekten. „AlphaMissense-Vorhersagen haben das Potenzial, unser Verständnis der molekularen Auswirkungen von Varianten auf die Proteinfunktion zu beschleunigen, zur Entdeckung krankheitsverursachender Gene beizutragen und die diagnostische Ausbeute bei seltenen genetischen Krankheiten zu erhöhen“, schreiben Jun Cheng und sein Team.





