Wie die KI genügsamer wird - wissenschaft.de | Bild der Wissenschaft
BDW PlusTechnik & Digitales
Wie die KI genügsamer wird
Künstliche neuronale Netze sind die Basis des aktuellen KI-Booms. Doch ihre Anwendung und ihr Training verschlingen Unmengen an elektrischer Energie. Forscher suchen deshalb nach Möglichkeiten, sie effizienter zu machen.
Sie haben noch 2 von 3 kostenlosen Artikeln übrig1/3
von THOMAS BRANDSTETTER
Schätzungen zufolge benötigt eine einfache Anfrage an den Chatbot „ChatGPT“ etwa 10- bis 30-mal so viel Energie wie eine herkömmliche Internetsuche mit Stichwörtern. Rechnet man das auf die aktuell rund neun Milliarden täglichen Anfragen bei Google hoch, ergibt sich ein zusätzlicher Strombedarf in der Größenordnung des Verbrauchs eines kleinen Landes wie Irland. Auch das anfängliche Training eines sogenannten Sprachmodells wie ChatGPT benötigt eine enorme Menge an elektrischer Energie: in der Regel etwa so viel, wie ein mittelgroßes Kernkraftwerk in einer Stunde produziert. Das verursacht Stromkosten von mehreren Hunderttausend Euro.
Dabei ist die gesamte Informations- und Kommunikationstechnik schon jetzt für zwei bis vier Prozent der globalen Treibhausgasemissionen verantwortlich – ungefähr genauso viel, wie der weltweite Flugverkehr produziert. Doch der neue Treiber in diesem Bereich steht bereits fest: Es ist die Künstliche Intelligenz (KI).
Unvorstellbar große Datenmengen
Die Ursache für den horrenden Energiebedarf vor allem der aktuellen Sprachmodelle liegt in der schieren Größe der dahinterstehenden neuronalen Netze. GPT-3 etwa, das technische Herz von ChatGPT, besteht aus rund 175 Milliarden Parametern, die alle während eines langwierigen Trainingsprozesses nach und nach optimiert werden mussten, bis das Modell schließlich eigene Texte generieren konnte. „Die Datenmengen, anhand derer solche Systeme lernen, werden in Petabyte gemessen, also in Millionen Gigabyte“, sagt Barbara Hammer, Professorin für Maschinelles Lernen an der Universität Bielefeld.
Und auch wenn OpenAI, das US-amerikanische Unternehmen, das ChatGPT erschaffen hat, bislang keine konkreten Zahlen dazu veröffentlicht hat, gehen Forscher davon aus, dass die Menge der für den maschinellen Lernprozess verwendeten Textdaten etwa der Datenmenge eines zwei Jahre langen HD-Videostreams entspricht.
Das Training als Ratespiel
Dabei handelt es sich im Wesentlichen um frei zugängliche Texte aus dem Internet. Vereinfacht ausgedrückt verbirgt die KI für das Training immer wieder ein Wort eines Textes vor sich selbst und versucht dann, dieses Wort mithilfe der vorangegangenen und der nachfolgenden Textteile zu erraten. Nach Abschluss des Trainings ist das System schließlich in der Lage, auf der Grundlage eines vom Nutzer vorgegebenen Textanfangs einen plausiblen Vorschlag für das nächste Wort zu machen. Dann folgt das übernächste und so weiter. Am Ende entsteht so ein neuer Text, der zwar plausibel wirkt, letztlich aber bloß eine statistische Auswertung der Trainingsdaten widerspiegelt.
„Das Sprachmodell erlernt so aber nicht nur den Aufbau und die Struktur menschlicher Sprache, sondern nimmt auch sämtliche Informationen auf, die in den Texten stecken“, erklärt Hammer. „Wenn es also etwas über die Zugspitze als den höchsten Berg von Deutschland liest, speichert es auch diese Information irgendwo in den Parametern seines neuronalen Netzes ab.“ Diese Parameter, im Fachjargon auch „Gewichte“ genannt, beschreiben die Stärke der Verbindung zwischen je zwei künstlichen Neuronen. Sie stellen gewissermaßen das Analogon zu den Synapsen eines biologischen Nervensystems dar. Die Information über die Zugspitze ist also nicht wie bei einem herkömmlichen Computersystem explizit in einer Datenbank gespeichert, sondern manifestiert sich statistisch mit jeder Erwähnung in den Trainingsdaten immer deutlicher direkt in der Struktur des Netzes.
Mehr aus Technik & Digitales
Weitere aktuelle Artikel aus der Rubrik Technik & Digitales.
„Damit sie dieses ganze Wissen in ihren Parametern aufnehmen können, müssen die Sprachmodelle eben auch so groß sein“, sagt Hammer. „Und aktuell sieht es so aus, als würden die Modelle immer besser funktionieren, je größer sie sind.“ Andererseits hat das Konzept neben dem hohen Stromverbrauch auch weitere, schwerwiegende Nachteile. Zum einen kommen die Systeme bei Informationen, die weniger häufig in den Trainingsdaten auftauchen, schnell ins Wanken – und sie beginnen zu halluzinieren. „Fragt man etwa nach dem zweithöchsten Berg eines Landes, ist die Antwort oft falsch“, sagt Hammer. Und auch die Aktualität von Informationen bereitet Probleme. „Um zu wissen, dass inzwischen Bayer Leverkusen deutscher Meister ist, müsste GPT-3 noch einmal vollständig neu trainiert werden.“ Schließlich gibt es keine Möglichkeit, in einem reinen Sprachmodell einzelne Informationen gezielt zu verändern.
Einen möglichen Ausweg aus dieser Misere bietet die sogenannte Retrieval-Augmented Generation (RAG). „Das ist ein aktuelles Forschungsgebiet, in dem versucht wird, Sprachmodelle mit Datenbanken zu kombinieren“, erklärt Hammer. „Dadurch muss nicht mehr das gesamte Wissen im neuronalen Netz selbst gespeichert sein, und die Modelle können wieder kleiner werden.“ Sie dienen dann quasi nur noch als Schnittstelle für den Zugriff auf die Datenbank. Dafür müssen die Modelle natürlich nach wie vor menschliche Sprache beherrschen. Und sie müssen in der Lage sein zu erkennen, welche Fragen sie direkt aus ihrem neuronalen Netz heraus beantworten können – und wann es nötig ist, Informationen aus der Datenbank zu holen.
„In Bielefeld entwickeln wir auf Basis von RAG unter anderem gerade einen Chatbot für die Studienberatung“, bietet Hammer. „Der muss nicht wissen, wie hoch irgendwelche Berge sind. Da reicht ein kleines Sprachmodell, das auf eine Datenbank mit relevanten Informationen zu den verschiedenen Studienrichtungen zugreifen kann.“ Auch der IT-Konzern Microsoft setzt bei seinem Chatbot „Copilot“ auf RAG, um Suchanfragen für das Internet in natürlicher Sprache zu ermöglichen. „Der Chatbot formuliert dann daraus eine gewöhnliche Anfrage aus einem Stichwort an das Internet, bekommt die Antwort und formuliert sie für den Nutzer wiederum in natürlicher Sprache.“
Überflüssige Neuronen entfernen
Eine weitere Möglichkeit, Sprachmodelle kompakter zu machen, bietet das sogenannte Pruning: das „Ausästen“. So wie ein erfahrener Gärtner mit einer Gartenschere gezielt Äste eines Baums auswählt und abschneidet, suchen Algorithmen dabei ein künstliches neuronales Netz auf überflüssige Neuronen ab, die entfernt werden können, ohne dadurch die Leistungsfähigkeit des Netzes zu beeinträchtigen. „In großen Netzen gibt es immer wieder Neuronen, die nie aktiv werden“, erklärt Hammer. „Aber da sie während des Betriebs trotzdem elektrische Energie verbrauchen, lässt sich durch ihre Entfernung die Energieeffizienz steigern.“
Außerdem lässt sich mithilfe von Pruning ein großes, universell trainiertes Netz wie GPT ausdünnen, wenn für eine spezielle Anwendung nicht alle darin gespeicherten Informationen nötig sind. „Bei der Studienberatung in Bielefeld etwa wären das alle Informationen, die sich nicht direkt auf die Universität beziehen“, sagt Hammer. „Dafür füttert man ein großes Sprachmodell ausschließlich mit Eingaben, die Bielefeld betreffen und beobachtet, welche Bereiche des Netzes dabei inaktiv bleiben. Und die streicht man dann raus.“ Das Resultat ist ein reduziertes und nur auf ein einziges Thema spezialisiertes Modell mit einem geringeren Strombedarf.
Der Umgang mit knappen Ressourcen
Große KI-Modelle wie ChatGPT laufen in der Regel in riesigen Rechenzentren, wo sowohl Rechenleistung als auch elektrischer Strom in rauen Mengen zur Verfügung stehen – was wohl auch ein Grund dafür sein dürfte, dass ihre Entwickler sie überhaupt zu solch energiehungrigen Ungetümen anwachsen ließen. Doch am anderen Ende des Spektrums der Künstlichen Intelligenz gibt es auch Anwendungen, die mit sehr geringen Ressourcen auskommen müssen, zum Beispiel, wenn sie auf Mobiltelefonen oder medizinischen Geräten laufen sollen. Dann müssen die neuronalen Netze allein aufgrund der Umgebung, in die sie eingebettet sind, möglichst klein und energieeffizient sein.
„Die typische Vorgehensweise ist es dann, zunächst mit vielen Daten und hohem Rechenaufwand ein großes Modell zu trainieren und dieses anschließend auf ein kleineres System zu skalieren“, erklärt Christoph Lüth, der am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Saarbrücken das Projekt FAIRe (Frugal Artificial Intelligence in Resource-limited environments) leitet.
Gemeinsam mit seinem Team hat er unter anderem eine frugale, also sparsame KI entwickelt, die auf einem kleinen, in einen Rollator integrierten Chip läuft. Sie soll auf eine solche Gehhilfe angewiesenen Menschen helfen, das Gerät richtig zu verwenden. Schließlich kann die falsche Nutzung eines Rollators zu Stürzen führen. Und vor allem viele ältere Menschen sind aufgrund kognitiver Einschränkungen nicht mehr in der Lage, sich die korrekte Körperhaltung an einem Rollator einzuprägen.
„Um Fehlhaltungen zu erkennen, haben wir zunächst mit 3D-Kameras die gesamte Pose der Patienten beim Benutzen des Rollators erfasst“, erläutert Lüth. Diese Kameras liefern sehr viele und präzise Daten, mit denen die Forscher zunächst ein großes Modell trainieren konnten, das die unterschiedlichen Körperhaltungen klassifiziert und problematische Haltungen zuverlässig erkennt. „Danach haben wir uns überlegt, welche Punkte aus dieser riesigen Menge an dreidimensionalen Daten für die Klassifikation tatsächlich relevant sind“, berichtet der DFKI-Wissenschaftler. Wie sich dabei herausstellte, reichten wenige Datenpunkte, die die Position von Schultern, Hüften, Knien, Füßen und Oberkörper widerspiegeln, dafür völlig aus.
Die Positionen dieser Körperteile ermitteln einfache, in den Rollator verbaute Laser-Entfernungsmesser, die fest auf den jeweiligen Nutzer eingestellt sind. „Im nächsten Schritt haben wir das ursprüngliche, große Netz gewissermaßen als Lehrer eingesetzt, um damit ein neues, kleineres Netz zu trainieren“, erklärt Lüth. Das reduzierte Netz lernte dadurch ebenfalls, Fehlhaltungen zuverlässig zu erkennen – allerdings nur auf Basis der wenigen Daten aus der Entfernungsmessung. Als Resultat ist das neue Netz nur etwa ein Hundertstel so groß wie sein Lehrmeister und kommt mit den Energieressourcen aus, die eine einfache Batterie und ein kleiner, in den Rollator integrierter Mikrochip bieten können.
Abspecken bei der Präzision
Eine weitere Stellschraube, um Künstlicher Intelligenz ihren Energiehunger auszutreiben, könnte die Präzision ihrer internen Rechenprozesse sein. Schließlich sind auch die Spezialkarten, auf denen die Algorithmen laufen, im Wesentlichen noch für klassische und mathematische Berechnungen konzipiert. „Sie sind präzise und akkurat, so wie wir es von Computern gewohnt sind“, sagt Ralf Herbrich, der am Hasso-Plattner-Institut (HPI) in Potsdam das Fachgebiet Künstliche Intelligenz und Nachhaltigkeit leitet. „Doch für KI-Algorithmen, die lediglich Wahrscheinlichkeiten abschätzen, arbeiten sie oft viel zu genau und verbrauchen dadurch unnötig viel Energie.“
In der Regel arbeiten auch KI-Systeme durchgängig mit den in der Informatik üblichen 32-Bit-Gleitkommazahlen – und damit auf 38 Nachkommastellen genau. Dabei sagen sie am Ende oft nur auf ein Prozent genau vorher, ob etwa auf einem Bild ein Hund oder eine Katze zu sehen ist. „Dummerweise ist diese Genauigkeit auch in den modernen, eigentlich für die Künstliche Intelligenz optimierten Grafikkarten immer noch fest verdrahtet“, stellt Herbrich fest. Für eine flexiblere, an das jeweilige Problem angepasste Genauigkeit müsste also zunächst ein neues Hardwarekonzept entwickelt werden. „Das US-Unternehmen Nvidia forscht bereits an solchen Maschinen“, berichtet Herbrich. „Und wenn empirische Studien zeigen sollten, dass eine bestimmte Darstellung von Zahlen für maschinelles Lernen energieeffizienter ist, dann wird man diese Erkenntnis auch in die Entwicklung neuer Hardware einfließen lassen.“
Nur fünf Prozent an Strombedarf
Auf Seiten der Software arbeiten Herbrich und seine Kollegen an sogenannten One-Bit-Networks. Bei einem solchen Netzwerk werden die Parameter, die die Verbindungen in einem künstlichen neuronalen Netz beschreiben, lediglich durch ein einziges Bit statt durch einen kontinuierlichen Wert dargestellt. Zwischen zwei künstlichen Neuronen steht dann nur noch die Information, ob sie verbunden sind oder nicht. „Das kann eine Berechnung um einen Faktor 30 schneller machen“, sagt Herbrich. „Und in bestimmten Fällen reduziert es den Stromverbrauch um bis zu 95 Prozent, während sich die Genauigkeit der Ergebnisse nur um 5 Prozent verringert.“
Allerdings: Der Weg von der Grundlagenforschung in die Anwendung ist weit. Und angesichts des explodierenden Stromverbrauchs von Systemen mit Künstlicher Intelligenz drängt die Zeit. „Auch wenn wir heute noch genügend elektrischen Strom für die Künstliche Intelligenz haben, sollte uns die zunehmende Nutzung eine Warnung sein“, meint HPI-Forscher Ralf Herbrich. Deshalb sei es wichtig, die Technologie schon jetzt mit den damit verbundenen Kosten in Relation zu bringen. „Wenn wir wollen, dass die verfügbare Energie auch in fünf Jahren noch für die Anwendungen ausreicht, müssen wir das Problem jetzt angehen.“
Menschen orientieren sich bei Entscheidungen an den Erfahrungen anderer. Dieses als „Social Proof“ bekannte psychologische Phänomen…
Technik & Digitales
Künstliche Intelligenz: Umwelt-Fußabdruck größer als gedacht?
3. Juni 2026
Der KI-Boom bringt immer leistungsstärkere KI-Modelle hervor, immer mehr Menschen nutzen die Technologie. Einem neuen Bericht zufolge…
BDW PlusTechnik & Digitales
Wie Roboter für das Leben lernen
2. Juni 2026
Damit Roboter sinnvoll handeln können, reicht es nicht, Texte und Bilder aus dem Internet zu nutzen. KI-Roboter brauchen außerdem perfekte…