Erleuchtung für Computer - wissenschaft.de | Bild der Wissenschaft
BDW PlusTechnik & Digitales
Erleuchtung für Computer
Mit ihrem immensen Bedarf an Rechenleistung bringen Künstliche Intelligenz und Big Data die heutige Mikroelektronik an ihre Grenzen. Optische Computerchips könnten ein Ausweg sein und neue Arten von Rechenmaschinen ermöglichen.
Sie haben noch 1 von 3 kostenlosen Artikeln übrig2/3
von THOMAS BRANDSTETTER
Bei der Kommunikation hat Licht seine Überlegenheit bereits bewiesen. Lichtsignale in Glasfasern übertragen Daten um ein Vielfaches schneller als Elektronen in Kupferleitungen und ermöglichen so eine wesentlich effizientere Übertragung von Informationen. Nun könnte eine ähnliche Entwicklung bei der Verarbeitung der Daten bevorstehen – durch Computer, die dazu statt elektrischer Ladungen Lichtpulse nutzen. Denn die Leistungsfähigkeit des bisherigen Dreamteams aus Elektronen und Transistoren scheint allmählich ausgereizt zu sein. Die Möglichkeiten, herkömmliche Mikrochips weiter zu miniaturisieren und sie dadurch schneller und leistungsfähiger zu machen, wird immer aufwendiger (siehe Artikel ab Seite 14, „Totgesagte leben länger“).
Schnell genug für die KI
Eine Herausforderung für die Computertechnik liegt in Algorithmen der Künstlichen Intelligenz, die auf eine hochgradig parallele Verarbeitung ausgelegt sind. Um etwa Muster in Bildern zu vergleichen und zu erkennen, führen sie millionenfach dieselben Rechenoperationen aus. Da wird ein herkömmlicher Rechner, der diese Aufgaben nur nacheinander abarbeiten kann, zum Nadelöhr. Zum Rechnen mit Licht hingegen passt diese Anforderung nahezu perfekt. Denn so wie sich Lichtpulse mit unterschiedlicher Frequenz bei der Datenübertragung parallel zueinander durch ein und dieselbe Glasfaser schicken lassen, können auch optische Schaltungen viele Berechnungen gleichzeitig ausführen. Und neue technische Möglichkeiten, mit denen sich auf Licht basierende Computerschaltkreise in kompakte Mikrochips integrieren lassen, tun ihr Übriges.
Die Aussicht, auf diese Weise den Weg für eine völlig neue Art des Rechnens zu ebnen, motiviert junge Unternehmen in aller Welt, um den erhofften Zukunftsmarkt zu kämpfen. So haben erst kürzlich Forscher der University of Oxford und der Universität Münster das Unternehmen Salience Labs gegründet. Ihr Ansatz für einen optischen Computerchip, den sie mit dem Start-up zur Anwendungsreife bringen wollen, geht auf eine Anfang 2021 gemeinsam im Wissenschaftsmagazin Nature veröffentlichte Studie zurück. Den Wissenschaftlern aus Großbritannien und Deutschland war es gelungen, eine der grundlegenden Rechenoperationen des maschinellen Lernens von Lichtstrahlen ausführen zu lassen: die sogenannte Matrixmultiplikation. Das ist eine im Prinzip recht einfache mathematische Methode, bei der mehrere Zahlenwerte zunächst miteinander multipliziert und die einzelnen Ergebnisse anschließend aufsummiert werden.
Neuronale Netze am Limit
In einem künstlichen neuronalen Netzwerk laufen Matrixmultiplikationen immer und immer wieder ab – und bringen herkömmliche Rechner damit an ihr Leistungslimit. Denn ein Computer mit klassischer Architektur muss für jeden einzelnen Berechnungsschritt die zu verarbeitenden Daten zunächst aus dem Speicher holen, um sie miteinander zu multiplizieren. Die Produkte der einzelnen Multiplikationen landen erneut im Speicher und werden dann von dort wieder entnommen, um sie in einem weiteren Schritt zu addieren. Das kostet Zeit und Energie, weshalb für das maschinelle Lernen meist spezielle Grafikkarten zum Einsatz kommen, die zwar deutlich paralleler arbeiten als die zentrale Prozessoreinheit – doch noch weitaus schneller geht es mit Licht.
Mehr aus Technik & Digitales
Weitere aktuelle Artikel aus der Rubrik Technik & Digitales.
„Unser Chip erledigt die gesamte Matrixmultiplikation in einem einzigen Schritt“, sagt Johannes Feldmann, der in dem Team aus Münster unter der Leitung von Wolfram Pernice an der Studie beteiligt war. „Mehrere Lichtpulse laufen durch die Leiterbahnen des Chips und werden dort an bestimmten Stellen gezielt abgeschwächt, was mathematisch einer Multiplikation entspricht“, erklärt der Physiker „Anschließend vereinigen sich die Leiterbahnen, wobei sich die abgeschwächten Lichtblitze überlagern – das wirkt wie eine Addition.“ Fertig ist die Matrixmultiplikation.
Doch damit nicht genug. Die optische Art der Datenverarbeitung ermöglicht es auch, mehrere solcher Berechnungen zugleich im selben Schaltkreis zu bewältigen. Dazu müssen die Zahlenwerte bloß in Lichtpulsen mit unterschiedlicher Frequenz codiert sein, die dann gemeinsam durch die Leiterbahn laufen, ohne sich gegenseitig zu beeinflussen. Erst wenn die optischen Signale den Chip mit Lichtgeschwindigkeit durchquert haben, müssen sie wieder voneinander getrennt und einzeln ausgewertet werden.
Beschleunigung für den Rechentakt
Da Licht keinen Widerstand im Material erfährt, erlaubt die Optik bei der Verarbeitung von Daten eine deutlich höhere Taktfrequenz als die Elektronik. Die Daten lassen sich schneller hintereinander auf den Chip schicken, was die Zahl der möglichen Berechnungen pro Zeiteinheit noch erhöht. Um das zu demonstrieren, haben die Forscher aus Oxford und Münster ein kleines künstliches neuronales Netz realisiert, das handgeschriebene Zahlen erkennen kann – eine klassische Übung für Algorithmen des maschinellen Lernens.
Allerdings kann der „Photonische Hardwarebeschleuniger“, wie die Wissenschaftler ihren auf Photonen basierenden Chip genannt haben, nicht alle Rechenoperationen in einem solchen Netz ausführen. „Wir arbeiten mit einem Mix aus Photonik und Elektronik“, sagt Feldmann. Zwar lassen sich Matrixmultiplikationen durch die Verwendung von Licht sehr schnell und zudem parallel abarbeiten. Doch es gibt ein Manko: „Nichtlineare Berechnungsschritte sind optisch nur schwer zu realisieren“, sagt der Physiker und Unternehmensgründer. „Deshalb nutzen wir dafür nach wie vor die herkömmliche Elektronik.“
„Nichtlinear“ ist im Grunde alles, was über Multiplikationen und Additionen und damit die Matrixmultiplikation hinausgeht. In einem tiefen neuronalen Netzwerk ist der Eingang jedes Neurons mit sämtlichen Neuronen aus der vorhergehenden Schicht verbunden. Sie alle senden Signale an das Zielneuron, die über Matrixmultiplikationen summiert werden. Dieser Prozess ist rein linear und lässt sich, wie in Feldmanns Arbeit gezeigt, elegant mit Lichtpulsen verwirklichen.
Danach folgt ein weiterer essenzieller Teil eines neuronalen Netzes: Das Neuron muss „entscheiden“, was es aus dem eingehenden Summensignal macht. Würde es sich auch hier auf lineare Prozesse beschränken, könnte es bloß ein Signal an die nächste Schicht von Neuronen weiterleiten, das proportional zu seinem Eingangssignal ist. Doch es liegt in der Natur der Neuronen, dass sie gewisse Schwellen aufweisen müssen, um lernen zu können. So wie die Nervenzellen im Gehirn „entscheiden“, ob sie bei einer Anregung selbst zu feuern beginnen oder nicht, reichen auch ihre künstlichen Pendants das empfangene Signal nicht einfach weiter. Stattdessen stellen sie über eine nichtlineare Funktion, die sogenannte Aktivierungsfunktion, einen Zusammenhang zwischen der Anregung und dem Signal her, das sie ausgeben.
In Feldmanns photonischem Hardwarebeschleuniger bleibt die Berechnung dieser Nichtlinearität an der Elektronik hängen – was das System insgesamt verlangsamt, da ständig optische Signale in elektronische umgewandelt werden müssen und umgekehrt. Solche Konversionen stellen Flaschenhälse dar, unter denen zurzeit noch so gut wie alle optischen Computer leiden.
Der Trick mit der Glasfaser
Wie ein Team um Christophe Moser und Demetri Psaltis von der Eidgenössischen Technischen Hochschule (ETH) Lausanne vor Kurzem gezeigt hat, ist es aber zumindest grundsätzlich möglich, auch nicht-lineare Operationen mit optischen Methoden zu realisieren. Den Forschern ist es gelungen, nichtlineare optische Effekte im Inneren von Wellenleitern für künstliche neuronale Netze nutzbar zu machen. Dafür reichte ihnen eine einfache, fünf Meter lange Glasfaser. Doch während ein einfaches Addieren von Lichtintensitäten durch Überlagerung im freien Raum ein linearer Vorgang wäre, sind die Vorgänge in einer Glasfaser komplizierter. Dort kann ein Strahl bei einer hohen Intensität den Brechungsindex der Faser an einzelnen Stellen so verändern, dass ein anderer Strahl diese Veränderung spürt. Das lässt sich vergleichen mit einer Autorallye, bei der ein Wagen Fahrspuren auf der Strecke hinterlässt, wodurch ein folgender Wagen beeinträchtigt wird. Solche Wechselwirkungen sorgen in der Faser für nichtlineare Effekte, die elegant zu Ergebnissen führen, die sonst aufwendig in den tiefen Schichten eines neuronalen Netzes berechnet werden müssten.
Hinzu kommt ein weiterer Vorteil: „Mit unserer Methode benötigen wir nur ein Hundertstel der Energie eines herkömmlichen neuronalen Netzes“, sagt Moser. Allerdings räumt der Schweizer Wissenschaftler ein, dass die Verlässlichkeit des optischen Systems beim Klassifizieren von Bildern noch ein paar Prozent unter der Qualität herkömmlicher Technik liegt. „Das ist ein Problem, das wir noch lösen müssen“, sagt Moser. Dennoch ist es ihm und seinem Team bereits gelungen, zur Demonstration ihres Systems Covid-19-Erkrankungen anhand von Röntgenaufnahmen der Lunge mit einer Trefferquote von immerhin 83 Prozent zu erkennen.
Für solche Analysen bündelt eine simple optische Linse die Bilder zunächst und koppelt sie in die Glasfaser ein. In deren Inneren vermischen sich die einzelnen Bereiche des Bildes auf nichtlineare Weise. Und schließlich erfasst eine Kamera am Ausgang das Resultat. Die Pixel des Bildes sind in einem primitiven neuronalen Netz direkt mit zwei Alternativen für den Output verbunden: „Covid“ oder „kein Covid“. Allerdings: Bisher wissen die Forscher nicht, was genau im Inneren der Glasfaser geschieht. „Das ist ähnlich wie in den Tiefen künstlicher neuronaler Netze“, sagt Moser. „Auch da muss man oft akzeptieren, dass sich das Zusammenspiel der Millionen von Neuronen nicht nachvollziehen lässt.“
Das Problem der Passivität
Andere Rechner zu bauen, die auf der Lichttechnik beruhen und über ein künstliches neuronales Netz hinausgehen, ist noch deutlich schwieriger. „Denn es gibt keine tauglichen optischen Transistoren und Verstärkerelemente“, sagt Christian Georg Mayr, Experte für Hochparallele Systeme und Neuromikroelektronik an der Technischen Universität Dresden. „Optisches Rechnen ist daher rein passiv.“ Auf einem herkömmlichen Computerchip erfüllen die Milliarden von Transistoren stets zwei unterschiedliche Funktionen: Zum einen dienen sie als Schalter zwischen digitalen Nullen und Einsen – und realisieren damit die Berechnungen. Zum anderen kann ein Transistor die elektrischen Ströme, die die Signale durch den Chip tragen, auch verstärken. Dadurch verhindert er, dass ein Signal bei mehrfacher Verarbeitung immer schwächer wird und letztlich versiegt.
In der optischen Schaltung von Feldmann gibt es solche Verstärkerelemente nicht. Die optischen Komponenten können die Lichtpulse daher nur immer weiter abschwächen. In einer Verarbeitungskette, die länger wäre als die realisierte Matrixmultiplikation, würden die Signale deshalb irgendwann verschwinden. Zwar könnte man versuchen, die Signale unterwegs aufzufrischen – doch dazu wären Bauteile wie Photodioden und Leuchtdioden erforderlich, die Licht und elektrischen Strom ineinander umwandeln. Die Einfachheit und Eleganz eines rein optischen Systems gingen dadurch verloren.
In der Regel würde eine zwischenzeitliche Verstärkung der Signale auch unverhältnismäßig viel Energie kosten. „Um solche Energieverluste zu vermeiden, muss ein System komplett optisch bleiben. Doch damit bleibt die Verarbeitungskette endlich – weil es eben keinen optischen Transistor gibt“, sagt Mayr. Daran krankt das optische Rechnen schon seit seinen ersten Ansätzen vor rund 30 Jahren.
Das mag zwar gegen die Vision eines voll einsatzfähigen optischen Computers sprechen, doch auch mit kurzen Verarbeitungsketten lässt sich bei speziellen Anwendungen wie künstlichen neuronalen Netzen einiges erreichen. Das gilt vor allem, wenn die Schaltungen in kompakter Form auf einem Mikrochip untergebracht sind. Denn optische Schaltungen lassen sich – wie mikroelektronische Halbleiterchips – auf Wafer packen: dünne und sehr präzise geschliffene Platten aus Silizium. Doch dieses Material hat für die Herstellung eines optischen Computers einen Nachteil: Es lässt sich nicht ohne Weiteres zum Leuchten bringen. Um Silizium Licht zu entlocken, müssen Laser, die sowohl als Lichtquelle als auch als Verstärker für Lichtsignale dienen können, mit aufwendigen Verfahren in die Mikrochips integriert werden.
Kostengünstige Massenproduktion
„Etliche Unternehmen aus der IT-Branche wie Google, Hewlett-Packard, Intel und Microsoft suchen derzeit nach Lösungen“, berichtet Christoph Scheytt, Fachgruppenleiter für Schaltungstechnik an der Universität Paderborn, der zu optischen Analog- und Digital-Wandlern forscht. Trotz der noch ungelösten Probleme mit den Lasern birgt für Scheytt die Integration auf Siliziumchips enormes Potenzial für das Rechnen mit Licht.
Der Grund: Optische Systeme sind sehr empfindlich gegenüber Vibrationen. Sind sie, wie in der Grundlagenforschung üblich, in Form von Linsen, Strahlteilern und anderen Komponenten auf Labortischen aufgebaut, genügt ein schwacher Stoß, um die Berge und Täler einer Lichtwelle übereinander zu schieben. Die Folge: Aus einem hellen wird plötzlich ein dunkler Bereich.
Methoden aus der Halbleitertechnik
Doch die gleichen Methoden, die auch die Halbleiterindustrie zur Fertigung von elektronischen Bauteilen nutzt, erlauben es auch, optische Schaltkreise auf massiven, nur einige Quadratmillimeter kleinen Silizium-Plättchen unterzubringen. „Das ist dann sehr stabil und außerdem noch unfassbar preisgünstig“, sagt Scheytt. So kostet ein handelsüblicher mikroelektronischer Prozessor mit ungefähr 10 Milliarden Transistoren weniger als 100 Dollar. Bei Mikrochips mit integrierten optischen Funktionen rechnet der Forscher mit ähnlich geringen Fertigungskosten. Zugleich wären die Chips in großer Zahl und mit hoher Qualität herstellbar.
Die Entwicklung optischer Systeme auf Siliziumchips ist schon ziemlich weit fortgeschritten. Eine ganze Reihe junger Start-up-Unternehmen arbeitet daran – und manche davon haben bereits erste Chips für Spezialanwendungen vorgestellt. Besonders weit sind zwei junge Unternehmen in Boston in den USA. Beide fußen auf derselben wissenschaftlichen Arbeit, veröffentlicht von Forschern am Massachusetts Institute of Technology (MIT). Jeder der Hauptautoren dieser Studie hat ein eigenes Unternehmen gegründet – sie sind Konkurrenten in einem spannenden Wettlauf um eine neue Technologie. Eigenen Angaben zufolge stehen die Start-ups Lightmatter und Lightelligence unmittelbar davor, ihre Produkte auf den Markt zu bringen.
Mikroskopisch kleine Lichtschalter
In der gemeinsamen Arbeit am MIT kombinierten die Forscher 56 optische Schalter, sogenannte Mach-Zehnder-Interferometer, auf einem einzigen Mikrochip. Jeder der Schalter war nur etwa einen Zehntelmillimeter lang. Mach-Zehnder-Interferometer spalten einen Lichtstrahl an ihrem Eingang zunächst in zwei Teile auf und führen die Teilstrahlen am Ausgang dann wieder zusammen. Da sich die Geschwindigkeit, mit der sich das Licht entlang der beiden unterschiedlichen Wege ausbreitet, gezielt beeinflussen lässt, kommt es bei der Wiedervereinigung der Strahlen zu einer Verzögerung. So können die Positionen von Wellenbergen und Wellentälern des Lichts gegeneinander verschoben werden, wodurch sie sich bei der Überlagerung entweder verstärken oder gegenseitig auslöschen. Physiker sprechen dabei von konstruktiver oder destruktiver Interferenz.
Das Bauteil ist also im Wesentlichen ein Modulator, der die Intensität eines Lichtstrahls variiert. In Laborexperimenten konnte das durch die 56 optischen Schalter entstandene neuronale Netzwerk einfache gesprochene Laute erkennen. „Mit einem solchen Netzwerk aus Interferometern lässt sich im Prinzip jede beliebige mathematische Operation realisieren“, erklärt Rolf Drechsler, der den Bereich Cyber-Physical Systems am Deutschen Forschungszentrum für Künstliche Intelligenz sowie die Arbeitsgruppe für Rechnerarchitektur an der Universität Bremen leitet. Auch Drechsler hat sich mit seinem Team in den letzten Jahren mit der Synthese optischer Schaltungen beschäftigt und dabei ebenfalls auf die Interferometer als Grundbausteine gesetzt.
Der Informatiker hält es theoretisch für möglich, einen voll einsatzfähigen optischen Computer zu bauen. „Doch realistisch betrachtet wird die Funktionalität in absehbarer Zukunft eher in der Größenordnung eines Taschenrechners bleiben“, meint er. Denn noch lässt sich vieles nicht mit der nötigen Robustheit und Qualität technisch umsetzen. Zudem muss eine kommerzielle Anwendung kompakt und entsprechend kostengünstig sein, um mit den über die Jahrzehnte immer weiter optimierten Transistorschaltungen mithalten zu können. „Optische Schaltungen sind immer noch in einem sehr frühen Stadium“, sagt Drechsler. „Bei Speziallösungen für einzelne Rechenoperationen könnte die Technik aber durchaus schon Vorteile bringen.“
Die Nagelprobe steht noch aus
Den Beweis, ob es Lichtchips mit der altbewährten Silizium-Elektronik aufnehmen können, sind Forscher und Start-up-Unternehmen also noch schuldig. Doch die Idee, zumindest einfache und sich ständig wiederholende Berechnungen von schnellen Lichtstrahlen erledigen zu lassen, ist bestechend. Und die Zeit scheint reif zu sein, der Künstlichen Intelligenz mit ein bisschen Optik zusätzlichen Schwung zu verleihen.
Menschen orientieren sich bei Entscheidungen an den Erfahrungen anderer. Dieses als „Social Proof“ bekannte psychologische Phänomen…
Technik & Digitales
Künstliche Intelligenz: Umwelt-Fußabdruck größer als gedacht?
3. Juni 2026
Der KI-Boom bringt immer leistungsstärkere KI-Modelle hervor, immer mehr Menschen nutzen die Technologie. Einem neuen Bericht zufolge…
BDW PlusTechnik & Digitales
Wie Roboter für das Leben lernen
2. Juni 2026
Damit Roboter sinnvoll handeln können, reicht es nicht, Texte und Bilder aus dem Internet zu nutzen. KI-Roboter brauchen außerdem perfekte…