Anzeige
1 Monat GRATIS testen. Danach zum Jubiläumspreis weiterlesen.
Startseite »

KI lernt von den Eindrücken eines Kindes

Technik|Digitales

KI lernt von den Eindrücken eines Kindes
Kind mt Kamera
Kleinkind mit Kopfkamera. Deren Aufnahmen bildeten die Grundlage für das Sprachelernen eines KI-systems. © Wai Keen Vong

Wenn künstliche Intelligenzen Sprachen lernen, haben sie üblicherweise Billionen von Beispielen aus dem Internet zur Verfügung. Bei kleinen Kindern dagegen beruht der Spracherwerb lediglich auf dem, was sie in ihrer Umgebung aufschnappen. Forschende haben nun eine KI allein mit Videoaufnahmen aus der Perspektive eines einzelnen Kleinkinds trainiert. Tatsächlich lernte die KI auf diese Weise, Wörter mit Gegenständen zu verknüpfen und Konzepte zu generalisieren. Die Erkenntnisse geben aus einer neuen Perspektive Einblicke in den menschlichen Spracherwerb.

Im Alter von etwa sechs bis neun Monaten beginnen Kinder, die ersten Wörter zu lernen. Dabei verknüpfen sie das, was sie sehen und erleben, mit entsprechenden Bezeichnungen, die sie von den Personen in ihrem Umfeld hören. Aber genügt das wirklich, um eine Sprache von Grund auf zu lernen? Oder verfügen wir Menschen womöglich bereits über angeborenes Wissen, das uns hilft, die Konzepte von Sprache besser zu erfassen?

Kleinkind als Forschungshelfer

Um dieser Frage auf die Spur zu kommen, hat ein Team um Wai Keen Vong von der New York University eine KI trainiert, die als Input lediglich das bekam, was ein Kleinkind sieht und hört. Dazu statteten die Forschenden ein sechs Monate altes Kleinkind mit einer leichten, am Kopf befestigten Videokamera aus. Bis kurz nach seinem zweiten Geburtstag trug das Kind die Kamera regelmäßig bei alltäglichen Aktivitäten, beispielsweise auf dem Spielplatz, beim Essen oder während es mit seinen Eltern Bilderbücher anschaute.

Rund 61 Stunden Videomaterial kamen auf diese Weise zusammen. „Diese Aufnahmen machen zwar nur etwa ein Prozent der wachen Stunden des Kindes aus, bieten aber dennoch einen ausführlichen Einblick in die Erfahrungen des Kindes, und zwar aus seiner eigenen Perspektive“, schreiben die Forschenden. Mit diesen Daten speisten sie ein künstliches neuronales Netz. Dabei unterteilten sie das Video in einzelne Bilder und fügten jeweils eine Transkription des währenddessen Gesprochenen hinzu. „Dies gibt dem Modell einen Anhaltspunkt dafür, welche Wörter mit welchen Objekten in Verbindung gebracht werden sollten“, erklärt Vong. „Die Kombination dieser Hinweise ermöglicht es, allmählich zu bestimmen, welche Wörter zu welchen Bildern gehören.“

Verknüpfung von Wörtern und Bildern

Doch würden diese Informationen genügen, damit der Algorithmus ebenso wie das Kleinkind lernt, was bestimmte Wörter bedeuten? Das testeten die Forschenden, indem sie der KI Aufgaben stellten, die auch bei Kindern verwendet werden, um ihre sprachlichen Fähigkeiten zu erheben. Beispielsweise präsentierten sie vier Bilder, verbunden mit der Frage, welches davon einen Ball zeigt. Und tatsächlich: Bei zahlreichen Wörtern aus der Erfahrungswelt des Kleinkinds wählte die KI zielsicher das richtige Bild aus.

Anzeige

„Unsere Studie zeigt erstmals, dass ein neuronales Netzwerk, das auf den entwicklungsrealistischen Input eines einzelnen Kindes trainiert wurde, lernen kann, Wörter mit ihren visuellen Entsprechungen zu verknüpfen“, sagt Vong. Ähnlich wie kleine Kinder war auch die KI in der Lage, konkrete Beispiele zu generalisieren. Beispielsweise erkannte sie das Bild eines echten Schmetterlings, obwohl sie Schmetterlinge zuvor nur als Zeichnungen in einem Kinderbuch gesehen hatte.

Grundlagen des Spracherwerbs

Aus Sicht der Forschenden können die Ergebnisse dazu beitragen, den Spracherwerb von Kindern besser zu verstehen. „Indem wir KI-Modelle einsetzen, um das reale Sprachenlernen bei Kindern zu untersuchen, leisten wir einen Beitrag zu der klassischen Debatte darüber, welche Zutaten Kinder zum Lernen von Wörtern benötigen – ob beispielsweise angeborenes Wissen erforderlich ist, oder ob assoziatives Lernen genügt“, erklärt Vongs Kollege Brenden Lake. „Unsere Ergebnisse legen nahe, dass man mit assoziativem Lernen mehr erreichen kann als gedacht.“

Einschränkend geben die Forschenden zu bedenken, dass die KI lediglich die Bezeichnungen konkreter Gegenstände gelernt hat, nicht aber weitere Dimensionen von Sprache, etwa Verbindungen zu Überzeugungen und Absichten. Dafür fehlten ihr allerdings auch viele Erfahrungen, die ein Kleinkind natürlicherweise macht – vom Betasten von Gegenständen bis hin zum eigenen Gefühlsleben. „Doch selbst mit diesen Einschränkungen zeigt das Modell, wie fundiertes Wortlernen aus Ausschnitten der Erfahrung eines einzelnen Kindes möglich ist“, schreiben Vong und sein Team.

Quelle: Wai Keen Vong (New York University) et al., Science, doi: 10.1126/science.adi1374

Anzeige
Wissenschaftsjournalist Tim Schröder im Gespräch mit Forscherinnen und Forschern zu Fragen, die uns bewegen:

  • Wie kann die Wissenschaft helfen, die Herausforderungen unserer Zeit zu meistern?
  • Was werden die nächsten großen Innovationen?
  • Was gibt es auf der Erde und im Universum noch zu entdecken?

Hören Sie hier die aktuelle Episode:

Youtube Music
Dossiers
Aktueller Buchtipp

Sonderpublikation in Zusammenarbeit  mit der Baden-Württemberg Stiftung
Jetzt ist morgen
Wie Forscher aus dem Südwesten die digitale Zukunft gestalten

Wissenschaftslexikon

Pol|ling  〈n. 15; IT〉 an mehreren Geräten periodisch durchgeführte Statusabfrage [engl., eigtl. ”Umfrage, Abstimmung“]

Ebay  auch:  eBay®  〈[ib] n.; – od. –s; unz.; meist ohne Artikel; IT〉 weltweit größtes Internetforum für Versteigerungen beliebiger Waren … mehr

Fie|ber|klee  〈m. 6; unz.; Bot.〉 Angehöriger einer Gattung der Enziangewächse, in der nördl. gemäßigten Zone verbreitete Sumpfpflanze, die in den Blättern einen Bitterstoff enthält, der früher als magenstärkendes Mittel u. gegen Wechselfieber (Malaria) gebraucht wurde: Menyanthes; Sy Bitterklee … mehr

» im Lexikon stöbern
Anzeige
Anzeige
Anzeige