von THOMAS BRANDSTETTER
Aus welchen Dörfern besteht Söhrewald? Wer nicht gerade selbst in der 4.500-Seelen-Gemeinde südöstlich von Kassel lebt, wird die Antwort (Eiterhagen, Wattenbach und Wellerode) wohl in Wikipedia nachschlagen müssen. Oder er fragt „LläMmlein“ – das erste ausschließlich mit deutschen Texten trainierte KI-Sprachmodell. Denn während lokale Details wie dieses in den neuronalen Netzen seiner großen Brüder von Google, OpenAI und Co. notorisch unterrepräsentiert sind, ist LläMmlein gewissermaßen ein Einheimischer, der im Verlauf seines Trainings bereits 37.120-mal von Söhrewald erfahren hat. Ähnliches gilt auch für weniger greifbare Dinge wie kulturelle Prägungen und Weltanschauungen. Auch sie werden von den Sprachmodellen über die Trainingstexte aufgenommen und verinnerlicht und spiegeln sich auf subtile Weise in ihren Antworten wider.





