Die aktuellen KI basieren fast alle auf sogenannten tiefen neuronalen Netzen. Das gilt sowohl für LLMs als auch für Diffusionsmodelle, wie sie für die Bild- und Videogenerierung verwendet werden. LLMs bilden diese tiefen neuronalen Netzwerke mit Wörtern und anderen Bausteinen von Sprache. Bildgenerierungsmodelle arbeiten mit Teilen von Bildern oder grundlegenden Bildmustern. Modelle zur Videogenerierung nutzen zudem die Beziehungen zwischen Bildern.





