Also so ein Bildgenerator funtkioniert vereinfacht gesagt so:
Erstmal wurde die KI auf Sprache trainiert. Das heisst, es wurde eine (algebraische) Matrix so lange optimiert, bis eine schriftlich Eingabe, eine mehr oder weniger sinnvolle schriftliche Antwort erzeugt hat. Also in der Matrix sind halt sozusagen statistische Zusammenhänge zwischen Begriffen gespeichert.
Dann wurde eine andere KI darauf trainiert bestimmte Bilder zu erkennen, z.B. Autos oder Hamburger oder sowas. Das kanm man machen indem man der KI unzählige Bilder mit Bildbeschriftungen gibt, aus denen dann wieder statistische Zusammenhänge in einer (algebraischen) Matrix abgelegt werden.
Jetzt kann man diese beiden KI dann auch verknüpfen und dann mittels Deep learning (also selbstständigem Training und selbststädiger Verknüpfung vo Zusammenhängen) zusammenführen.
So erkennt die KI dann halt Worte und die dazugehörigen Bilder und baut daraus dann eben neue Bilder.
So in etwa kann man es sich vorstellen. Ich weiss nicht ob das verständlich war?