Bei Google hat man es geschafft der KI zeichnen bei zu bringen oder zumindest zu zeigen, wie man kleine Doodles malt. Microsoft hat das nun perfektioniert und eine AI erstellt, welche anhand von kurzen Text-Beschreibungen eine richtige Zeichnung erschaffen kann. Beispielsweise zeichnete die AI mit der Beschreibung „gelber Vogel mit schwarzen Flügeln und kurzem Schnabel“ folgendes Bild:
Dies sieht einem echten Vogel schon wirklich ähnlich aus. Man könnte meinen, dass die AI einfach nach einem Bild gesucht hat und dieses verfremdet. Jedoch meinte der führende Forscher Xiaodong He, dass die Bilder Pixel-by-Pixel von der Maschine erstellt wurden und auf keinem anderen Bild basieren. Persönlich kann ich mir zwar nicht vorstellen, wie dies ohne Referenzen funktionieren soll, aber ich hab auch keine Ahnung. :D
Spannend wird es, wie sich die Technologie entwickelt. Schließlich könnte man so ganze Animationsfilme entstehen lassen. Dies stellt sich auch Forscher He vor. Ebenso wären aber auch digitale Zeichenassistenten möglich, welche zum Beispiel Künstlern oder Innendesignern weiterhelfen könnten.
Das Team um He begann seine Forschungen im Bereich der Computer-Vision und der Verarbeitung natürlicher Sprache mit dem CaptionBot, einem KI-System, das automatisch Bildunterschriften für Fotos schreibt. Anschließend arbeitete man an der SeeingAI, welche Dinge auf Bildern erkennt und aktuell blinden menschen beim navigieren in der Welt helfen soll. Darauf basierend arbeitet ein System aus zwei Teilen. Einem, der das Bild erzeugt – Generative Adversarial Network (GAN) -, und einem, der das Bild bewertet.
Die eingegeben Beschreibungen werden anhand künstlicher Aufmerksamkeit eingelesen. Dazu orientierte man sich am Menschen, welcher komplexe Beschreibungen meistens in Wortpaaren wahrnimmt. Quasi eine mathematische Umsetzung findet nun ihren Einsatz. Persönlich bin ich echt überrascht, woran die Forscher alles gedacht haben, um ein System zu erstellen, welches in der Zukunft vielleicht unser Leben verändern könnte.
Via: Engadget
Ist ja wie Wordeye
gepostet mit der Deskmodder.de-App
Ja, das ist schon große Klasse.
Was ich aber bei fast allen Medien zu dieser Meldung zu bemängeln habe, ist die fast schon unfassbare Recherchefaulheit der jeweiligen Redakteure! ÜBERALL das gleiche Beispielbild. Kaum einer, der mehr als nur eigene Spekulationen angibt, oder ein paar andere Beispiele präsentiert, von den technischen Hintergründen ganz zu schweigen.
Das kostet übrigens keine 60 Sekunden, sich über ein paar Links auf die Quelle durchzuhangeln: https://arxiv.org/pdf/1711.10485.pdf Ein paar Seiten nach unten scrollen und man kann sich an noch einigen weiteren Beispielen ergötzen.