Apples KI-Bildbearbeitungsmodell ist angekommen, obwohl es noch lange kein fertiges Produkt ist. MGIE, die Abkürzung für Multimodal Large Language Model-Driven Image Editing, ist derzeit auf GitHub verfügbar, und es gibt ein PDF-Projektdokument mit Anweisungen.
Die Vorlage verwendet Textanweisungen zum Ändern und Bearbeiten von Bildern. Es kann einfache Bildbearbeitungsaufgaben wie das Erhöhen des Kontrasts oder der Helligkeit und das Ändern des Weißabgleichs ausführen. Es kann aber auch versucht werden, komplexere Vorschläge zu interpretieren, etwa Pizza durch das Hinzufügen von Gemüsebelag gesünder zu machen.
Die Vorlage kann außerdem zuschneiden und in der Größe ändern, Bildränder automatisch füllen, Haare, Augen und Kleidung des Motivs ändern und Objekte entfernen.
MGIE ist nur der erste Schritt auf dem Weg von Apple zur generativen KI. Es ist unwahrscheinlich, dass es auf einem der aktuellen Apple-Geräte erscheint, aber es ist wahrscheinlich ein Zeichen für die Zukunft.
Starten Sie einen neuen Thread