Als ChatGPT im November 2022 vorgestellt wurde, sprachen viele vom „iPhone-Moment der KI“. Das war ein Missverständnis. Der wahre „iPhone-Moment“ könnte vielmehr ein neues iPhone sein – ein Gerät, das nahtlos KI-Funktionen integriert. Ein „aiPhone“ also.

Unmittelbar vor Apples Worldwide Developer Conference (WWDC) deuten starke Anzeichen in diese Richtung: die kolportierte Partnerschaft von Apple und OpenAI, die angebliche gemeinsame Entwicklung eines Chatbots – und das kürzlich vorgestellte ChatGPT 4o. Das neue Modell von OpenAI scheint geradezu für das iPhone entwickelt worden zu sein. ChatGPT 4o – das kleine „o“ steht für das lateinische omni, also alles – ist „multimodal“ und kann Text, Bilder und Audio gleichzeitig verarbeiten.

Was das bedeutet, kann jetzt jeder ausprobieren, der sich die App auf sein Smartphone lädt – und das auch noch kostenlos. ChatGPT 4o erkennt zum Beispiel, was auf Fotos zu sehen ist. Man kann sich mit dem Bot per Sprache unterhalten, gesprochene Sprache in Echtzeit übersetzen lassen und vieles mehr. Das klingt zunächst nach einem netten Smartphone-Gimmick. Doch die Multimodalität macht ChatGPT 4o zu einem echten Gamechanger. Revolutionär ist die Verbindung mit der realen Welt über das Smartphone, das für viele ohnehin schon als erweitertes Ich fungiert. Es ist eine Sache, vor dem Computer zu sitzen und Textprompts für ChatGPT einzugeben. Es ist etwas ganz anderes, den Chatbot auf dem Handy überall dabeizuhaben und mit der Welt zu interagieren. Die Anwendungsmöglichkeiten reichen von der Hilfe in Alltags- situationen („Was ist das und wie funktioniert es?“) bis hin zu Bildung und Lernen („Hier ist ein Mathebeispiel. Bitte sag mir die Lösung.“). Künftig könnten auch Handwerker, die bei einem Problem nicht mehr weiterwissen, ihren KI-Assistenten auf dem Handy nach einer Lösung fragen. Ich selbst zeigte ChatGPT 4o zum Beispiel eine aufgeschlagene Seite aus Martin Heideggers „Sein und Zeit“, ohne weitere Informationen. Die KI erkannte den Text nicht nur sofort, sondern lieferte auch gleich eine Zusammenfassung. Oder ich unterhielt mich mit dem Chatbot über die Bedeutung einer Heiligenstatue auf einer Brücke, die ich fotografiert hatte. Und der naturliebende Lebensgefährte meiner Mutter staunte, was ihm ChatGPT 4o alles über seine Gartenpflanzen erzählen konnte.

Künstliche Intelligenz wird sich nicht durchsetzen, nur weil sie klüger ist als wir.

ChatGPT 4o bringt KI in den Alltag der Menschen. Das ist ein großer Schritt für jede neue Technologie. Nicht die technische Leistung allein entscheidet über den Erfolg. Es ist die Kombination aus praktischem Nutzen und einfacher, intuitiver Bedienbarkeit – plus einem magischen Faktor, nennen wir ihn „sexyness“. Kein Unternehmen hat das über viele Jahre so gut verstanden wie Apple. Smartphones gab es schon lange vor dem iPhone. Aber erst das Gerät von Apple brachte den Durchbruch. Der intuitive Touchscreen, das minimalistische Design, die Apps – plötzlich gab es ein Smartphone, das jeder haben wollte. Künstliche Intelligenz wird sich nicht durchsetzen, nur weil sie klüger ist als wir. Ihr langfristiger Erfolg hängt wesentlich davon ab, was wir Menschen damit anfangen können und ob wir die Technik wirklich mögen. Genau deshalb versuchen die Entwickler, die KI-Modelle selbst immer menschenähnlicher zu machen – bis hin zu der Stimme, mit der ChatGPT 4o zu uns spricht. Man kann sich zu Recht darüber empören, dass OpenAI möglicherweise die Stimme von Scarlett Johansson geklaut hat. Aber entscheidend ist etwas anderes. Die amerikanischen Tech-Giganten tun alles, um die Technologie so nahtlos wie möglich in unser Leben zu integrieren. Wir sollen eine emotionale Beziehung zu unseren Chatbots aufbauen. Was bislang fehlt, ist ein begehrenswertes Stück Hardware. Das „aiPhone“ wäre daher der nächste logische Schritt. Wenn KI zum Lifestyle wird, zum ständigen Begleiter, dann hat sie gewonnen. Aber die Entwicklung birgt auch Gefahren.

Die Algorithmen der Social-Media-Plattformen haben die Nutzer schon heute im Griff. Eine nahtlose Integration von KI ins Smartphone könnte unter anderem dazu führen, dass wir bald nicht mehr wissen, ob wir es auf Facebook, TikTok & Co. überhaupt noch mit echten Menschen zu tun haben. Es könnte ganz normal werden, dass nur noch unsere Chatbots miteinander kommunizieren, wie in einer Demo von OpenAI. Und das womöglich in einer Sprache, die wir gar nicht verstehen.