OpenAI stellt GPT-4o vor: Eine neue Ära sprachverarbeitender KI-Modelle

Kategorien:
No items found.
Freigegeben:
June 26, 2024

OpenAI, das Unternehmen hinter innovativen KI-Modellen wie ChatGPT, hat erneut für Schlagzeilen gesorgt. Mit der Einführung von GPT-4o präsentiert die KI-Forschungseinrichtung eine Weiterentwicklung ihrer sprachverarbeitenden Algorithmen. Dieses Modell soll nicht nur schneller als seine Vorgänger sein, sondern auch in der Lage, auf eine Weise zu interagieren, die von den Nutzern als "gesprächig" und manchmal sogar "kokett" wahrgenommen werden kann.

GPT-4o ist die neueste Inkarnation des KI-Modells, das die Grundlage für den Chatbot ChatGPT bildet. Es wird allen Nutzern von ChatGPT zur Verfügung gestellt, einschließlich derjenigen, die keine Abonnenten sind. Neben der verbesserten Geschwindigkeit zeichnet sich die neue Version durch die Fähigkeit aus, Bilder zu lesen und zu diskutieren, Sprachen zu übersetzen und Emotionen aus visuellen Ausdrücken zu erkennen. Zudem verfügt sie über ein Gedächtnis, das es ihr ermöglicht, sich an vorangegangene Eingabeaufforderungen zu erinnern.

Während einer Live-Demonstration mit der Sprachversion von GPT-4o bot das Modell hilfreiche Anregungen, wie man eine einfache Gleichung, die auf einem Stück Papier geschrieben stand, lösen könnte – es löste die Gleichung nicht einfach, sondern führte durch den Prozess. Darüber hinaus übersetzte es etwas Programmcode, wechselte zwischen Italienisch und Englisch und interpretierte die Emotionen in einem Selfie eines lächelnden Mannes.

Die Verwendung einer warmen amerikanischen Frauenstimme gab der Interaktion eine persönliche Note. Wurde das Modell gelobt, reagierte es mit: „Hör auf, du bringst mich zum Erröten!“. Trotz dieser Fortschritte waren nicht alle Ergebnisse perfekt. Es gab Momente, in denen GPT-4o den lächelnden Mann für eine hölzerne Oberfläche hielt oder eine Gleichung zu lösen begann, die es noch nicht gezeigt bekommen hatte. Dies zeigte, dass es noch einiges zu tun gibt, bevor die Fehler und Halluzinationen, die Chatbots unzuverlässig und potenziell unsicher machen, ausgemerzt sind.

Diese Weiterentwicklung zeigt dennoch deutlich die Richtung, in die OpenAI mit GPT-4o gehen möchte. Die Vision ist, dass es zur nächsten Generation digitaler KI-Assistenten wird – eine Art Turbo-Siri oder Hey Google, das sich an frühere Aussagen erinnert und über Sprache oder Text hinaus interagieren kann.

Die Umweltbilanz dieser Technologie wurde während der Präsentation nicht angesprochen. KI ist energieintensiver als traditionelle Computeraufgaben, und je ausgefeilter sie wird, desto mehr Rechenleistung ist erforderlich.

GPT-4o wurde in der OpenAI-Demo als "magisch" beschrieben, wobei betont wurde, dass dieses "Mystische" mit der Markteinführung des Produkts beseitigt werden soll. Es ist wichtig zu betonen, dass diese Technologie, obwohl sie immer ausgefeilter und überzeugender als Begleiter wird, weder fühlend noch magisch ist. Sie basiert auf komplexer Programmierung und maschinellem Lernen.

Es gab Gerüchte über eine Partnerschaft zwischen OpenAI und Apple, die jedoch noch nicht bestätigt wurden. Bemerkenswert war jedoch, dass während der Präsentation Apple-Produkte verwendet wurden.

Der Zeitpunkt der Ankündigung erscheint als strategischer Schachzug, da sie nur 24 Stunden vor der jährlichen Google-Entwicklerkonferenz stattfand, auf der erwartet wird, dass Google seine eigenen neuen KI-Entwicklungen vorstellt.

Dieses neue Modell zeigt einmal mehr, wie KI im Begriff ist, sich weiter in unseren Alltag zu integrieren, und es wird spannend sein zu beobachten, wie GPT-4o im großen Maßstab mit den Millionen von Menschen umgeht, die bereits ChatGPT nutzen, wenn es ausgerollt wird.

Quellen:
- BBC News. (2024). New version of Chat-GPT can teach maths and flirt.
- OpenAI. GPT-4 Research.
- Yahoo Finance. (2024). OpenAI unveils ChatGPT-4o model with real-time speech and vision reasoning.
- XDA Developers. (2024). OpenAI GPT-4o Spring update announcement.
- Bloomberg. (2024). OpenAI launches faster and cheaper AI model with GPT-4o.
- TikTok. (2024). Video by Kyle Balmer on OpenAI's GPT-4o.
- Wikipedia. Google DeepMind.
- MIT Technology Review. (2023). Unpacking the hype around OpenAI’s rumored new Q* model.

Was bedeutet das?
No items found.