Am Montag hat OpenAI, die führende KI-Forschungsorganisation mit Sitz in San Francisco, eine bahnbrechende Entwicklung in der Welt der künstlichen Intelligenz vorgestellt: GPT-4o. Das "o" steht für "omni", was die vielseitigen Fähigkeiten dieses neuen Modells in den Bereichen Text, Sprache und Video unterstreicht.
GPT-4o repräsentiert einen signifikanten Fortschritt gegenüber seinem Vorgänger GPT-4 Turbo und wird in den kommenden Wochen schrittweise in Entwickler- und Endkundenprodukte integriert.
Technologische Weiterentwicklungen, die den Markt verändern könnten
Laut Mira Murati, CTO von OpenAI, bietet GPT-4o die Intelligenz des GPT-4, jedoch mit erweiterten Fähigkeiten über verschiedene Medien hinweg.
„GPT-4o denkt über Text und Vision hinaus und ermöglicht eine neue Ebene der Interaktion zwischen Mensch und Maschine“, erklärte Murati bei der Präsentation in den OpenAI-Büros.
Dieses Modell kann nicht nur in Echtzeit auf gesprochene Sprache reagieren, sondern auch Emotionen in der Stimme erkennen und entsprechend reagieren, was die Türen für revolutionäre Anwendungen öffnet.
Erweiterungen und Verbesserungen im Nutzererlebnis
Eine der beeindruckendsten Neuerungen von GPT-4o ist die verbesserte Interaktion mit Benutzern durch ChatGPT. Nutzer können nun mitten in der Antwort von ChatGPT eingreifen, wobei das Modell in Echtzeit reagiert.
Diese Funktionen sind nicht nur auf Text beschränkt- GPT-4o kann auch visuelle Daten verarbeiten und darauf reagieren. Es kann Fragen zu Bildern beantworten und sogar Live-Events "sehen" und erläutern.
Mehrsprachigkeit und Effizienzsteigerungen
GPT-4o zeigt in etwa 50 Sprachen verbesserte Leistungen und ist in der OpenAI-API sowie im Azure OpenAI Service von Microsoft verfügbar. Es bietet die doppelte Geschwindigkeit und kostet nur die Hälfte im Vergleich zu GPT-4 Turbo, was es für Entwickler und Endbenutzer attraktiver macht.
Schrittweise Einführung und zukünftige Pläne
Die vollständigen Sprachfunktionen von GPT-4o sind zunächst nur einer ausgewählten Gruppe von Partnern zugänglich, bevor sie weiter verbreitet werden.
Für Endnutzer ist GPT-4o ab heute in der kostenlosen Version von ChatGPT verfügbar, mit verbesserten Nachrichtenlimits für Abonnenten der Premium-Pläne. Darüber hinaus plant OpenAI, die verbesserte Spracherfahrung in einer Alpha-Version für Plus-Nutzer in den nächsten Monaten bereitzustellen.
Ausblick und Potenzial
Mit GPT-4o könnte OpenAI die Art und Weise, wie wir mit Maschinen interagieren, grundlegend verändern. Die Fähigkeit, über mehrere Kanäle hinweg zu kommunizieren und zu verstehen, macht GPT-4o zu einem der fortschrittlichsten KI-Modelle auf dem Markt.