Ein KI-Assistent, der alles weiß – zumindest fast
Ein Rechercheprojekt, das sonst Stunden dauert, in wenigen Minuten erledigt – das verspricht OpenAIs neues Programm „DeepResearch“. CEO Sam Altman präsentierte den digitalen Assistenten vergangene Woche in Tokio als „Superkraft“, die komplexe Aufgaben in Wissenschaft, Finanzen und Politik meistern soll. Für viele klang das nach der nächsten großen KI-Revolution.
Erste Tester wie der US-Krebsforscher Derya Unutmaz zeigten sich begeistert: DeepResearch habe Behandlungspläne in Minuten erstellt, für die Ärzte sonst Stunden benötigen. Doch während einige Nutzer das Potenzial feiern, schlagen Kritiker bereits Alarm – und stellen eine Frage in den Raum: Kann man einer KI vertrauen, die an einfachen Fakten scheitert?
Logikfehler und erfundene Quellen: Die Schwachstellen der KI
Gary Marcus, renommierter KI-Kritiker, ließ nicht lange auf sich warten. Sein Vorwurf: DeepResearch sei zwar stark im Sammeln und Organisieren von Wissen, aber anfällig für logische Fehler und Halluzinationen – ein bekanntes Problem vieler Sprachmodelle.
Als Beispiel kursierte eine einfache Aufgabe: Eine Liste aller über 30-jährigen Basketballspieler in der NBA. Das Ergebnis? Nur 60 Prozent korrekt. Die KI nannte Spieler, die längst nicht mehr aktiv sind – oder gar nicht existieren. Für Marcus ein gefährliches Signal: „Betrüger könnten die KI nutzen, um gefälschte Studien zu erstellen oder unseriöse Inhalte zu produzieren.“
Warum OpenAI liefern muss
Hinter den Kulissen steht OpenAI unter massivem Druck. Neue Konkurrenz aus China und den USA, etwa durch das Startup DeepSeek oder die Stanford-Universität, bringt leistungsstarke Modelle auf den Markt – zu einem Bruchteil der Kosten. Stanford benötigte für ein logikfähiges KI-Modell gerade einmal 50 Dollar Rechenzeit.

Für OpenAI, das Milliardeninvestitionen rechtfertigen muss, ist das ein Problem. Die Kooperation mit Softbank und die Präsentation in Tokio kommen nicht von ungefähr: Softbank sucht derzeit nach Investoren für eine neue Finanzierungsrunde, in der „Agentic AI“ – selbstständig handelnde KI-Agenten – als Zukunftsvision verkauft wird.
Google, Salesforce und Co.: Die Konkurrenz schläft nicht
Nicht nur OpenAI arbeitet an solchen Systemen. Auch Google hat mit seinem Gemini-Programm eine Deep-Research-Funktion im Angebot, die ähnliche Fähigkeiten – und ähnliche Fehler – zeigt. Unternehmen wie Salesforce setzen bereits auf KI-Agenten im Kundenservice, um repetitive Aufgaben zu automatisieren und Fachkräfte zu entlasten.
In Deutschland nutzt etwa der Chemiegroßhändler Brenntag solche Agenten, um Lieferzeitenanfragen automatisiert zu beantworten. Für viele Unternehmen wird die KI daher nicht nur zu einem Produktivitätstool, sondern auch zu einer Antwort auf den Fachkräftemangel.
Das könnte Sie auch interessieren:
