In einem brisanten Rechtsstreit zwischen OpenAI und den Verlagen The New York Times und Daily News kam es zu einer unerwarteten Wendung: Angeblich versehentlich durch OpenAI gelöschte Daten könnten den Prozess verkomplizieren. Die Verlage werfen OpenAI vor, unerlaubt auf ihre Inhalte zugegriffen zu haben, um die KI-Modelle des Unternehmens zu trainieren.
Im Rahmen des Verfahrens hatte OpenAI zugestimmt, zwei virtuelle Maschinen bereitzustellen, auf denen die Anwälte der Verlage nach deren urheberrechtlich geschütztem Material suchen konnten. Doch am 14. November wurde eine der Maschinen gelöscht, was zu einem Verlust wertvoller Suchdaten führte, wie aus einem Schreiben an das zuständige Gericht in New York hervorgeht.
OpenAI bemühte sich zwar um die Wiederherstellung der Daten und hatte dabei größtenteils Erfolg, jedoch gingen die Ordnerstruktur und Dateinamen unwiederbringlich verloren. Diese Informationen wären notwendig gewesen, um nachvollziehen zu können, wo die Artikel in den KI-Modellen verwendet wurden, was die Wiederholungsarbeit der Verlage nötig macht.
Interessanterweise vermuten die Verlage kein absichtliches Vorgehen seitens OpenAI. Dennoch betonen sie, dass OpenAI selbst in der besten Lage sei, seine Datenbestände auf mögliche Urheberrechtsverletzungen zu durchsuchen.
Eine Stellungnahme seitens OpenAI blieb aus, jedoch reagierten deren Anwälte am Freitag auf die Vorwürfe. Sie wiesen die Schuld von sich und machten vielmehr Konfigurationsänderungen, die auf Wunsch der Kläger vorgenommen wurden, für das Malheur verantwortlich. Der fragliche Datenträger sei ohnehin nur als temporärer Zwischenspeicher gedacht gewesen, sodass keine Dateien tatsächlich verloren gegangen seien.