20. Dezember, 2024

Technologie

Herausforderungen für Nvidia: Verzögerungen bei den neuen Blackwell-Servern

Herausforderungen für Nvidia: Verzögerungen bei den neuen Blackwell-Servern

Nvidia sieht sich möglicherweise mit einer Verschiebung bei der Einführung seiner nächsten Generation von KI-Servern, basierend auf den B200- und GB200-Plattformen, konfrontiert. Laut einem Bericht von TrendForce sind Überhitzung, hoher Stromverbrauch und die Notwendigkeit der Optimierung von Verbindungen die Hauptgründe für mögliche Verzögerungen. Die Marktforschungsfirma prognostiziert, dass die Massenproduktion und der Höhepunkt der Auslieferungen der Blackwell-Maschinen erst Mitte 2025 erreicht werden könnten, was eine fast halbjährliche Verzögerung bedeuten würde. Nvidia hat sich dazu bisher nicht geäußert.

Es wird erwartet, dass Nvidia und seine Partner im Jahr 2024 nur begrenzte Mengen an Blackwell-basierten Servern liefern können. Das Unternehmen wird gezwungen sein, seine wenig ertragreichen B200-Chips für diese Server zu verwenden. Dennoch hat Dell bereits begonnen, Blackwell-Server-Racks auszuliefern. Inzwischen sind verfeinerte Versionen von Nvidias B200-Prozessoren seit Oktober in der Massenproduktion, was bedeutet, dass sie im Januar bei Nvidia ankommen werden. Trotz dieser Fortschritte geht TrendForce jedoch nicht davon aus, dass die Nachfrage nach Blackwell-basierten Servern sofort in die Höhe schnellen wird. Der Markt sieht die Massenproduktion und Spitzenlieferungen erst im Zeitraum zwischen dem zweiten und dritten Quartal 2025.

Vor kurzem wurde berichtet, dass ein Nvidia NVL72 Rack mit 72 B200-GPUs auf der GB200-Plattform einen Stromverbrauch von 120 kW hatte, was deutlich über den aktuellen Werten für KI-Server-Racks liegt. TrendForce behauptet nun, dass Nvidia die Spezifikationen des Geräts aktualisiert hat und es jetzt 140 kW verbraucht — mehr, als typische Rechenzentren einem einzelnen Rack zur Verfügung stellen können.

Diese Herausforderungen zwingen Nvidia, das Design seiner Server-Racks aufgrund von Überhitzungsrisiken mehrfach zu überarbeiten. Die gestiegene Leistungsaufnahme erfordert eine zusätzliche Kühlung. Flüssigkeitskühlung ist für Blackwell-Server unerlässlich, aber moderne Kühlverteileinheiten (CDUs) können derzeit nur 60 kW bis 80 kW thermische Leistung bewältigen. Hersteller von Kühlsystemen arbeiten daran, die Kapazität der CDUs zu erhöhen. TrendForce erwartet, dass die Leistungsfähigkeit von Flüssig-Flüssig-In-Row-CDUs 1,3 Megawatt übersteigen könnte, sodass übermäßige Wärmeabfuhr künftig kein großes Problem mehr darstellen dürfte.